Enfoque teórico para la sumarización de artículos científicos mediante modelos largos de lenguaje

ISBN

Formato digital
979-13-87837-78-5

Fecha de publicación

12-11-2025

Licencia

D. R. © copyright 2025. Mónica Muñoz, Alejandra Romero y Nydia Olvera.

Todos los contenidos de esta obra se comparten bajo la licencia Creative Commons Atri-bución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0). Esto implica que no está autorizado el uso comercial de la obra original ni de las eventuales obras derivadas, las cuales deberán distribuirse bajo la misma licencia que rige la obra original. No obstante, se permite a terceros compartir el contenido siempre y cuando se reconozca debidamente la autoría y la publicación original en esta editorial.

Giovanna Inosuli Campos Flores
Unidad Profesional Interdisciplinaria de Ingeniería Campus Zacatecas IPN.
0009-0006-8294-1083
Yavé Emmanuel Vargas Márquez
Unidad Profesional Interdisciplinaria de Ingeniería Campus Zacatecas IPN.
0009-0007-0157-6668

Acerca de

En la actualidad existe una amplia cantidad de información científica disponible diversa y de múltiples disciplinas que presentan un desafío significativo al momento de encontrar una información adecuada y útil para los investigadores, académicos y hasta estudiantes. El uso de los modelos largos de lenguajes ha demostrado ser de gran utilidad al momento de la abstracción de información haciendo un recurso sencillo y accesible a la disponibilidad de profesionales y estudiantes, aunque estos modelos están limitados para realizar la extracción de la información esencial para la lectura y comprensión de los artículos científicos debido a la complejidad del lenguaje, a diferentes formatos y ambigüedad que poseen dichos textos. En este proyecto se busca desarrollar una herramienta de sumarización automática con una interfaz web utilizando modelos largos de lenguaje, como: GPT (Generative Pre-trained Transformer) y BERT (Bidirectional Encoder Representations from Transformers), esos son modelos entrenados para comprender y generar texto de manera coherente y contextual, que lo hacen ideales para procesar la complejidad de la información del lenguaje científico, esto con el fin de generar resúmenes coherentes y precisos que capturen la esencia y los principales hallazgos de los documentos originales.

Referencias

Beltrán Beltrán, N. C., & Rodríguez Mojica, E. C. (2021). Procesamiento del lenguaje natural (PLN) – GPT-3.: Aplicación en la Ingeniería de Software. Tecnol. Investig. Academia TIA, 8(1), 18-37.
Briones Viqueira, J. (2023). Construcción de un modelo de predicción para activos financieros. Creación de una red neuronal recurrente LSTM con machine learning. Universidade da Coruña. Facultade de Economía e Empresa. doi:http://hdl.handle.net/2183/36522
Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., . . . Child, R. (2020). Language Models are Few-Shot Learners. arXiv. doi:10.48550/ARXIV.2005.14165
Chintagunta, B., Katariya, N., Amatriain, X., & Kannan, A. (2021). Medically Aware GPT-3 as a Data Generator for Medical Dialogue Summarization. Machine Learning for Healthcare Conference, 354-372.
Devlin, J., & Chang, M.-W. (2 de Noviembre de 2018). Open Sourcing BERT: State-of-the-Art Pretraining for Natural Language Processing. (Google AI Blog) Recuperado el Diciembre de 2024, de https://goo.su/DMgmy
E. J. L. Gómez, M. E. (2011). Fenómenos lingüísticos frecuentes que dificultan la calidad de los textos científicos escritos por profesionales. Edumecentro, 3(1), 73–81.
Gururangan, S., Marasovic, A., Swayamdipta, S., Lo, K., Iz, B., Downey, D., & Smith, N. (2020). Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks. arXiv. doi:arXiv:2004.10964

Carrito de compra