Enfoque teórico para la sumarización de artículos científicos mediante modelos largos de lenguaje

ISBN

Formato digital
979-13-87837-78-5

Fecha de publicación

12-11-2025

Licencia

Todos los contenidos de esta obra se comparten bajo la licencia Creative Commons Atri-bución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0). Esto implica que no está autorizado el uso comercial de la obra original ni de las eventuales obras derivadas, las cuales deberán distribuirse bajo la misma licencia que rige la obra original. No obstante, se permite a terceros compartir el contenido siempre y cuando se reconozca debidamente la autoría y la publicación original en esta editorial.

PDF

Volver

Giovanna Inosuli Campos Flores
Unidad Profesional Interdisciplinaria de Ingeniería Campus Zacatecas IPN.
0009-0006-8294-1083
Yavé Emmanuel Vargas Márquez
Unidad Profesional Interdisciplinaria de Ingeniería Campus Zacatecas IPN.
0009-0007-0157-6668

Acerca de

En la actualidad existe una amplia cantidad de información científica disponible diversa y de múltiples disciplinas que presentan un desafío significativo al momento de encontrar una información adecuada y útil para los investigadores, académicos y hasta estudiantes. El uso de los modelos largos de lenguajes ha demostrado ser de gran utilidad al momento de la abstracción de información haciendo un recurso sencillo y accesible a la disponibilidad de profesionales y estudiantes, aunque estos modelos están limitados para realizar la extracción de la información esencial para la lectura y comprensión de los artículos científicos debido a la complejidad del lenguaje, a diferentes formatos y ambigüedad que poseen dichos textos. En este proyecto se busca desarrollar una herramienta de sumarización automática con una interfaz web utilizando modelos largos de lenguaje, como: GPT (Generative Pre-trained Transformer) y BERT (Bidirectional Encoder Representations from Transformers), esos son modelos entrenados para comprender y generar texto de manera coherente y contextual, que lo hacen ideales para procesar la complejidad de la información del lenguaje científico, esto con el fin de generar resúmenes coherentes y precisos que capturen la esencia y los principales hallazgos de los documentos originales.

Referencias

Beltrán Beltrán, N. C., & Rodríguez Mojica, E. C. (2021). Procesamiento del lenguaje natural (PLN) – GPT-3.: Aplicación en la Ingeniería de Software. Tecnol. Investig. Academia TIA, 8(1), 18-37.
Briones Viqueira, J. (2023). Construcción de un modelo de predicción para activos financieros. Creación de una red neuronal recurrente LSTM con machine learning. Universidade da Coruña. Facultade de Economía e Empresa. doi:http://hdl.handle.net/2183/36522
Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., . . . Child, R. (2020). Language Models are Few-Shot Learners. arXiv. doi:10.48550/ARXIV.2005.14165
Chintagunta, B., Katariya, N., Amatriain, X., & Kannan, A. (2021). Medically Aware GPT-3 as a Data Generator for Medical Dialogue Summarization. Machine Learning for Healthcare Conference, 354-372.
Devlin, J., & Chang, M.-W. (2 de Noviembre de 2018). Open Sourcing BERT: State-of-the-Art Pretraining for Natural Language Processing. (Google AI Blog) Recuperado el Diciembre de 2024, de https://goo.su/DMgmy
E. J. L. Gómez, M. E. (2011). Fenómenos lingüísticos frecuentes que dificultan la calidad de los textos científicos escritos por profesionales. Edumecentro, 3(1), 73–81.
Gururangan, S., Marasovic, A., Swayamdipta, S., Lo, K., Iz, B., Downey, D., & Smith, N. (2020). Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks. arXiv. doi:arXiv:2004.10964

Ver más…

HaCohen-Kerner, Y., Miller, D., & Yigal, Y. (2020). The influence of preprocessing on text classification using a bag-of-words representation. PLOS ONE, 15. doi:10.1371/journal.pone.0232525
Larsen, P., & von Ins, M. (2010). The rate of growth in scientific publication and the decline in coverage provided by Science Citation Index. Scientometrics, 84, 575-603. doi:http://dx.doi.org/10.1007/s11192-010-0202-z
Ma, L. (2018). Segmentación automática de palabras en chino. Madrid: UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE FILOLOGÍA.
Nasimba Tipan, A. (2023). «Attention is all you need». Arquitectura Transformers: descripción y aplicaciones. UNIVERSIDAD MIGUEL HERNÁNDEZ DE ELCHE.
Naveed, H., Khan, A. U., Qiu, S., Saqib, M., Anwar, S., Usman, M., . . . Mian, A. (2024). A Comprehensive Overview of Large Language Models. arXiv. doi:10.48550/arxiv.2307.06435
Ng, J.-P., & Abrecht, V. (2015). Better summarization evaluation with word embeddings for ROUGE. arXiv [cs.CL]. Obtenido de http://arxiv.org/abs/1508.06034https://arxiv.org/abs/1508.06034
Parra-Medina, L. E.-C. (2021). Síndrome de la sobrecarga informativa: una revisión bibliográfica. Rev Neurol, 73(12), 421-428.
Peng, B., Li, C., He, P., Galley, M., & Gao, J. (2023). Instruction Tuning with GPT-4. arXiv. doi:10.48550/ARXIV.2304.03277
Ramírez , U. B. (2020). Método para la generación automática de resúmenes personalizados de textos en español. Tecnológico Nacional de México.
Talamé, L., Cardoso, A. C., & Amor, M. (2019). Comparación de herramientas de procesamiento de textos en español extraídos de una red social para Python.
Vajjala, S., Majumder, B., Gupta, A., & Surana, H. (2020). Practical Natural Language Processing: A Comprehensive Guide to Building Real-World NLP Systems. O’Reilly Media.
Wang, H., Li, J., Wu, H., Hovy, E., & Sun, Y. (2023). Pre-Trained Language Models and Their Applications. Engineering, 25, 51-65. doi:10.1016/j.eng.2022.04.024

Ver menos.