Use el DOI o este identificador para enlazar este recurso: https://ru.iibi.unam.mx/jspui/handle/IIBI_UNAM/374
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorPolo Bautista, Luis Roberto-
dc.contributor.authorMartínez Acevedo, Karen Vanessa-
dc.coverage.spatialMX-
dc.date.accessioned2022-07-26T15:29:35Z-
dc.date.available2022-07-26T15:29:35Z-
dc.date.issued2021-
dc.identifier.urihttps://ru.iibi.unam.mx/jspui/handle/IIBI_UNAM/374-
dc.language.isoesen_US
dc.publisherUniversidad Nacional Autónoma de México. Instituto de Investigaciones Bibliotecológicas y de la Informaciónen_US
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0-
dc.subjectAsignación Latente de Dirichleten_US
dc.subjectAlgoritmosen_US
dc.subjectAnálisis temáticoen_US
dc.subjectDocumentos digitalesen_US
dc.subject.classificationHumanidades y Ciencias de la Conducta-
dc.titleAlgoritmo para el análisis temático de documentos digitalesen_US
dc.title.alternativeAlgorithm for thematic analysis of digital documentsen_US
dc.typepublishedVersion-
dc.typeArtículo-
dcterms.bibliographicCitationInvestigación Bibliotecológica: archivonomía, bibliotecología e información (2448-8321) vol. 35(89), 13-31 (2021).-
dcterms.creatorPolo Bautista, Luis Roberto::orcid::0000-0002-0421-1126-
dcterms.creatorMartínez Acevedo, Karen Vanessa::orcid::0000-0002-2595-149X-
dc.identifier.doi10.22201/iibi.24488321xe.2021.89.58419-
dc.description.resumenEl objetivo del artículo es presentar un algoritmo para asignar áreas temáticas a documentos digitales que sirva como herramienta de apoyo al análisis temático dentro de la organización de la información, con el fin de ser implementado en el desarrollo de vocabularios controlados. La metodología utilizada consistió en aplicar el Reconocimiento Óptico de Caracteres (ROC) y la Asignación Latente de Dirichlet (ALD) como las principales herramientas para el desarrollo de un algoritmo basado en el lenguaje de programación Python, que permite la lectura de archivos con extensión PDF para la obtención de los principales temas del corpus textual. Los resultados de la aplicación del algoritmo demuestran su utilidad en el área de la indización como un sistema para identificar y extraer temas relevantes de un documento específico en formato electrónico, permitiendo la automatización de procesos por parte del profesional de la información. De esta forma, se concluye su uso como desarrollo de puntos de acceso alternativos en función del contenido de los textos.-
dc.relation.ispartofjournalhttp://rev-ib.unam.mx/ib/index.php/ib/issue/view/4484/showToc-
Aparece en las colecciones: Artículos

Texto completo:
Archivo Descripción Tamaño Formato  
58419-176701-3-PB.pdf752.96 kBAdobe PDFVisualizar/Abrir


Este recurso está sujeto a una Licencia Creative Commons Creative Commons