Cargando…

Automatic classification experience of documents about Life Sciences and Biomedicine obtained in the Web of Science

This article provides an experience in the development and proof of a classification algorithm that automatically assigns a theme to a document. The Naïve Bayes Multinomial classification was used to automatically analyze the correlation between the themes of research in Life Sciences and Biomedicin...

Descripción completa

Detalles Bibliográficos
Autores principales: Polo Bautista, Luis Roberto, Polo Bautista, Israel
Formato: Online Artículo
Lenguaje:spa
Publicado: Instituto de Investigaciones Bibliotecológicas y de la Información 2022
Materias:
Acceso en línea:http://rev-ib.unam.mx/ib/index.php/ib/article/view/58607
https://dx.doi.org/10.22201/iibi.24488321xe.2022.93.58607
_version_ 1780761274015023104
author Polo Bautista, Luis Roberto
Polo Bautista, Israel
author_facet Polo Bautista, Luis Roberto
Polo Bautista, Israel
author_sort Polo Bautista, Luis Roberto
collection Investigación Bibliotecológica: archivonomía, bibliotecología e información
description This article provides an experience in the development and proof of a classification algorithm that automatically assigns a theme to a document. The Naïve Bayes Multinomial classification was used to automatically analyze the correlation between the themes of research in Life Sciences and Biomedicine, and the result of a corpus of 10 167 articles recuperated from the Web of Science (WoS). A proof of the performance of the algorithm was applied to 5 581 reviews for measuring its precision, exhaustivity and accuracy. The results show its usefulness in the organization of information respect to the automatic assignation of themes to the documents obtained in a digital repository or a bibliographic data base. The algorithm proposed can be utilized as an alternative to the traditional methods of classification of documents in a specific area of knowledge; this will allow the creation of specialized services oriented to the development of computational services that support the digital and electronic information management.
format Online
Article
id oai_unam-bibliotecologica-article-58607
institution Universidad Nacional Autónoma de México
language spa
publishDate 2022
publisher Instituto de Investigaciones Bibliotecológicas y de la Información
record_format ojs
spelling oai_unam-bibliotecologica-article-586072023-05-16T20:35:56Z Automatic classification experience of documents about Life Sciences and Biomedicine obtained in the Web of Science Experiencia de clasificación automática de documentos sobre Ciencias de la Vida y Biomedicina obtenidos del Web of Science Polo Bautista, Luis Roberto Polo Bautista, Israel Algorithms Automatic classification of documents Naïve Bayes Multinomial Sciences of Life and Biomedicine Algoritmos Clasificación automática de documentos Naïve Bayes Multinomial Ciencias de la Vida y Biomedicina This article provides an experience in the development and proof of a classification algorithm that automatically assigns a theme to a document. The Naïve Bayes Multinomial classification was used to automatically analyze the correlation between the themes of research in Life Sciences and Biomedicine, and the result of a corpus of 10 167 articles recuperated from the Web of Science (WoS). A proof of the performance of the algorithm was applied to 5 581 reviews for measuring its precision, exhaustivity and accuracy. The results show its usefulness in the organization of information respect to the automatic assignation of themes to the documents obtained in a digital repository or a bibliographic data base. The algorithm proposed can be utilized as an alternative to the traditional methods of classification of documents in a specific area of knowledge; this will allow the creation of specialized services oriented to the development of computational services that support the digital and electronic information management. Este artículo brinda una experiencia en el desarrollo y prueba de un algoritmo de clasificación que asigna automáticamente un tema a un documento. Se utilizó el algoritmo de clasificación Multinomial de Naïve Bayes para analizar la correlación entre los temas de investigación en Ciencias de la Vida y Biomedicina, y los resúmenes de un corpus de 10 167 artículos recuperados del Web of Science (WoS). Se realizó una prueba del rendimiento del algoritmo aplicada a 5 581 resúmenes para medir su precisión, exhaustividad y exactitud. Los resultados demuestran su utilidad en la organización de la información respecto a la asignación automática de temas a documentos obtenidos de un repositorio digital o base de datos bibliográfica. El algoritmo propuesto puede ser utilizado como alternativa a los métodos tradicionales de clasificación de documentos en un área específica del conocimiento; esto permitirá la creación de servicios especializados orientados al desarrollo de sistemas computacionales que apoyen la gestión de información digital y electrónica. Instituto de Investigaciones Bibliotecológicas y de la Información 2022-09-29 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion application/pdf text/html http://rev-ib.unam.mx/ib/index.php/ib/article/view/58607 10.22201/iibi.24488321xe.2022.93.58607 Investigación Bibliotecológica. Archivonomía, bibliotecología e información; Vol. 36 No. 93 (2022); 13-32 Investigación Bibliotecológica: archivonomía, bibliotecología e información; Vol. 36 Núm. 93 (2022); 13-32 Investigación Bibliotecológica: archivonomía, bibliotecología e información; v. 36 n. 93 (2022); 13-32 2448-8321 0187-358X 10.22201/iibi.24488321xe.2022.93 spa http://rev-ib.unam.mx/ib/index.php/ib/article/view/58607/52280 http://rev-ib.unam.mx/ib/index.php/ib/article/view/58607/52330 Derechos de autor 2022 Investigación Bibliotecológica: archivonomía, bibliotecología e información
spellingShingle Algorithms
Automatic classification of documents
Naïve Bayes Multinomial
Sciences of Life and Biomedicine
Algoritmos
Clasificación automática de documentos
Naïve Bayes Multinomial
Ciencias de la Vida y Biomedicina
Polo Bautista, Luis Roberto
Polo Bautista, Israel
Automatic classification experience of documents about Life Sciences and Biomedicine obtained in the Web of Science
title Automatic classification experience of documents about Life Sciences and Biomedicine obtained in the Web of Science
title_alt Experiencia de clasificación automática de documentos sobre Ciencias de la Vida y Biomedicina obtenidos del Web of Science
title_full Automatic classification experience of documents about Life Sciences and Biomedicine obtained in the Web of Science
title_fullStr Automatic classification experience of documents about Life Sciences and Biomedicine obtained in the Web of Science
title_full_unstemmed Automatic classification experience of documents about Life Sciences and Biomedicine obtained in the Web of Science
title_short Automatic classification experience of documents about Life Sciences and Biomedicine obtained in the Web of Science
title_sort automatic classification experience of documents about life sciences and biomedicine obtained in the web of science
topic Algorithms
Automatic classification of documents
Naïve Bayes Multinomial
Sciences of Life and Biomedicine
Algoritmos
Clasificación automática de documentos
Naïve Bayes Multinomial
Ciencias de la Vida y Biomedicina
topic_facet Algorithms
Automatic classification of documents
Naïve Bayes Multinomial
Sciences of Life and Biomedicine
Algoritmos
Clasificación automática de documentos
Naïve Bayes Multinomial
Ciencias de la Vida y Biomedicina
url http://rev-ib.unam.mx/ib/index.php/ib/article/view/58607
https://dx.doi.org/10.22201/iibi.24488321xe.2022.93.58607
work_keys_str_mv AT polobautistaluisroberto automaticclassificationexperienceofdocumentsaboutlifesciencesandbiomedicineobtainedinthewebofscience
AT polobautistaisrael automaticclassificationexperienceofdocumentsaboutlifesciencesandbiomedicineobtainedinthewebofscience
AT polobautistaluisroberto experienciadeclasificacionautomaticadedocumentossobrecienciasdelavidaybiomedicinaobtenidosdelwebofscience
AT polobautistaisrael experienciadeclasificacionautomaticadedocumentossobrecienciasdelavidaybiomedicinaobtenidosdelwebofscience