Cargando…

RAKE algorithm application in digital document indexing

Currently there are a wide range of digital documents, particularly text documents that by their nature allow automated processing, organization and analysis methods for the purpose of retrieving information concisely and efficiently. Diverse areas of study such as computer science, library science,...

Descripción completa

Detalles Bibliográficos
Autor principal: Contreras Barrera, Marcial
Formato: Online Artículo
Lenguaje:spa
Publicado: Instituto de Investigaciones Bibliotecológicas y de la Información 2018
Materias:
Acceso en línea:http://rev-ib.unam.mx/ib/index.php/ib/article/view/57951
https://dx.doi.org/10.22201/iibi.24488321xe.2018.75.57951
_version_ 1780761238994681856
author Contreras Barrera, Marcial
author_facet Contreras Barrera, Marcial
author_sort Contreras Barrera, Marcial
collection Investigación Bibliotecológica: archivonomía, bibliotecología e información
description Currently there are a wide range of digital documents, particularly text documents that by their nature allow automated processing, organization and analysis methods for the purpose of retrieving information concisely and efficiently. Diverse areas of study such as computer science, library science, computational linguistics and text mining, among others, have developed digital document processing methods for the purpose of facilitating their representation, organization and retrieval in digital libraries, databases and catalogs. These methods are both statistical and linguistic in nature. In this paper, the RAKE statistical method is examined in order to identify and extract multiword keywords from digital documents to allow organization, retrieval and automated document indexing.
format Online
Article
id oai_unam-bibliotecologica-article-57951
institution Universidad Nacional Autónoma de México
language spa
publishDate 2018
publisher Instituto de Investigaciones Bibliotecológicas y de la Información
record_format ojs
spelling oai_unam-bibliotecologica-article-579512018-11-21T21:01:16Z RAKE algorithm application in digital document indexing Aplicación del algoritmo RAKE en la indización de documentos digitales Contreras Barrera, Marcial Método RAKE Indización Métodos Automatizados Consistencia RAKE Method Indexing Automated Methods Consistency Currently there are a wide range of digital documents, particularly text documents that by their nature allow automated processing, organization and analysis methods for the purpose of retrieving information concisely and efficiently. Diverse areas of study such as computer science, library science, computational linguistics and text mining, among others, have developed digital document processing methods for the purpose of facilitating their representation, organization and retrieval in digital libraries, databases and catalogs. These methods are both statistical and linguistic in nature. In this paper, the RAKE statistical method is examined in order to identify and extract multiword keywords from digital documents to allow organization, retrieval and automated document indexing. En la actualidad existe una diversidad de documentos digitales y en particular de documentos textuales que, dada su naturaleza, permiten la aplicación de métodos automatizados de procesamiento, organización y análisis con el fin de obtener información de manera concisa y de forma eficiente. Diversas áreas de estudio, como la informática, la bibliotecología, la lingüística computacional y la minería de texto, se encargan de desarrollar métodos para el procesamiento de documentos digitales con la meta de facilitar su representación, organización y recuperación, tanto en bibliotecas digitales como en bases de datos y catálogos. Estos métodos pueden ser de tipo estadístico o lingüístico. En este artículo se estudia el método RAKE de tipo estadístico con la finalidad de identificar y extraer palabras clave multipalabra de los documentos digitales para su organización y recuperación, además de la aplicación del método en la indización automatizada de documentos. Instituto de Investigaciones Bibliotecológicas y de la Información 2018-04-19 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion application/pdf text/html http://rev-ib.unam.mx/ib/index.php/ib/article/view/57951 10.22201/iibi.24488321xe.2018.75.57951 Investigación Bibliotecológica. Archivonomía, bibliotecología e información; Vol. 32 No. 75 (2018); 109-123 Investigación Bibliotecológica: archivonomía, bibliotecología e información; Vol. 32 Núm. 75 (2018); 109-123 Investigación Bibliotecológica: archivonomía, bibliotecología e información; v. 32 n. 75 (2018); 109-123 2448-8321 0187-358X 10.22201/iibi.24488321xe.2018.75 spa http://rev-ib.unam.mx/ib/index.php/ib/article/view/57951/51894 http://rev-ib.unam.mx/ib/index.php/ib/article/view/57951/51957 Derechos de autor 2018 Investigación Bibliotecológica: archivonomía, bibliotecología e información
spellingShingle Método RAKE
Indización
Métodos Automatizados
Consistencia
RAKE Method
Indexing
Automated Methods
Consistency
Contreras Barrera, Marcial
RAKE algorithm application in digital document indexing
title RAKE algorithm application in digital document indexing
title_alt Aplicación del algoritmo RAKE en la indización de documentos digitales
title_full RAKE algorithm application in digital document indexing
title_fullStr RAKE algorithm application in digital document indexing
title_full_unstemmed RAKE algorithm application in digital document indexing
title_short RAKE algorithm application in digital document indexing
title_sort rake algorithm application in digital document indexing
topic Método RAKE
Indización
Métodos Automatizados
Consistencia
RAKE Method
Indexing
Automated Methods
Consistency
topic_facet Método RAKE
Indización
Métodos Automatizados
Consistencia
RAKE Method
Indexing
Automated Methods
Consistency
url http://rev-ib.unam.mx/ib/index.php/ib/article/view/57951
https://dx.doi.org/10.22201/iibi.24488321xe.2018.75.57951
work_keys_str_mv AT contrerasbarreramarcial rakealgorithmapplicationindigitaldocumentindexing
AT contrerasbarreramarcial aplicaciondelalgoritmorakeenlaindizaciondedocumentosdigitales