Cargando…
RAKE algorithm application in digital document indexing
Currently there are a wide range of digital documents, particularly text documents that by their nature allow automated processing, organization and analysis methods for the purpose of retrieving information concisely and efficiently. Diverse areas of study such as computer science, library science,...
Autor principal: | |
---|---|
Formato: | Online Artículo |
Lenguaje: | spa |
Publicado: |
Instituto de Investigaciones Bibliotecológicas y de la Información
2018
|
Materias: | |
Acceso en línea: | http://rev-ib.unam.mx/ib/index.php/ib/article/view/57951 https://dx.doi.org/10.22201/iibi.24488321xe.2018.75.57951 |
_version_ | 1780761238994681856 |
---|---|
author | Contreras Barrera, Marcial |
author_facet | Contreras Barrera, Marcial |
author_sort | Contreras Barrera, Marcial |
collection | Investigación Bibliotecológica: archivonomía, bibliotecología e información |
description | Currently there are a wide range of digital documents, particularly text documents that by their nature allow automated processing, organization and analysis methods for the purpose of retrieving information concisely and efficiently. Diverse areas of study such as computer science, library science, computational linguistics and text mining, among others, have developed digital document processing methods for the purpose of facilitating their representation, organization and retrieval in digital libraries, databases and catalogs. These methods are both statistical and linguistic in nature. In this paper, the RAKE statistical method is examined in order to identify and extract multiword keywords from digital documents to allow organization, retrieval and automated document indexing. |
format | Online Article |
id | oai_unam-bibliotecologica-article-57951 |
institution | Universidad Nacional Autónoma de México |
language | spa |
publishDate | 2018 |
publisher | Instituto de Investigaciones Bibliotecológicas y de la Información |
record_format | ojs |
spelling | oai_unam-bibliotecologica-article-579512018-11-21T21:01:16Z RAKE algorithm application in digital document indexing Aplicación del algoritmo RAKE en la indización de documentos digitales Contreras Barrera, Marcial Método RAKE Indización Métodos Automatizados Consistencia RAKE Method Indexing Automated Methods Consistency Currently there are a wide range of digital documents, particularly text documents that by their nature allow automated processing, organization and analysis methods for the purpose of retrieving information concisely and efficiently. Diverse areas of study such as computer science, library science, computational linguistics and text mining, among others, have developed digital document processing methods for the purpose of facilitating their representation, organization and retrieval in digital libraries, databases and catalogs. These methods are both statistical and linguistic in nature. In this paper, the RAKE statistical method is examined in order to identify and extract multiword keywords from digital documents to allow organization, retrieval and automated document indexing. En la actualidad existe una diversidad de documentos digitales y en particular de documentos textuales que, dada su naturaleza, permiten la aplicación de métodos automatizados de procesamiento, organización y análisis con el fin de obtener información de manera concisa y de forma eficiente. Diversas áreas de estudio, como la informática, la bibliotecología, la lingüística computacional y la minería de texto, se encargan de desarrollar métodos para el procesamiento de documentos digitales con la meta de facilitar su representación, organización y recuperación, tanto en bibliotecas digitales como en bases de datos y catálogos. Estos métodos pueden ser de tipo estadístico o lingüístico. En este artículo se estudia el método RAKE de tipo estadístico con la finalidad de identificar y extraer palabras clave multipalabra de los documentos digitales para su organización y recuperación, además de la aplicación del método en la indización automatizada de documentos. Instituto de Investigaciones Bibliotecológicas y de la Información 2018-04-19 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion application/pdf text/html http://rev-ib.unam.mx/ib/index.php/ib/article/view/57951 10.22201/iibi.24488321xe.2018.75.57951 Investigación Bibliotecológica. Archivonomía, bibliotecología e información; Vol. 32 No. 75 (2018); 109-123 Investigación Bibliotecológica: archivonomía, bibliotecología e información; Vol. 32 Núm. 75 (2018); 109-123 Investigación Bibliotecológica: archivonomía, bibliotecología e información; v. 32 n. 75 (2018); 109-123 2448-8321 0187-358X 10.22201/iibi.24488321xe.2018.75 spa http://rev-ib.unam.mx/ib/index.php/ib/article/view/57951/51894 http://rev-ib.unam.mx/ib/index.php/ib/article/view/57951/51957 Derechos de autor 2018 Investigación Bibliotecológica: archivonomía, bibliotecología e información |
spellingShingle | Método RAKE Indización Métodos Automatizados Consistencia RAKE Method Indexing Automated Methods Consistency Contreras Barrera, Marcial RAKE algorithm application in digital document indexing |
title | RAKE algorithm application in digital document indexing |
title_alt | Aplicación del algoritmo RAKE en la indización de documentos digitales |
title_full | RAKE algorithm application in digital document indexing |
title_fullStr | RAKE algorithm application in digital document indexing |
title_full_unstemmed | RAKE algorithm application in digital document indexing |
title_short | RAKE algorithm application in digital document indexing |
title_sort | rake algorithm application in digital document indexing |
topic | Método RAKE Indización Métodos Automatizados Consistencia RAKE Method Indexing Automated Methods Consistency |
topic_facet | Método RAKE Indización Métodos Automatizados Consistencia RAKE Method Indexing Automated Methods Consistency |
url | http://rev-ib.unam.mx/ib/index.php/ib/article/view/57951 https://dx.doi.org/10.22201/iibi.24488321xe.2018.75.57951 |
work_keys_str_mv | AT contrerasbarreramarcial rakealgorithmapplicationindigitaldocumentindexing AT contrerasbarreramarcial aplicaciondelalgoritmorakeenlaindizaciondedocumentosdigitales |