Cargando…
Characterization of urban risks in the press applying text mining for the enrichment of open data
News is freely spread and widely available to Internet users much more easily than traditional media. In the news, we can find an infinite number of hidden “minor data,” that can provide valuable information not collected in other sources of information. In this context, we have been interested in a...
Autores principales: | , |
---|---|
Formato: | Online Artículo |
Lenguaje: | spa |
Publicado: |
Instituto de Investigaciones Bibliotecológicas y de la Información
2022
|
Materias: | |
Acceso en línea: | http://rev-ib.unam.mx/ib/index.php/ib/article/view/58538 https://dx.doi.org/10.22201/iibi.24488321xe.2022.91.58538 |
_version_ | 1780761270169894912 |
---|---|
author | Vilches-Blázquez, Luis M. Comesaña Ocampo, Diana |
author_facet | Vilches-Blázquez, Luis M. Comesaña Ocampo, Diana |
author_sort | Vilches-Blázquez, Luis M. |
collection | Investigación Bibliotecológica: archivonomía, bibliotecología e información |
description | News is freely spread and widely available to Internet users much more easily than traditional media. In the news, we can find an infinite number of hidden “minor data,” that can provide valuable information not collected in other sources of information. In this context, we have been interested in analyzing and characterizing the urban risks contained in the Uruguayan open newspapers using text mining techniques. This proposal makes it possible to create a news corpus based on risk events included in open data. The corpus covers 2003-2019 and is built from the digital open newspapers El Eco Digital, Montevideo Portal, and La Red 21. Various text mining techniques are applied to this corpus using the QDA-MinerLite software and the Python language (concretely, through the Scattertext library) to identify, characterize, and discover insights on these events. The corpus processing results help enrich the existing open data on risks in Uruguay, incorporating information on their effects, actors, and associated interventions. |
format | Online Article |
id | oai_unam-bibliotecologica-article-58538 |
institution | Universidad Nacional Autónoma de México |
language | spa |
publishDate | 2022 |
publisher | Instituto de Investigaciones Bibliotecológicas y de la Información |
record_format | ojs |
spelling | oai_unam-bibliotecologica-article-585382023-01-17T18:23:30Z Characterization of urban risks in the press applying text mining for the enrichment of open data Caracterización de riesgos urbanos en prensa aplicando minería de texto para el enriquecimiento de datos abiertos Vilches-Blázquez, Luis M. Comesaña Ocampo, Diana Urban Risk Text Mining Open Digital Newspapers Open Data Riesgo Urbano Minería de Texto Prensa Digital Abierta Datos Abiertos News is freely spread and widely available to Internet users much more easily than traditional media. In the news, we can find an infinite number of hidden “minor data,” that can provide valuable information not collected in other sources of information. In this context, we have been interested in analyzing and characterizing the urban risks contained in the Uruguayan open newspapers using text mining techniques. This proposal makes it possible to create a news corpus based on risk events included in open data. The corpus covers 2003-2019 and is built from the digital open newspapers El Eco Digital, Montevideo Portal, and La Red 21. Various text mining techniques are applied to this corpus using the QDA-MinerLite software and the Python language (concretely, through the Scattertext library) to identify, characterize, and discover insights on these events. The corpus processing results help enrich the existing open data on risks in Uruguay, incorporating information on their effects, actors, and associated interventions. Las noticias se difunden libremente y con amplia disponibilidad para los usuarios de internet con mucha más facilidad que con los medios tradicionales. En estas noticias se pueden encontrar infinidad de “datos menores” ocultos que pueden suministrar valiosa información no recogida en otras fuentes de información. En este contexto, en este artículo nos ha interesado analizar y caracterizar los riesgos urbanos recogidos en prensa abierta en el contexto nacional uruguayo utilizando técnicas de minería de texto. Esta propuesta permite conformar un corpus de noticias que parte de eventos de riesgo contenidos en datos abiertos. El corpus abarca el periodo 2003- 2019 y proviene de periódicos digitales abiertos (El Eco Digital, Montevideo Portal y La Red 21). Sobre este corpus se aplican diversas técnicas de minería de texto empleando el software QDA-MinerLite y el lenguaje Python (mediante la librería Scattertext) para identificar, caracterizar y descubrir conocimiento sobre estos eventos. Los resultados obtenidos del procesamiento del corpus ayudan a enriquecer los datos abiertos existentes sobre riesgos en Uruguay, incorporando información sobre sus efectos, actores e intervenciones asociadas. Instituto de Investigaciones Bibliotecológicas y de la Información 2022-05-09 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Análisis de dominio, minería de texto application/pdf text/html http://rev-ib.unam.mx/ib/index.php/ib/article/view/58538 10.22201/iibi.24488321xe.2022.91.58538 Investigación Bibliotecológica. Archivonomía, bibliotecología e información; Vol. 36 No. 91 (2022); 85-107 Investigación Bibliotecológica: archivonomía, bibliotecología e información; Vol. 36 Núm. 91 (2022); 85-107 Investigación Bibliotecológica: archivonomía, bibliotecología e información; v. 36 n. 91 (2022); 85-107 2448-8321 0187-358X 10.22201/iibi.24488321xe.2022.91 spa http://rev-ib.unam.mx/ib/index.php/ib/article/view/58538/52254 http://rev-ib.unam.mx/ib/index.php/ib/article/view/58538/52308 Derechos de autor 2022 Investigación Bibliotecológica: archivonomía, bibliotecología e información |
spellingShingle | Urban Risk Text Mining Open Digital Newspapers Open Data Riesgo Urbano Minería de Texto Prensa Digital Abierta Datos Abiertos Vilches-Blázquez, Luis M. Comesaña Ocampo, Diana Characterization of urban risks in the press applying text mining for the enrichment of open data |
title | Characterization of urban risks in the press applying text mining for the enrichment of open data |
title_alt | Caracterización de riesgos urbanos en prensa aplicando minería de texto para el enriquecimiento de datos abiertos |
title_full | Characterization of urban risks in the press applying text mining for the enrichment of open data |
title_fullStr | Characterization of urban risks in the press applying text mining for the enrichment of open data |
title_full_unstemmed | Characterization of urban risks in the press applying text mining for the enrichment of open data |
title_short | Characterization of urban risks in the press applying text mining for the enrichment of open data |
title_sort | characterization of urban risks in the press applying text mining for the enrichment of open data |
topic | Urban Risk Text Mining Open Digital Newspapers Open Data Riesgo Urbano Minería de Texto Prensa Digital Abierta Datos Abiertos |
topic_facet | Urban Risk Text Mining Open Digital Newspapers Open Data Riesgo Urbano Minería de Texto Prensa Digital Abierta Datos Abiertos |
url | http://rev-ib.unam.mx/ib/index.php/ib/article/view/58538 https://dx.doi.org/10.22201/iibi.24488321xe.2022.91.58538 |
work_keys_str_mv | AT vilchesblazquezluism characterizationofurbanrisksinthepressapplyingtextminingfortheenrichmentofopendata AT comesanaocampodiana characterizationofurbanrisksinthepressapplyingtextminingfortheenrichmentofopendata AT vilchesblazquezluism caracterizacionderiesgosurbanosenprensaaplicandomineriadetextoparaelenriquecimientodedatosabiertos AT comesanaocampodiana caracterizacionderiesgosurbanosenprensaaplicandomineriadetextoparaelenriquecimientodedatosabiertos |