Cargando…

Characterization of urban risks in the press applying text mining for the enrichment of open data

News is freely spread and widely available to Internet users much more easily than traditional media. In the news, we can find an infinite number of hidden “minor data,” that can provide valuable information not collected in other sources of information. In this context, we have been interested in a...

Descripción completa

Detalles Bibliográficos
Autores principales: Vilches-Blázquez, Luis M., Comesaña Ocampo, Diana
Formato: Online Artículo
Lenguaje:spa
Publicado: Instituto de Investigaciones Bibliotecológicas y de la Información 2022
Materias:
Acceso en línea:http://rev-ib.unam.mx/ib/index.php/ib/article/view/58538
https://dx.doi.org/10.22201/iibi.24488321xe.2022.91.58538
_version_ 1780761270169894912
author Vilches-Blázquez, Luis M.
Comesaña Ocampo, Diana
author_facet Vilches-Blázquez, Luis M.
Comesaña Ocampo, Diana
author_sort Vilches-Blázquez, Luis M.
collection Investigación Bibliotecológica: archivonomía, bibliotecología e información
description News is freely spread and widely available to Internet users much more easily than traditional media. In the news, we can find an infinite number of hidden “minor data,” that can provide valuable information not collected in other sources of information. In this context, we have been interested in analyzing and characterizing the urban risks contained in the Uruguayan open newspapers using text mining techniques. This proposal makes it possible to create a news corpus based on risk events included in open data. The corpus covers 2003-2019 and is built from the digital open newspapers El Eco Digital, Montevideo Portal, and La Red 21. Various text mining techniques are applied to this corpus using the QDA-MinerLite software and the Python language (concretely, through the Scattertext library) to identify, characterize, and discover insights on these events. The corpus processing results help enrich the existing open data on risks in Uruguay, incorporating information on their effects, actors, and associated interventions.
format Online
Article
id oai_unam-bibliotecologica-article-58538
institution Universidad Nacional Autónoma de México
language spa
publishDate 2022
publisher Instituto de Investigaciones Bibliotecológicas y de la Información
record_format ojs
spelling oai_unam-bibliotecologica-article-585382023-01-17T18:23:30Z Characterization of urban risks in the press applying text mining for the enrichment of open data Caracterización de riesgos urbanos en prensa aplicando minería de texto para el enriquecimiento de datos abiertos Vilches-Blázquez, Luis M. Comesaña Ocampo, Diana Urban Risk Text Mining Open Digital Newspapers Open Data Riesgo Urbano Minería de Texto Prensa Digital Abierta Datos Abiertos News is freely spread and widely available to Internet users much more easily than traditional media. In the news, we can find an infinite number of hidden “minor data,” that can provide valuable information not collected in other sources of information. In this context, we have been interested in analyzing and characterizing the urban risks contained in the Uruguayan open newspapers using text mining techniques. This proposal makes it possible to create a news corpus based on risk events included in open data. The corpus covers 2003-2019 and is built from the digital open newspapers El Eco Digital, Montevideo Portal, and La Red 21. Various text mining techniques are applied to this corpus using the QDA-MinerLite software and the Python language (concretely, through the Scattertext library) to identify, characterize, and discover insights on these events. The corpus processing results help enrich the existing open data on risks in Uruguay, incorporating information on their effects, actors, and associated interventions. Las noticias se difunden libremente y con amplia disponibilidad para los usuarios de internet con mucha más facilidad que con los medios tradicionales. En estas noticias se pueden encontrar infinidad de “datos menores” ocultos que pueden suministrar valiosa información no recogida en otras fuentes de información. En este contexto, en este artículo nos ha interesado analizar y caracterizar los riesgos urbanos recogidos en prensa abierta en el contexto nacional uruguayo utilizando técnicas de minería de texto. Esta propuesta permite conformar un corpus de noticias que parte de eventos de riesgo contenidos en datos abiertos. El corpus abarca el periodo 2003- 2019 y proviene de periódicos digitales abiertos (El Eco Digital, Montevideo Portal y La Red 21). Sobre este corpus se aplican diversas técnicas de minería de texto empleando el software QDA-MinerLite y el lenguaje Python (mediante la librería Scattertext) para identificar, caracterizar y descubrir conocimiento sobre estos eventos. Los resultados obtenidos del procesamiento del corpus ayudan a enriquecer los datos abiertos existentes sobre riesgos en Uruguay, incorporando información sobre sus efectos, actores e intervenciones asociadas. Instituto de Investigaciones Bibliotecológicas y de la Información 2022-05-09 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Análisis de dominio, minería de texto application/pdf text/html http://rev-ib.unam.mx/ib/index.php/ib/article/view/58538 10.22201/iibi.24488321xe.2022.91.58538 Investigación Bibliotecológica. Archivonomía, bibliotecología e información; Vol. 36 No. 91 (2022); 85-107 Investigación Bibliotecológica: archivonomía, bibliotecología e información; Vol. 36 Núm. 91 (2022); 85-107 Investigación Bibliotecológica: archivonomía, bibliotecología e información; v. 36 n. 91 (2022); 85-107 2448-8321 0187-358X 10.22201/iibi.24488321xe.2022.91 spa http://rev-ib.unam.mx/ib/index.php/ib/article/view/58538/52254 http://rev-ib.unam.mx/ib/index.php/ib/article/view/58538/52308 Derechos de autor 2022 Investigación Bibliotecológica: archivonomía, bibliotecología e información
spellingShingle Urban Risk
Text Mining
Open Digital Newspapers
Open Data
Riesgo Urbano
Minería de Texto
Prensa Digital Abierta
Datos Abiertos
Vilches-Blázquez, Luis M.
Comesaña Ocampo, Diana
Characterization of urban risks in the press applying text mining for the enrichment of open data
title Characterization of urban risks in the press applying text mining for the enrichment of open data
title_alt Caracterización de riesgos urbanos en prensa aplicando minería de texto para el enriquecimiento de datos abiertos
title_full Characterization of urban risks in the press applying text mining for the enrichment of open data
title_fullStr Characterization of urban risks in the press applying text mining for the enrichment of open data
title_full_unstemmed Characterization of urban risks in the press applying text mining for the enrichment of open data
title_short Characterization of urban risks in the press applying text mining for the enrichment of open data
title_sort characterization of urban risks in the press applying text mining for the enrichment of open data
topic Urban Risk
Text Mining
Open Digital Newspapers
Open Data
Riesgo Urbano
Minería de Texto
Prensa Digital Abierta
Datos Abiertos
topic_facet Urban Risk
Text Mining
Open Digital Newspapers
Open Data
Riesgo Urbano
Minería de Texto
Prensa Digital Abierta
Datos Abiertos
url http://rev-ib.unam.mx/ib/index.php/ib/article/view/58538
https://dx.doi.org/10.22201/iibi.24488321xe.2022.91.58538
work_keys_str_mv AT vilchesblazquezluism characterizationofurbanrisksinthepressapplyingtextminingfortheenrichmentofopendata
AT comesanaocampodiana characterizationofurbanrisksinthepressapplyingtextminingfortheenrichmentofopendata
AT vilchesblazquezluism caracterizacionderiesgosurbanosenprensaaplicandomineriadetextoparaelenriquecimientodedatosabiertos
AT comesanaocampodiana caracterizacionderiesgosurbanosenprensaaplicandomineriadetextoparaelenriquecimientodedatosabiertos