Cargando…

Algorithms to solve the lack of normalization in author names in bibliometric studies

TWO ALGORITHMS TO DETECT AND SOLVE NORMALIZATION PROB­LEMS OF AUTHOR NAMES IN DATA ORIGINATED IN THOMSON'S ISI SCIENCE CITATION INDEX ARE PRESENTED. THE FIRST ALGO­RITHM ALLOWS DETECTION OF DIFFERENT NAMES WHICH COULD BELONG TO THE SAME PERSON. THE SECOND ONE, BASED ON THE DEGREE OF SIMILARITY...

Descripción completa

Detalles Bibliográficos
Autores principales: COSTAS, RODRIGO, BORDONS, MARIA
Formato: Online Artículo
Lenguaje:spa
Publicado: Instituto de Investigaciones Bibliotecológicas y de la Información 2007
Materias:
Acceso en línea:http://rev-ib.unam.mx/ib/index.php/ib/article/view/4115
https://dx.doi.org/10.22201/iibi.0187358xp.2007.42.4115
_version_ 1780761154876866560
author COSTAS, RODRIGO
BORDONS, MARIA
author_facet COSTAS, RODRIGO
BORDONS, MARIA
author_sort COSTAS, RODRIGO
collection Investigación Bibliotecológica: archivonomía, bibliotecología e información
description TWO ALGORITHMS TO DETECT AND SOLVE NORMALIZATION PROB­LEMS OF AUTHOR NAMES IN DATA ORIGINATED IN THOMSON'S ISI SCIENCE CITATION INDEX ARE PRESENTED. THE FIRST ALGO­RITHM ALLOWS DETECTION OF DIFFERENT NAMES WHICH COULD BELONG TO THE SAME PERSON. THE SECOND ONE, BASED ON THE DEGREE OF SIMILARITY BETWEEN TWO VARIANTS OF THE SAME NAME ON A DOCUMENT, HELPS TO DETERMINE WHETHER TWO SIMILAR NAMES CORRESPOND OR NOT TO THE SAME PER­SON. IN ORDER TO DETERMINE THE EFFICACY OF THE ALGORITHMS, A CONTROL OF NORMALIZED AUTHOR DATA FROM A PREVIOUS STUDY HAS BEEN USED. THE FIRST ALGORITHM DETECTS 67% OF NAME VARIANTS EXISTING IN THE POPULATION UNDER STUDY, AND THE SECOND ONE WAS SUCCESSFUL IN 74% OF THE CASES.
format Online
Article
id oai_unam-bibliotecologica-article-4115
institution Universidad Nacional Autónoma de México
language spa
publishDate 2007
publisher Instituto de Investigaciones Bibliotecológicas y de la Información
record_format ojs
spelling oai_unam-bibliotecologica-article-41152018-01-31T14:28:06Z Algorithms to solve the lack of normalization in author names in bibliometric studies Algoritmos para solventar la falta de normalización de nombres de autor en los estudios bibliométricos COSTAS, RODRIGO BORDONS, MARIA AUTHOR NAME NORMALIZATION SCIENCE CITATION INDEX THOMSON ISI ALGORITHMS NAME VARIATIONS NORMALIZACIÓN DE NOMBRES DE AUTORES BASES DE DATOS SCIENCE CITATION INDEX THOMSON ISI ALGORITMOS VARIANTES DE FIRMA TWO ALGORITHMS TO DETECT AND SOLVE NORMALIZATION PROB­LEMS OF AUTHOR NAMES IN DATA ORIGINATED IN THOMSON'S ISI SCIENCE CITATION INDEX ARE PRESENTED. THE FIRST ALGO­RITHM ALLOWS DETECTION OF DIFFERENT NAMES WHICH COULD BELONG TO THE SAME PERSON. THE SECOND ONE, BASED ON THE DEGREE OF SIMILARITY BETWEEN TWO VARIANTS OF THE SAME NAME ON A DOCUMENT, HELPS TO DETERMINE WHETHER TWO SIMILAR NAMES CORRESPOND OR NOT TO THE SAME PER­SON. IN ORDER TO DETERMINE THE EFFICACY OF THE ALGORITHMS, A CONTROL OF NORMALIZED AUTHOR DATA FROM A PREVIOUS STUDY HAS BEEN USED. THE FIRST ALGORITHM DETECTS 67% OF NAME VARIANTS EXISTING IN THE POPULATION UNDER STUDY, AND THE SECOND ONE WAS SUCCESSFUL IN 74% OF THE CASES. SE PRESENTAN DOS ALGORITMOS PARA DETECTAR Y SOLVENTAR PROBLEMAS DE NORMALIZACIÓN DE NOMBRES DE AUTORES EN DATOS PROCEDENTES DE LA BASE DE DATOS SCIENCE CITA­TION INDEX DE THOMSON ISI. EL PRIMER ALGORITMO PER­MITE DETECTAR FIRMAS DIFERENTES QUE, POR SU PARECIDO, PODRÍAN PERTENECER A UNA MISMA PERSONA. EL SEGUNDO AYUDA A DETERMINAR SI DOS FIRMAS PARECIDAS SE CORRES­PONDEN O NO CON UNA MISMA PERSONA EN FUNCIÓN DEL GRADO DE SIMILARIDAD EXISTENTE ENTRE LOS DOCUMENTOS DE UNA Y OTRA VARIANTE DE FIRMA. PARA DETERMINAR LA EFICACIA DE LOS ALGORITMOS SE HAN UTILIZADO COMO CON­TROL LOS DATOS DE AUTORES NORMALIZADOS DE UN ESTUDIO ANTERIOR. EL ALGORITMO DETECTA UN 67% DE LAS VARIANTES DE FIRMA EXISTENTES EN LA POBLACIÓN OBJETO DE ESTUDIO Y TIENE UN 74% DE ACIERTO EN LA DETERMINACIÓN DE SI ESAS FIRMAS CORRESPONDEN A UNA MISMA PERSONA.   Instituto de Investigaciones Bibliotecológicas y de la Información 2007-01-01 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion application/pdf text/html http://rev-ib.unam.mx/ib/index.php/ib/article/view/4115 10.22201/iibi.0187358xp.2007.42.4115 Investigación Bibliotecológica. Archivonomía, bibliotecología e información; Vol. 21 No. 42 (2007) Investigación Bibliotecológica: archivonomía, bibliotecología e información; Vol. 21 Núm. 42 (2007) Investigación Bibliotecológica: archivonomía, bibliotecología e información; v. 21 n. 42 (2007) 2448-8321 0187-358X 10.22201/iibi.0187358xp.2007.42 spa http://rev-ib.unam.mx/ib/index.php/ib/article/view/4115/3649 http://rev-ib.unam.mx/ib/index.php/ib/article/view/4115/51442 Derechos de autor 2007 Investigación Bibliotecológica: archivonomía, bibliotecología e información
spellingShingle AUTHOR NAME NORMALIZATION
SCIENCE CITATION INDEX
THOMSON ISI
ALGORITHMS
NAME VARIATIONS
NORMALIZACIÓN DE NOMBRES DE AUTORES
BASES DE DATOS
SCIENCE CITATION INDEX
THOMSON ISI
ALGORITMOS
VARIANTES DE FIRMA
COSTAS, RODRIGO
BORDONS, MARIA
Algorithms to solve the lack of normalization in author names in bibliometric studies
title Algorithms to solve the lack of normalization in author names in bibliometric studies
title_alt Algoritmos para solventar la falta de normalización de nombres de autor en los estudios bibliométricos
title_full Algorithms to solve the lack of normalization in author names in bibliometric studies
title_fullStr Algorithms to solve the lack of normalization in author names in bibliometric studies
title_full_unstemmed Algorithms to solve the lack of normalization in author names in bibliometric studies
title_short Algorithms to solve the lack of normalization in author names in bibliometric studies
title_sort algorithms to solve the lack of normalization in author names in bibliometric studies
topic AUTHOR NAME NORMALIZATION
SCIENCE CITATION INDEX
THOMSON ISI
ALGORITHMS
NAME VARIATIONS
NORMALIZACIÓN DE NOMBRES DE AUTORES
BASES DE DATOS
SCIENCE CITATION INDEX
THOMSON ISI
ALGORITMOS
VARIANTES DE FIRMA
topic_facet AUTHOR NAME NORMALIZATION
SCIENCE CITATION INDEX
THOMSON ISI
ALGORITHMS
NAME VARIATIONS
NORMALIZACIÓN DE NOMBRES DE AUTORES
BASES DE DATOS
SCIENCE CITATION INDEX
THOMSON ISI
ALGORITMOS
VARIANTES DE FIRMA
url http://rev-ib.unam.mx/ib/index.php/ib/article/view/4115
https://dx.doi.org/10.22201/iibi.0187358xp.2007.42.4115
work_keys_str_mv AT costasrodrigo algorithmstosolvethelackofnormalizationinauthornamesinbibliometricstudies
AT bordonsmaria algorithmstosolvethelackofnormalizationinauthornamesinbibliometricstudies
AT costasrodrigo algoritmosparasolventarlafaltadenormalizaciondenombresdeautorenlosestudiosbibliometricos
AT bordonsmaria algoritmosparasolventarlafaltadenormalizaciondenombresdeautorenlosestudiosbibliometricos