Cargando…
Algorithms to solve the lack of normalization in author names in bibliometric studies
TWO ALGORITHMS TO DETECT AND SOLVE NORMALIZATION PROBLEMS OF AUTHOR NAMES IN DATA ORIGINATED IN THOMSON'S ISI SCIENCE CITATION INDEX ARE PRESENTED. THE FIRST ALGORITHM ALLOWS DETECTION OF DIFFERENT NAMES WHICH COULD BELONG TO THE SAME PERSON. THE SECOND ONE, BASED ON THE DEGREE OF SIMILARITY...
Autores principales: | , |
---|---|
Formato: | Online Artículo |
Lenguaje: | spa |
Publicado: |
Instituto de Investigaciones Bibliotecológicas y de la Información
2007
|
Materias: | |
Acceso en línea: | http://rev-ib.unam.mx/ib/index.php/ib/article/view/4115 https://dx.doi.org/10.22201/iibi.0187358xp.2007.42.4115 |
_version_ | 1780761154876866560 |
---|---|
author | COSTAS, RODRIGO BORDONS, MARIA |
author_facet | COSTAS, RODRIGO BORDONS, MARIA |
author_sort | COSTAS, RODRIGO |
collection | Investigación Bibliotecológica: archivonomía, bibliotecología e información |
description | TWO ALGORITHMS TO DETECT AND SOLVE NORMALIZATION PROBLEMS OF AUTHOR NAMES IN DATA ORIGINATED IN THOMSON'S ISI SCIENCE CITATION INDEX ARE PRESENTED. THE FIRST ALGORITHM ALLOWS DETECTION OF DIFFERENT NAMES WHICH COULD BELONG TO THE SAME PERSON. THE SECOND ONE, BASED ON THE DEGREE OF SIMILARITY BETWEEN TWO VARIANTS OF THE SAME NAME ON A DOCUMENT, HELPS TO DETERMINE WHETHER TWO SIMILAR NAMES CORRESPOND OR NOT TO THE SAME PERSON. IN ORDER TO DETERMINE THE EFFICACY OF THE ALGORITHMS, A CONTROL OF NORMALIZED AUTHOR DATA FROM A PREVIOUS STUDY HAS BEEN USED. THE FIRST ALGORITHM DETECTS 67% OF NAME VARIANTS EXISTING IN THE POPULATION UNDER STUDY, AND THE SECOND ONE WAS SUCCESSFUL IN 74% OF THE CASES. |
format | Online Article |
id | oai_unam-bibliotecologica-article-4115 |
institution | Universidad Nacional Autónoma de México |
language | spa |
publishDate | 2007 |
publisher | Instituto de Investigaciones Bibliotecológicas y de la Información |
record_format | ojs |
spelling | oai_unam-bibliotecologica-article-41152018-01-31T14:28:06Z Algorithms to solve the lack of normalization in author names in bibliometric studies Algoritmos para solventar la falta de normalización de nombres de autor en los estudios bibliométricos COSTAS, RODRIGO BORDONS, MARIA AUTHOR NAME NORMALIZATION SCIENCE CITATION INDEX THOMSON ISI ALGORITHMS NAME VARIATIONS NORMALIZACIÓN DE NOMBRES DE AUTORES BASES DE DATOS SCIENCE CITATION INDEX THOMSON ISI ALGORITMOS VARIANTES DE FIRMA TWO ALGORITHMS TO DETECT AND SOLVE NORMALIZATION PROBLEMS OF AUTHOR NAMES IN DATA ORIGINATED IN THOMSON'S ISI SCIENCE CITATION INDEX ARE PRESENTED. THE FIRST ALGORITHM ALLOWS DETECTION OF DIFFERENT NAMES WHICH COULD BELONG TO THE SAME PERSON. THE SECOND ONE, BASED ON THE DEGREE OF SIMILARITY BETWEEN TWO VARIANTS OF THE SAME NAME ON A DOCUMENT, HELPS TO DETERMINE WHETHER TWO SIMILAR NAMES CORRESPOND OR NOT TO THE SAME PERSON. IN ORDER TO DETERMINE THE EFFICACY OF THE ALGORITHMS, A CONTROL OF NORMALIZED AUTHOR DATA FROM A PREVIOUS STUDY HAS BEEN USED. THE FIRST ALGORITHM DETECTS 67% OF NAME VARIANTS EXISTING IN THE POPULATION UNDER STUDY, AND THE SECOND ONE WAS SUCCESSFUL IN 74% OF THE CASES. SE PRESENTAN DOS ALGORITMOS PARA DETECTAR Y SOLVENTAR PROBLEMAS DE NORMALIZACIÓN DE NOMBRES DE AUTORES EN DATOS PROCEDENTES DE LA BASE DE DATOS SCIENCE CITATION INDEX DE THOMSON ISI. EL PRIMER ALGORITMO PERMITE DETECTAR FIRMAS DIFERENTES QUE, POR SU PARECIDO, PODRÍAN PERTENECER A UNA MISMA PERSONA. EL SEGUNDO AYUDA A DETERMINAR SI DOS FIRMAS PARECIDAS SE CORRESPONDEN O NO CON UNA MISMA PERSONA EN FUNCIÓN DEL GRADO DE SIMILARIDAD EXISTENTE ENTRE LOS DOCUMENTOS DE UNA Y OTRA VARIANTE DE FIRMA. PARA DETERMINAR LA EFICACIA DE LOS ALGORITMOS SE HAN UTILIZADO COMO CONTROL LOS DATOS DE AUTORES NORMALIZADOS DE UN ESTUDIO ANTERIOR. EL ALGORITMO DETECTA UN 67% DE LAS VARIANTES DE FIRMA EXISTENTES EN LA POBLACIÓN OBJETO DE ESTUDIO Y TIENE UN 74% DE ACIERTO EN LA DETERMINACIÓN DE SI ESAS FIRMAS CORRESPONDEN A UNA MISMA PERSONA. Instituto de Investigaciones Bibliotecológicas y de la Información 2007-01-01 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion application/pdf text/html http://rev-ib.unam.mx/ib/index.php/ib/article/view/4115 10.22201/iibi.0187358xp.2007.42.4115 Investigación Bibliotecológica. Archivonomía, bibliotecología e información; Vol. 21 No. 42 (2007) Investigación Bibliotecológica: archivonomía, bibliotecología e información; Vol. 21 Núm. 42 (2007) Investigación Bibliotecológica: archivonomía, bibliotecología e información; v. 21 n. 42 (2007) 2448-8321 0187-358X 10.22201/iibi.0187358xp.2007.42 spa http://rev-ib.unam.mx/ib/index.php/ib/article/view/4115/3649 http://rev-ib.unam.mx/ib/index.php/ib/article/view/4115/51442 Derechos de autor 2007 Investigación Bibliotecológica: archivonomía, bibliotecología e información |
spellingShingle | AUTHOR NAME NORMALIZATION SCIENCE CITATION INDEX THOMSON ISI ALGORITHMS NAME VARIATIONS NORMALIZACIÓN DE NOMBRES DE AUTORES BASES DE DATOS SCIENCE CITATION INDEX THOMSON ISI ALGORITMOS VARIANTES DE FIRMA COSTAS, RODRIGO BORDONS, MARIA Algorithms to solve the lack of normalization in author names in bibliometric studies |
title | Algorithms to solve the lack of normalization in author names in bibliometric studies |
title_alt | Algoritmos para solventar la falta de normalización de nombres de autor en los estudios bibliométricos |
title_full | Algorithms to solve the lack of normalization in author names in bibliometric studies |
title_fullStr | Algorithms to solve the lack of normalization in author names in bibliometric studies |
title_full_unstemmed | Algorithms to solve the lack of normalization in author names in bibliometric studies |
title_short | Algorithms to solve the lack of normalization in author names in bibliometric studies |
title_sort | algorithms to solve the lack of normalization in author names in bibliometric studies |
topic | AUTHOR NAME NORMALIZATION SCIENCE CITATION INDEX THOMSON ISI ALGORITHMS NAME VARIATIONS NORMALIZACIÓN DE NOMBRES DE AUTORES BASES DE DATOS SCIENCE CITATION INDEX THOMSON ISI ALGORITMOS VARIANTES DE FIRMA |
topic_facet | AUTHOR NAME NORMALIZATION SCIENCE CITATION INDEX THOMSON ISI ALGORITHMS NAME VARIATIONS NORMALIZACIÓN DE NOMBRES DE AUTORES BASES DE DATOS SCIENCE CITATION INDEX THOMSON ISI ALGORITMOS VARIANTES DE FIRMA |
url | http://rev-ib.unam.mx/ib/index.php/ib/article/view/4115 https://dx.doi.org/10.22201/iibi.0187358xp.2007.42.4115 |
work_keys_str_mv | AT costasrodrigo algorithmstosolvethelackofnormalizationinauthornamesinbibliometricstudies AT bordonsmaria algorithmstosolvethelackofnormalizationinauthornamesinbibliometricstudies AT costasrodrigo algoritmosparasolventarlafaltadenormalizaciondenombresdeautorenlosestudiosbibliometricos AT bordonsmaria algoritmosparasolventarlafaltadenormalizaciondenombresdeautorenlosestudiosbibliometricos |