000 | 04645nam a2200253 a 4500 | ||
---|---|---|---|
003 | AR-LpUFIB | ||
005 | 20250311170507.0 | ||
008 | 230201s2020 ag a om 000 0 spa d | ||
024 | 8 |
_aDIF-M8235 _b8455 _zDIF007528 |
|
040 |
_aAR-LpUFIB _bspa _cAR-LpUFIB |
||
100 | 1 | _aSoloaga, Ignacio | |
245 | 1 | 0 | _aDetección de registros académicos duplicados obtenidos desde repositorios digitales |
260 | _c2020 | ||
300 |
_a1 archivo (3,21 MB) : _bil. col. |
||
502 | _a Tesina (Licenciatura en Sistemas) - Universidad Nacional de La Plata. Facultad de Informática, 2020. | ||
505 | 0 | _a Capítulo 1 Introducción -- Motivación -- Objetivos -- Objetivo general -- Objetivos secundarios -- Escenario de trabajo -- Ingesta masiva de registros -- Estructura de la tesis -- Capítulo 2 - Marco teórico -- Introducción -- Repositorios digitales -- Repositorios institucionales -- Repositorios institucionales en Argentina -- Metadatos -- Registro de metadatos -- Esquema de metadatos -- Dublin Core -- Perfiles de aplicación -- Identificadores persistentes -- Handle System -- DOI (Digital Object Identifier) -- ORCID -- Interoperabilidad vía OAI-PMH -- Interoperabilidad entre esquemas de metadatos -- Mapeo de metadatos -- Capítulo 3 - Detección de registros académicos duplicados -- Introducción -- Deduplicación de registros -- Heterogeneidad de los datos -- Deduplicación de registros académicos -- Heterogeneidad en los metadatos de distintas fuentes -- Uso de identificadores persistentes -- Técnicas para la detección de registros duplicados -- Modelos probabilísticos de emparejamiento -- Aprendizaje supervisado y semi supervisado -- Técnicas basadas en aprendizaje activo -- Técnicas basadas en distancia -- Enfoques basados en reglas -- Aprendizaje sin supervisión -- Metodologías para optimizar la cantidad de comparaciones -- Soluciones existentes -- Capítulo 4 - Análisis y desarrollo -- Introducción -- Desarrollo de un primer prototipo -- Solución propuesta -- Núcleo de la herramienta -- Esquema de metadatos genérico -- Normalización de la tipología de cada registro -- Engine y algoritmo de comparación -- Reglas -- Resultado asociado a la evaluación de una regla -- Tipos de reglas -- Elección del conjunto de reglas a evaluar -- Lógica de comparación de las reglas -- Comparación de metadatos -- Comparación de autores -- Comparación de títulos -- Comparación de fechas -- Auxiliar utils -- Funciones de similitud entre strings -- Distancia Levenshtein -- Distancia Jaro-Winkler -- Metaphone -- Función utilizada -- Obtención de identificadores -- Resultado de una deduplicación -- Mapeo de metadatos -- Funcionamiento -- Combinación de columnas -- Capítulo 5 - Desarrollo de la aplicación web -- Introducción -- Tecnologías utilizadas -- Aplicación back-end -- Extensiones al modelo -- Tarea de deduplicación -- Tarea de mapeo -- Endpoints principales de la API REST -- Aplicación front-end -- Interfaz de usuario de la herramienta de deduplicación -- Pantalla de inicio -- Formulario para iniciar una tarea -- Detalle de una tarea -- Listado de tareas -- Interfaz de usuario del módulo de mapeo -- Formulario para iniciar una tarea -- Detalle de una tarea -- Listado de tareas -- Capítulo 6 - Proceso de importación y resultados obtenidos -- Introducción -- Proceso para importaciones masivas -- Obtención de registros desde un repositorio -- Mapeo de metadatos a formato genérico -- Deduplicación con registros del repositorio destino -- Reconciliación de metadatos -- Mapeo a formato esperado por el repositorio destino -- Correcciones sobre los metadatos -- Obtención de los objetos digitales asociados a cada registro -- Generar archivo de importación y carga del mismo -- Casos de aplicación -- SCOPUS -- Memoria Académica -- CONICET Digital -- Capítulo 7 - Conclusiones y trabajos futuros -- Conclusión -- Trabajos futuros -- Mejorar performance de la herramienta de deduplicación -- Expandir módulo de comparación de autores -- Enriquecimiento de registros detectados como duplicados -- Explorar enfoque de Aprendizaje Automático -- Incorporar funcionalidad de deduplicación dentro del sistema de repositorio -- Bibliografía | |
650 | 4 | _aREPOSITORIOS | |
650 | 4 | _aINTEROPERABILIDAD | |
653 | _amapeo de metadatos | ||
700 | 1 |
_aDe Giusti, Marisa Raquel , _eDirector/a |
|
700 | 1 |
_aLira, Ariel Jorge , _eAsesor/a profesional |
|
856 | 4 | 0 | _u http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2231 |
942 | _cTE | ||
999 |
_c57302 _d57302 |