Detección de registros académicos duplicados obtenidos desde repositorios digitales (Record no. 57302)

MARC details
000 -CABECERA
campo de control de longitud fija 04645nam a2200253 a 4500
003 - IDENTIFICADOR DEL NÚMERO DE CONTROL
campo de control AR-LpUFIB
005 - FECHA Y HORA DE LA ÚLTIMA TRANSACCIÓN
campo de control 20250311170507.0
008 - DATOS DE LONGITUD FIJA--INFORMACIÓN GENERAL
campo de control de longitud fija 230201s2020 ag a om 000 0 spa d
024 8# - Otro identificador estandar
Número estándar o código DIF-M8235
-- 8455
-- DIF007528
040 ## - FUENTE DE LA CATALOGACIÓN
Centro catalogador/agencia de origen AR-LpUFIB
Lengua de catalogación spa
Centro/agencia transcriptor AR-LpUFIB
100 1# - ENTRADA PRINCIPAL--NOMBRE DE PERSONA
Nombre de persona Soloaga, Ignacio
245 10 - MENCIÓN DE TÍTULO
Título Detección de registros académicos duplicados obtenidos desde repositorios digitales
260 ## - PUBLICACIÓN, DISTRIBUCIÓN, ETC.
Fecha de publicación, distribución, etc. 2020
300 ## - DESCRIPCIÓN FÍSICA
Extensión 1 archivo (3,21 MB) :
Otras características físicas il. col.
502 ## - NOTA DE TESIS
Nota de tesis Tesina (Licenciatura en Sistemas) - Universidad Nacional de La Plata. Facultad de Informática, 2020.
505 0# - NOTA DE CONTENIDO CON FORMATO
Nota de contenido con formato Capítulo 1 Introducción -- Motivación -- Objetivos -- Objetivo general -- Objetivos secundarios -- Escenario de trabajo -- Ingesta masiva de registros -- Estructura de la tesis -- Capítulo 2 - Marco teórico -- Introducción -- Repositorios digitales -- Repositorios institucionales -- Repositorios institucionales en Argentina -- Metadatos -- Registro de metadatos -- Esquema de metadatos -- Dublin Core -- Perfiles de aplicación -- Identificadores persistentes -- Handle System -- DOI (Digital Object Identifier) -- ORCID -- Interoperabilidad vía OAI-PMH -- Interoperabilidad entre esquemas de metadatos -- Mapeo de metadatos -- Capítulo 3 - Detección de registros académicos duplicados -- Introducción -- Deduplicación de registros -- Heterogeneidad de los datos -- Deduplicación de registros académicos -- Heterogeneidad en los metadatos de distintas fuentes -- Uso de identificadores persistentes -- Técnicas para la detección de registros duplicados -- Modelos probabilísticos de emparejamiento -- Aprendizaje supervisado y semi supervisado -- Técnicas basadas en aprendizaje activo -- Técnicas basadas en distancia -- Enfoques basados en reglas -- Aprendizaje sin supervisión -- Metodologías para optimizar la cantidad de comparaciones -- Soluciones existentes -- Capítulo 4 - Análisis y desarrollo -- Introducción -- Desarrollo de un primer prototipo -- Solución propuesta -- Núcleo de la herramienta -- Esquema de metadatos genérico -- Normalización de la tipología de cada registro -- Engine y algoritmo de comparación -- Reglas -- Resultado asociado a la evaluación de una regla -- Tipos de reglas -- Elección del conjunto de reglas a evaluar -- Lógica de comparación de las reglas -- Comparación de metadatos -- Comparación de autores -- Comparación de títulos -- Comparación de fechas -- Auxiliar utils -- Funciones de similitud entre strings -- Distancia Levenshtein -- Distancia Jaro-Winkler -- Metaphone -- Función utilizada -- Obtención de identificadores -- Resultado de una deduplicación -- Mapeo de metadatos -- Funcionamiento -- Combinación de columnas -- Capítulo 5 - Desarrollo de la aplicación web -- Introducción -- Tecnologías utilizadas -- Aplicación back-end -- Extensiones al modelo -- Tarea de deduplicación -- Tarea de mapeo -- Endpoints principales de la API REST -- Aplicación front-end -- Interfaz de usuario de la herramienta de deduplicación -- Pantalla de inicio -- Formulario para iniciar una tarea -- Detalle de una tarea -- Listado de tareas -- Interfaz de usuario del módulo de mapeo -- Formulario para iniciar una tarea -- Detalle de una tarea -- Listado de tareas -- Capítulo 6 - Proceso de importación y resultados obtenidos -- Introducción -- Proceso para importaciones masivas -- Obtención de registros desde un repositorio -- Mapeo de metadatos a formato genérico -- Deduplicación con registros del repositorio destino -- Reconciliación de metadatos -- Mapeo a formato esperado por el repositorio destino -- Correcciones sobre los metadatos -- Obtención de los objetos digitales asociados a cada registro -- Generar archivo de importación y carga del mismo -- Casos de aplicación -- SCOPUS -- Memoria Académica -- CONICET Digital -- Capítulo 7 - Conclusiones y trabajos futuros -- Conclusión -- Trabajos futuros -- Mejorar performance de la herramienta de deduplicación -- Expandir módulo de comparación de autores -- Enriquecimiento de registros detectados como duplicados -- Explorar enfoque de Aprendizaje Automático -- Incorporar funcionalidad de deduplicación dentro del sistema de repositorio -- Bibliografía
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada REPOSITORIOS
650 #4 - PUNTO DE ACCESO ADICIONAL DE MATERIA--TÉRMINO DE MATERIA
Término de materia o nombre geográfico como elemento de entrada INTEROPERABILIDAD
653 ## - TÉRMINO DE INDIZACIÓN--NO CONTROLADO
Término no controlado mapeo de metadatos
700 1# - PUNTO DE ACCESO ADICIONAL--NOMBRE DE PERSONA
Nombre de persona De Giusti, Marisa Raquel ,
-- Director/a
700 1# - PUNTO DE ACCESO ADICIONAL--NOMBRE DE PERSONA
Nombre de persona Lira, Ariel Jorge ,
-- Asesor/a profesional
856 40 - LOCALIZACIÓN Y ACCESO ELECTRÓNICOS
Identificador Uniforme del Recurso <a href=" http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2231"> http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2231</a>
942 ## - ELEMENTOS DE PUNTO DE ACCESO ADICIONAL (KOHA)
Tipo de ítem Koha Tesis de posgrado
Holdings
Estado de retiro Estado de pérdida Estado dañado Disponibilidad Biblioteca permanente Biblioteca actual Fecha de adquisición Número de inventario Total de préstamos Signatura topográfica completa Código de barras Fecha visto por última vez Precio válido a partir de Tipo de ítem Koha Colección Identificador Uniforme del Recurso
      Préstamo a domicilio Biblioteca de la Facultad de Informática Biblioteca de la Facultad de Informática 11/03/2025 DIF-04929   TES 20/53 DIF-04929 11/03/2025 11/03/2025 Tesis de posgrado    
      Recurso en Línea Biblioteca de la Facultad de Informática Biblioteca de la Facultad de Informática 11/03/2025         11/03/2025 11/03/2025 Tesis de posgrado Biblioteca digital http://sedici.unlp.edu.ar/handle/10915/115229
      Recurso en Línea Biblioteca de la Facultad de Informática Biblioteca de la Facultad de Informática 11/03/2025         11/03/2025 11/03/2025 Tesis de posgrado Biblioteca digital http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2231