Aceleraci�n del proceso de selecci�n de caracter�sticas en entornos Big Data : aplicaci�n en biomarcadores oncol�gicos
- 2024
- 1 archivo (3,60 MB) : il. col.
Tesis (Doctorado en Ciencias Inform�ticas) - Universidad Nacional de La Plata. Facultad de Inform�tica, 2024.
1. Introducci�n -- 1.1. Contexto -- 1.2. Motivaci�n -- 1.3. Objetivos -- 1.4. Contribuciones derivadas de esta tesis -- 1.4.1. Concursos, honores y menciones -- 1.4.2. Publicaciones en revistas internacionales -- 1.4.3. Publicaciones en revistas nacionales -- 1.4.4. Publicaciones en congresos y workshops -- 1.4.5. Formaci�n de recursos humanos -- 1.4.6. Desarrollo de herramientas -- 1.5. Organizaci�n del documento -- 2. Medicina de precisi�n -- 2.1. Biolog�a del c�ncer -- 2.2. Blancos terap�uticos -- 2.3. Descubrimiento de reguladores de expresi�n -- 2.4. Biomarcadores -- 2.4.1. Aplicaciones en la bioinform�tica -- 2.4.2. An�lisis de supervivencia -- 2.5. Evaluaci�n de biomarcadores -- 3. Selecci�n de caracter�sticas -- 3.1. Motivaci�n -- 3.2. Blind Search -- 3.3. Regresi�n de Cox penalizada -- 3.4. Metaheur�sticas -- 3.4.1. Binary Black Hole -- 3.4.2. Algoritmos gen�ticos -- 3.4.3. Binary Particle Swarm Optimization -- 3.5. Trabajo previo -- 3.6. Ejecuci�n distribuida de metaheur�sticas -- 4. Multiomix -- 4.1. Descubrimiento de reguladores de expresi�n -- 4.2. Identificaci�n de biomarcadores -- 4.2.1. Modelos entrenados -- 4.2.2. Validaciones estad�sticas -- 4.2.3. Inferencia -- 4.2.4. Multiomix AWS-EMR -- 4.3. Abstracci�n en la obtenci�n de datos -- 4.3.1. Modulector -- 4.3.2. BioAPI -- 4.3.3. Datos subidos por el usuario -- 4.3.4. cBioPortal -- 4.4. Democratizaci�n de la tecnolog�a -- 4.5. Dificultades t�cnicas solventadas -- 5. Optimizaci�n de metaheur�sticas en Spark -- 5.1. Apache Spark -- 5.2. Balance de carga -- 5.3. Estrategias de balance de carga propuestas -- 5.3.1. Modelo de predicci�n del tiempo de ejecuci�n de tareas -- 5.3.2. Estrategia "Equally Distributed" -- 5.3.3. Estrategia "Distribution Based on Predictions" -- 5.3.4. Estrategia "Predictive Execution Load Algorithm with Delay Opti mization" -- 5.3.5. Generalizaci�n y aplicaci�n del framework -- 6. Experimentaci�n -- 6.1. Hardware y software -- 6.2. Mediciones de tiempos y m�tricas -- 6.3. Evaluaci�n de las estrategias de balance de carga -- 6.3.1. Simulador de distribuci�n de tareas -- 6.3.2. Experimentos -- 6.3.3. Conjuntos de datos -- 6.3.4. Metaheur�sticas, modelos y m�tricas -- 6.3.5. Estrategias de balance de carga -- 6.3.6. Par�metros de PELADO y simulaci�n -- 6.3.7. Resultados Experimento 1: validaci�n sobre el simulador -- 6.3.8. Resultados Experimento 2: validaci�n sobre Apache Spark -- 7. Conclusi�n y trabajo a futuro -- 7.1. Conclusiones generales -- 7.2. L�neas de trabajo futuras -- Bibliograf�a --