DATA MINING DE GENOMAS Y TRANSCRIPTOMAS PARA

DATA MINING DE GENOMAS Y TRANSCRIPTOMAS PARA EL ESTUDIO DE
ENFERMEDADES CRÓNICAS
Dr. Martín C. Abba
CINIBA, Facultad de Ciencias Médicas – Universidad Nacional de La Plata
[email protected]
Objetivo: El objetivo del curso es brindar un marco teórico de las distintas metodologías
de análisis de datos de genómica funcional. Incluye: una descripción de las principales
bases de datos públicas de genómica, epigenómica y transcriptomica y de las diversas
herramientas estadísticas, de visualización, y de minería de datos para el procesamiento,
análisis e interpretación de datos. Se pondrá especial énfasis en las estrategias para la
integración de datos y la identificación de 'gene expression signatures' biomarcadores con
valor pronóstico / predictivo en pacientes con patologías neurodegenerativas, metabólicas
y neoplásicas.
Destinatarios: El curso se encuentra dirigido a estudiantes de grado, de postgrado e
investigadores que se encuentren desarrollando estudios que involucren análisis de
genomas y transcriptomas y/o que deseen incorporar dichas herramientas al estudio de
patologías humanas complejas.
Se desarrollarán clases teóricas donde se podrá incorporar el uso de diversas
herramientas (programas y aplicaciones web) para el manejo de bases de datos
disponibles en repositorios públicos, análisis estadístico y funcional para la identificación
de biomarcadores y vías de señalización relacionadas con las patologías previamente
descriptas.
Contenidos generales:
Se abordarán los aspectos fundamentales relacionados con el análisis de datos derivados
de plataformas de expresión basadas en oligo-microarrays y NGS. Se describirán y
utilizarán las principales bases de datos primarias en genómica funcional: GEO (Gene
Expression Omnibus), Array Express (AE), TCGA (The Cancer Genome Atlas) y bases de
datos secundarias. Se efectuará una introducción a los principales paquetes de preprocesamiento y análisis de datos en R/Bioconductor y la Suite TM4. Introducción al
concepto de 'gene expression signatures', ontología de genes (GO), anotación funcional y
análisis de enriquecimiento mediante el empleo de diversas herramientas bioinformáticas.
Se pondrá especial atención sobre los análisis de coexpresión génica - relevance
networks, identificación de 'gene switches' y biomarcadores con valor pronóstico y/o
predictivo.