CONTRATO DE PERSONAL - ETAPA

Carrera: Magister
en Sistemas de Información
Materia: INGENIERÍA DE
EXPLOTACION DE
INFORMACIÓN
Area: Asignaturas Obligatorias
Docente Titular: Dra. Paola Britos
Dr. Ramon Garcia-Martinez
Año: 2014
Cuatrimestre: Tercero
-1-
1 - Fundamentación
Hace ya una década, un estudio de la Universidad de California en Berkeley señaló que
la información disponible en Internet crecía a razón de 92 petabytes (1015 bytes) por
año. Se ha señalado que esta información esta disponible para procesos de
descubrimiento de conocimiento con independencia que se encuentre en fuentes
estructuradas ó desestructuradas.
La Inteligencia de Negocio propone un abordaje interdisciplinario (dentro del que se
encuentran los Sistemas de Información), que tomando todos los recursos de
información disponibles y el uso de herramientas analíticas y de síntesis con capacidad
de transformar la información en conocimiento, se centra en generar a partir de estos,
conocimiento que contribuya con la toma de decisiones de gestión y generación de
planes estratégicos en las organizaciones.
La Explotación de Información es la sub-disciplina del campo de los Sistemas de
Información que aporta a la Inteligencia de Negocio las herramientas para la
transformación de información en conocimiento.
La explotación de información se ha definido como la búsqueda de patrones interesantes
y de regularidades importantes en grandes masas de información.
Los métodos tradicionales de análisis de datos incluyen el trabajo con variables
estadísticas, varianza, desviación estándar, covarianza y correlación entre los atributos;
análisis de componentes (determinación de combinaciones lineales ortogonales que
maximizan una varianza determinada), análisis de factores (determinación de grupos
correlacionados de atributos), análisis de clusters (determinación de grupos de
conceptos que están cercanos según una función de distancia dada), análisis de
regresión (búsqueda de los coeficientes de una ecuación de los puntos dados como
datos), análisis multivariable de la varianza, y análisis de los discriminantes. Todos
estos métodos están orientados numéricamente. Son esencialmente cuantitativos.
En contraposición, los métodos de la explotación de información, permiten obtener
resultados de análisis de la masa de información que los métodos convencionales no
logran tales como: [a] los algoritmos TDIDT que permiten el desarrollo de
descripciones simbólicas de los datos para diferenciar entre distintas clases; [b] los
mapas auto organizados que pueden ser aplicados a la construcción de particiones de
grandes masas de información, exhibiendo la ventaja de ser tolerantes al ruido y la
capacidad de extender la generalización al momento de necesitar manipular datos
nuevos; ó [c] las redes bayesianas pueden ser aplicadas para identificar atributos
discriminantes en grandes masas de información, detectar patrones de comportamiento
en análisis de series temporales.
En este contexto, surge la necesidad de formar recursos en: [a] la aplicación de procesos
de explotación de información que permitan obtener conocimiento a partir de grandes
masas de información disponible; [b] la exploración de nuevas aplicaciones de las
-2-
tecnologías involucradas; y [c] el manejo de los ambientes disponibles que soportan
dichos procesos y tecnologías.
2 - Objetivos:
- Que el alumno se familiarice con los conceptos básicos de la explotación de
información, las tecnologías asociadas y su aplicación a la inteligencia de negocios.
- Que el alumno comprenda el uso de metodologías para proyectos de explotación de
información.
- Que el alumno experimente el uso de herramientas para explotación de información
en casos de inteligencia de negocios.
3 - Contenidos:
UNIDAD 1: INTRODUCCIÓN EXPLOTACIÓN DE INFORMACIÓN
Introducción Explotación de Información. Conceptos de Explotación de
Información. Descubrimiento de conocimientos. Tareas realizadas por un
sistema de Explotación de Información.
UNIDAD 2: PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN
Desarrollo de Proyectos de explotación de información. Definición del
contexto del proyecto. Identificación del problema inteligencia de
negocio. Educción de requisitos. Conversión del problema de inteligencia
de negocio a un problema de explotación de información. Conversión del
problema de explotación de información en procesos de explotación de
información. Desarrollo del proceso de explotación de información.
UNIDAD 3: HERRAMIENTAS PARA PROYECTOS DE EXPLOTACIÓN DE
INFORMACIÓN
Herramientas de Explotación de Información de Uso Libre. Introducción a
las herramientas de acceso libre. WEKA, ELVIRA, TANAGRA.
Resolución de Ejercicios Prácticos en la Herramienta TANAGRA.
UNIDAD 4: ESTUDIO DE CASOS
Identificación de patrones de fraude en telefonía celular utilizando SOM.
Identificación de fenómenos meteorológicos usando inducción y SOM.
Selección del Protocolo pedagógico usando inducción y SOM. Problemas
de aprendizaje en programación usando inducción y redes bayesianas.
Comportamiento de votación del congreso. Descubrimiento de acuerdos y
desacuerdos intrapartidarios e interpartidarios y entre minorías
-3-
intrapartidarias. Identificación de las leyes con mayor acuerdo dentro de
los partidos.Identificación de linfomas (linfografía). Descubrimiento de
reglas de comportamiento (diagnostico) de cada tipo de linfoma.
Descubrimiento de las características determinantes de cada tipo de
linfoma. Descubrimiento de características comunes a diferentes tipos de
patologías. Comportamiento de usuarios de servicio de Internet.
Descubrimiento de causales de alta o baja de un servicio “dial-up” de
Internet. Identificación de causales con mayor incidencia en los
comportamientos de alta o baja
4 - Metodología de Trabajo:
Clases teórico-prácticas: Exposición teórica de conceptos fundamentales, con
resolución metódica de problemas tipo y ensayos sobre
objetivos.
Clases prácticas:
Resolución por parte de los alumnos y controlada por el
equipo docente de problemas correspondientes a las
unidades temáticas del programa, ya sea por escrito o por
máquina (entrenamiento en el uso de aplicaciones). En
general se tratará de problemas abiertos, que generen dudas
y motiven la consulta a los docentes y la profundización del
conocimiento a través de la bibliografía. Durante el curso se
plantearán trabajos prácticos con problemas complejos a
resolver, que los alumnos deberán desarrollar en grupo
Clases de consulta:
Se dispondrá de un foro de discusion mediado por
tecnología web y de un sistema de atencion de consultas via
conferencia web.
5 - Evaluación y Acreditación:
- La evaluación será [a] por seguimiento de la construcción de la solución que cada
alumno haga para los trabajos prácticos planteados para el curso y [b] la resolución
de un ejercicio integrados individual.
6 - Bibliografía:
Britos, P. Abasolo, M., García-Martínez, R. y Perales, F. (2005). Identification of
MPEG-4 Patterns in Human Faces Using Data Mining Techniques.
Proceedings 13 th International Conference in Central Europe on Computer
Graphics, Visualization and Computer Vision'2005. Pág. 9-10.
-4-
Britos, P., Cataldi, Z., Sierra, E., García-Martínez, R. (2008). Pedagogical Protocols
Selection Automatic Assistance. Lecture Notes on Artificial Intelligence,
5027: 331-336.
Britos, P., Dieste, O., García-Martínez, R. (2008). Requirements Elicitation in Data
Mining for Business Intelligence Projects. En Advances in Information
Systems Research, Education and Practice. David Avison, George M.
Kasper, Barbara Pernici, Isabel Ramos, Dewald Roode Eds. (Boston:
Springer), IFIP Series, 274: 139–150.
Britos, P., Felgaer, P., Garcia-Martinez, R. 2008. Bayesian Networks Optimization
Based on Induction Learning Techniques. En Artificial Intelligence and
Practice II, Max Bramer Ed. (Boston: Springer), IFIP Series, 276: 439-443.
Britos, P., Fernández, E., García-Martínez, R. (2006). Propuesta Matriz de Actividades
para un Ciclo de Vida de Explotación de Datos. Reportes Técnicos en
Ingeniería del Software, 8(2): 36-42. ISSN 1667-5002.
Britos, P., Grosser, H., Rodríguez, D., Garcia-Martinez, R. (2008). Detecting Unusual
Changes of Users Consumption. En Artificial Intelligence and Practice II,
Max Bramer Ed. (Boston: Springer), IFIP Series, 276: 297-306.
Britos, P., Hossian, A., García-Martinez, R. y Sierra, E. (2005). Minería de Datos
Basada en Sistemas Inteligentes. Editorial Nueva Librería. ISBN 987-110430-8.
Britos, P., Hossian, A., García-Martinez, R. y Sierra, E. 2005. Minería de Datos Basada
en Sistemas Inteligentes. Editorial Nueva Librería. ISBN 987-1104-30-8.
Britos, P., Jiménez Rey, E., García-Martínez, E. (2008). Work in Progress:
Programming Misunderstandings Discovering Process Based On Intelligent
Data Mining Tools Proceedings 38th ASEE/IEEE Frontiers in Education
Conference (en prensa).
Britos, P., Merlino, H., Fernández, E., Ochoa, M., Diez, E. y García Martínez, R.
(2006). Tool Selection Methodology in Data Mining. Proceedings V IberoAmerican Symposium on Software Engineering. Pág. 85-90.
Cersósimo, D., Ravazoli, C., García-Martínez, R. (2005). Inversión Sísmica de un
Modelo Teórico Calculado Sobre un Horizonte Sísmico Utilizando Redes
Neuronales. Boletín de Informaciones Petroleras 1(1): 44-51.
Cersosimo, S., Ravazzoli, C., García-Martínez, R. (2006). Identification of Velocity
Variations in a Seismic Cube Using Neural Networks. En Professional
Practice in Artificial Intelligence, eds. J. Debenham, (Boston: Springer), IFIP
Series, 218: 11-19.
-5-
Cogliati, M., Britos, P., García-Martínez, R. 2006. Patterns in Temporal Series of
Meteorological Variables Using SOM & TDIDT. En Artificial Intelligence
and Practice II, Max Bramer Ed. (Boston: Springer), IFIP Series, 217: 305314.
Ferrero, G., Britos, P., García-Martínez, R. 2006. Detection of Breast Lesions in
Medical Digital Imaging Using Neural Networks. En Professional Practice
in Artificial Intelligence, John Debenham Ed. (Boston: Springer), IFIP
Series, 218: 1-10.
Giudici, P., Figini, S. 2009. Applied Data Mining for Business and Industry. Wiley &
Sons
Kantardzic, M. 2009. Data Mining: Concepts, Models, Methods, and Algorithms. Wiley
& Sons.
Linoff, G., Berry. M. 2009. Data Mining Techniques: For Marketing, Sales, and
CustomerRelationship Management. Wiley & Sons
Liu, B. 2009. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data
(Data-Centric Systems and Applications), Springer-Verlag
Ochoa, A. (2005). Propuesta de Técnicas de Protofase Metodológica para la
Compresión del Negocio. Reportes Técnicos de Ingeniería del Software,
7(1): 21-25.
Rancán, C., Pesado, P. y García-Martínez, R. (2007). Toward Integration of Knowledge
Based Systems and Knowledge Discovery Systems. Journal of Computer
Science & Technology, 7(1): 91-97. ISSN 1666-6038.
Russell, M. 2009. Mining the Social Web: Analyzing Data from Facebook, Twitter,
LinkedIn, and Other Social Media Sites. O´Reilly Media
-6-