Carrera: Magister en Sistemas de Información Materia: INGENIERÍA DE EXPLOTACION DE INFORMACIÓN Area: Asignaturas Obligatorias Docente Titular: Dra. Paola Britos Dr. Ramon Garcia-Martinez Año: 2014 Cuatrimestre: Tercero -1- 1 - Fundamentación Hace ya una década, un estudio de la Universidad de California en Berkeley señaló que la información disponible en Internet crecía a razón de 92 petabytes (1015 bytes) por año. Se ha señalado que esta información esta disponible para procesos de descubrimiento de conocimiento con independencia que se encuentre en fuentes estructuradas ó desestructuradas. La Inteligencia de Negocio propone un abordaje interdisciplinario (dentro del que se encuentran los Sistemas de Información), que tomando todos los recursos de información disponibles y el uso de herramientas analíticas y de síntesis con capacidad de transformar la información en conocimiento, se centra en generar a partir de estos, conocimiento que contribuya con la toma de decisiones de gestión y generación de planes estratégicos en las organizaciones. La Explotación de Información es la sub-disciplina del campo de los Sistemas de Información que aporta a la Inteligencia de Negocio las herramientas para la transformación de información en conocimiento. La explotación de información se ha definido como la búsqueda de patrones interesantes y de regularidades importantes en grandes masas de información. Los métodos tradicionales de análisis de datos incluyen el trabajo con variables estadísticas, varianza, desviación estándar, covarianza y correlación entre los atributos; análisis de componentes (determinación de combinaciones lineales ortogonales que maximizan una varianza determinada), análisis de factores (determinación de grupos correlacionados de atributos), análisis de clusters (determinación de grupos de conceptos que están cercanos según una función de distancia dada), análisis de regresión (búsqueda de los coeficientes de una ecuación de los puntos dados como datos), análisis multivariable de la varianza, y análisis de los discriminantes. Todos estos métodos están orientados numéricamente. Son esencialmente cuantitativos. En contraposición, los métodos de la explotación de información, permiten obtener resultados de análisis de la masa de información que los métodos convencionales no logran tales como: [a] los algoritmos TDIDT que permiten el desarrollo de descripciones simbólicas de los datos para diferenciar entre distintas clases; [b] los mapas auto organizados que pueden ser aplicados a la construcción de particiones de grandes masas de información, exhibiendo la ventaja de ser tolerantes al ruido y la capacidad de extender la generalización al momento de necesitar manipular datos nuevos; ó [c] las redes bayesianas pueden ser aplicadas para identificar atributos discriminantes en grandes masas de información, detectar patrones de comportamiento en análisis de series temporales. En este contexto, surge la necesidad de formar recursos en: [a] la aplicación de procesos de explotación de información que permitan obtener conocimiento a partir de grandes masas de información disponible; [b] la exploración de nuevas aplicaciones de las -2- tecnologías involucradas; y [c] el manejo de los ambientes disponibles que soportan dichos procesos y tecnologías. 2 - Objetivos: - Que el alumno se familiarice con los conceptos básicos de la explotación de información, las tecnologías asociadas y su aplicación a la inteligencia de negocios. - Que el alumno comprenda el uso de metodologías para proyectos de explotación de información. - Que el alumno experimente el uso de herramientas para explotación de información en casos de inteligencia de negocios. 3 - Contenidos: UNIDAD 1: INTRODUCCIÓN EXPLOTACIÓN DE INFORMACIÓN Introducción Explotación de Información. Conceptos de Explotación de Información. Descubrimiento de conocimientos. Tareas realizadas por un sistema de Explotación de Información. UNIDAD 2: PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN Desarrollo de Proyectos de explotación de información. Definición del contexto del proyecto. Identificación del problema inteligencia de negocio. Educción de requisitos. Conversión del problema de inteligencia de negocio a un problema de explotación de información. Conversión del problema de explotación de información en procesos de explotación de información. Desarrollo del proceso de explotación de información. UNIDAD 3: HERRAMIENTAS PARA PROYECTOS DE EXPLOTACIÓN DE INFORMACIÓN Herramientas de Explotación de Información de Uso Libre. Introducción a las herramientas de acceso libre. WEKA, ELVIRA, TANAGRA. Resolución de Ejercicios Prácticos en la Herramienta TANAGRA. UNIDAD 4: ESTUDIO DE CASOS Identificación de patrones de fraude en telefonía celular utilizando SOM. Identificación de fenómenos meteorológicos usando inducción y SOM. Selección del Protocolo pedagógico usando inducción y SOM. Problemas de aprendizaje en programación usando inducción y redes bayesianas. Comportamiento de votación del congreso. Descubrimiento de acuerdos y desacuerdos intrapartidarios e interpartidarios y entre minorías -3- intrapartidarias. Identificación de las leyes con mayor acuerdo dentro de los partidos.Identificación de linfomas (linfografía). Descubrimiento de reglas de comportamiento (diagnostico) de cada tipo de linfoma. Descubrimiento de las características determinantes de cada tipo de linfoma. Descubrimiento de características comunes a diferentes tipos de patologías. Comportamiento de usuarios de servicio de Internet. Descubrimiento de causales de alta o baja de un servicio “dial-up” de Internet. Identificación de causales con mayor incidencia en los comportamientos de alta o baja 4 - Metodología de Trabajo: Clases teórico-prácticas: Exposición teórica de conceptos fundamentales, con resolución metódica de problemas tipo y ensayos sobre objetivos. Clases prácticas: Resolución por parte de los alumnos y controlada por el equipo docente de problemas correspondientes a las unidades temáticas del programa, ya sea por escrito o por máquina (entrenamiento en el uso de aplicaciones). En general se tratará de problemas abiertos, que generen dudas y motiven la consulta a los docentes y la profundización del conocimiento a través de la bibliografía. Durante el curso se plantearán trabajos prácticos con problemas complejos a resolver, que los alumnos deberán desarrollar en grupo Clases de consulta: Se dispondrá de un foro de discusion mediado por tecnología web y de un sistema de atencion de consultas via conferencia web. 5 - Evaluación y Acreditación: - La evaluación será [a] por seguimiento de la construcción de la solución que cada alumno haga para los trabajos prácticos planteados para el curso y [b] la resolución de un ejercicio integrados individual. 6 - Bibliografía: Britos, P. Abasolo, M., García-Martínez, R. y Perales, F. (2005). Identification of MPEG-4 Patterns in Human Faces Using Data Mining Techniques. Proceedings 13 th International Conference in Central Europe on Computer Graphics, Visualization and Computer Vision'2005. Pág. 9-10. -4- Britos, P., Cataldi, Z., Sierra, E., García-Martínez, R. (2008). Pedagogical Protocols Selection Automatic Assistance. Lecture Notes on Artificial Intelligence, 5027: 331-336. Britos, P., Dieste, O., García-Martínez, R. (2008). Requirements Elicitation in Data Mining for Business Intelligence Projects. En Advances in Information Systems Research, Education and Practice. David Avison, George M. Kasper, Barbara Pernici, Isabel Ramos, Dewald Roode Eds. (Boston: Springer), IFIP Series, 274: 139–150. Britos, P., Felgaer, P., Garcia-Martinez, R. 2008. Bayesian Networks Optimization Based on Induction Learning Techniques. En Artificial Intelligence and Practice II, Max Bramer Ed. (Boston: Springer), IFIP Series, 276: 439-443. Britos, P., Fernández, E., García-Martínez, R. (2006). Propuesta Matriz de Actividades para un Ciclo de Vida de Explotación de Datos. Reportes Técnicos en Ingeniería del Software, 8(2): 36-42. ISSN 1667-5002. Britos, P., Grosser, H., Rodríguez, D., Garcia-Martinez, R. (2008). Detecting Unusual Changes of Users Consumption. En Artificial Intelligence and Practice II, Max Bramer Ed. (Boston: Springer), IFIP Series, 276: 297-306. Britos, P., Hossian, A., García-Martinez, R. y Sierra, E. (2005). Minería de Datos Basada en Sistemas Inteligentes. Editorial Nueva Librería. ISBN 987-110430-8. Britos, P., Hossian, A., García-Martinez, R. y Sierra, E. 2005. Minería de Datos Basada en Sistemas Inteligentes. Editorial Nueva Librería. ISBN 987-1104-30-8. Britos, P., Jiménez Rey, E., García-Martínez, E. (2008). Work in Progress: Programming Misunderstandings Discovering Process Based On Intelligent Data Mining Tools Proceedings 38th ASEE/IEEE Frontiers in Education Conference (en prensa). Britos, P., Merlino, H., Fernández, E., Ochoa, M., Diez, E. y García Martínez, R. (2006). Tool Selection Methodology in Data Mining. Proceedings V IberoAmerican Symposium on Software Engineering. Pág. 85-90. Cersósimo, D., Ravazoli, C., García-Martínez, R. (2005). Inversión Sísmica de un Modelo Teórico Calculado Sobre un Horizonte Sísmico Utilizando Redes Neuronales. Boletín de Informaciones Petroleras 1(1): 44-51. Cersosimo, S., Ravazzoli, C., García-Martínez, R. (2006). Identification of Velocity Variations in a Seismic Cube Using Neural Networks. En Professional Practice in Artificial Intelligence, eds. J. Debenham, (Boston: Springer), IFIP Series, 218: 11-19. -5- Cogliati, M., Britos, P., García-Martínez, R. 2006. Patterns in Temporal Series of Meteorological Variables Using SOM & TDIDT. En Artificial Intelligence and Practice II, Max Bramer Ed. (Boston: Springer), IFIP Series, 217: 305314. Ferrero, G., Britos, P., García-Martínez, R. 2006. Detection of Breast Lesions in Medical Digital Imaging Using Neural Networks. En Professional Practice in Artificial Intelligence, John Debenham Ed. (Boston: Springer), IFIP Series, 218: 1-10. Giudici, P., Figini, S. 2009. Applied Data Mining for Business and Industry. Wiley & Sons Kantardzic, M. 2009. Data Mining: Concepts, Models, Methods, and Algorithms. Wiley & Sons. Linoff, G., Berry. M. 2009. Data Mining Techniques: For Marketing, Sales, and CustomerRelationship Management. Wiley & Sons Liu, B. 2009. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data (Data-Centric Systems and Applications), Springer-Verlag Ochoa, A. (2005). Propuesta de Técnicas de Protofase Metodológica para la Compresión del Negocio. Reportes Técnicos de Ingeniería del Software, 7(1): 21-25. Rancán, C., Pesado, P. y García-Martínez, R. (2007). Toward Integration of Knowledge Based Systems and Knowledge Discovery Systems. Journal of Computer Science & Technology, 7(1): 91-97. ISSN 1666-6038. Russell, M. 2009. Mining the Social Web: Analyzing Data from Facebook, Twitter, LinkedIn, and Other Social Media Sites. O´Reilly Media -6-
© Copyright 2024