Inteligencia de Negocios Lenin Alevski Huerta Arias A01063834 José Pablo Arciga Aragón A01062487 Filiberto Villagómez González A01063318 S S Es conocida como la habilidad de trasformar datos e información en conocimiento de forma que se pueda optimizar el proceso de toma de decisiones en los negocios. Datos S Es un pequeño trozo de información que no tiene significado o no nos es útil. S 5 , 2, 4.0 Información S En sentido general, la información es un conjunto organizado de datos procesados, que constituyen un mensaje que cambia el estado de conocimiento del sujeto o sistema que recibe dicho mensaje. Conocimiento S El conocimiento es un conjunto de información almacenada mediante la experiencia o el aprendizaje (a posteriori), o a través de la introspección (a priori). En el sentido más amplio del término, se trata de la posesión de múltiples datos interrelacionados que, al ser tomados por sí solos, poseen un menor valor cualitativo. Análisis de Canasta de Mercado S Los esquemas de ventas al por menor nos dicen lo que fue comprado en cada tienda y bajo que condiciones. No obstante, este esquema no nos permite analizar fácilmente que productos fueron vendidos juntos en la misma canasta de mercado. El análisis de la canasta de mercado nos da una idea de cómo comercializar varias combinaciones de productos. Por ejemplo: si la pasta congelada se vende bien en conjunto con refrescos, entonces estos 2 productos deberían estar colocados cerca en el supermercado o comercializados con precios complementarios. Ejemplo S El concepto del análisis de la canasta de mercado puede extenderse fácilmente a otras situaciones. En la industria de la manufactura, por ejemplo, es útil para ver qué productos se ordenan juntos, porque la empresa podría querer ofrecer paquetes de productos con precio de paquete. S La tabla de hechos de ventas al por menor no puede ser usada fácilmente para realizar análisis de canasta de mercado ya que en las bases de datos relacionales simples, no fueron diseñadas para este propósito. Las herramientas para la minería de datos y las técnicas OLAP nos pueden ayudar para el análisis de la canasta de mercado. Inteligencia de negocios ( informática) Desde un punto más asociado con los sistemas de información podemos redefinir esta definición y decir que la Inteligencia de Negocios es un conjunto de tecnologías, aplicaciones y metodologías que permiten reunir, depurar y trasformar los datos de los sistemas transaccionales e información desestructurada, para la explotación directa de (reportes, análisis OLTP/OLAP, aletas). Entre las herramientas de bases de datos encontradas en el apartado de la inteligencia de negocios se encuentran: S La minería de datos S Las herramientas OLAP S Data Warehouses S Data Marts S Query & Report S Las funcionalidades de estas herramientas son complementarias y están muy relacionadas entre sí. El Data Warehousing nos proporciona almacenamiento eficiente, mantenimiento y recuperación de datos históricos. OLAP es un servicio que proporciona respuestas rápidas a consultas ad hoc a diferencia del data warehouse. Los algoritmos empleados en La minería de datos se encargan de encontrar patrones en los datos y de reportar modelos al usuario final. S Estas 3 herramientas se relacionan con la manera en que los datos en un Data Warehouse son lógicamente organizados, y el rendimiento es altamente sensible a las técnicas utilizadas para el diseño de la base de datos. [Barquin and Edelstein, 1997]. Data Warehouse S Un Data Warehouse (DW) o almacén de datos es una colección de datos que es extraída desde diferentes fuentes de información a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realización de consultas y análisis, fundamentalmente, para ayudar a la toma de decisiones. Data Warehouse S Un sistema de DW apunta a disponer de una visión única de los clientes y proveer la mayor cantidad posible de información a los usuarios de la empresa, facilitándose el monitoreo del negocio. Data Warehouse S Los datos del DW poseen algunas cualidades fundamentales. La primera de ellas es que están orientados a temas, diferenciándose así de los sistemas transaccionales que estructuran los datos en procesos funcionales. S Por otro lado, se trata de datos integrados, es decir, están consolidados, lo cual supone un proceso previo de depuración y homogeneización, etapa que puede ser una de las más complejas al implementar un DW. Por último, los datos son historiados, ya que mantienen el registro histórico de sus valores, lo cual redunda en que, a diferencia de los sistemas transaccionales, no sean “volátiles”. Data Mart S Aunque para algunos se trata casi de un sinónimo de Data Warehouse, un Data Mart o cubo de datos puede entenderse como un subconjunto del repositorio de datos, que se orienta a un área específica del negocio, como recursos humanos, ventas o marketing, por ejemplo. En otras palabras, un Data Mart corresponde a un almacén de datos más restringido que un DW en cuanto al volumen de datos que contiene y al alcance dentro de la organización. S Desde ese punto de vista, se trata de un repositorio que requiere menores costos y tiempo para construirse respecto de un DW, teniendo en común el que ambos permiten la realización de consultas, a través del uso de las herramientas OLAP. Herramientas OLAP S OLAP (Online Analytical Processing) son un conjunto de herramientas capaces de responder rápida y ágilmente a las solicitudes de información de los usuarios y que deben reflejar cualquier lógica de negocio por las que se consulte. S En contraste con los sistemas transaccionales, OLTP (Online Transaction Processing), las herramientas OLAP presentan información multidimensional, es decir, desde múltiples perspectivas. Del mismo modo, los sistemas analíticos, al igual que los datos del Data Warehouse, están orientados a temas, y no sólo operan con datos actuales, sino también con datos históricos. Herramientas OLAP S Una de las principales cualidades de las herramientas de OLAP es identificar tendencias, es decir, permiten apoyar la toma decisiones considerando diversas variables, así como también permiten identificar cambios en las preferencias de los clientes. Sin embargo, aunque pueden responder consultas complejas y ratificar información, lo hacen siempre dependiendo del usuario, que es quien define las relaciones a considerar. Que es OLAP S OLAP o Proceso analítico en línea es el nombre formal para el análisis de cubos multidimensionales - una forma mas intuitiva de ver la información empresarial. S Con OLAP se puede ver un conjunto de datos de su negocio de muchas y diversas formas sin mucho esfuerzo. Los archivos OLAP o cubos modelan los datos en dimensiones. Una dimensión es una clasificación de alguna actividad en una organización por la cual se puede medir su éxito. Por ejemplo, puede monitorear sus ventas contra los productos o clientes en un periodo de tiempo. S Hay dos clases de dimensiones que se pueden utilizar, dimensiones regulares y dimensión de medida. OLAP: Cubo OLAP S es una base de datos multidimensional, en la cual el almacenamiento físico de los datos se realiza en un vector multidimensional. Los cubos OLAP se pueden considerar como una ampliación de las dos dimensiones de una hoja de cálculo. Ejemplo de aplicacion de cubo OLAP S Un analista financiero podría querer ver los datos de diversas formas, por ejemplo, visualizándolos en función de todas las ciudades (que podrían figurar en el eje de abscisas) y todos los productos (en el eje de ordenadas), y esto podría ser para un período determinado, para la versión y el tipo de gastos. Después de haber visto los datos de esta forma particular el analista podría entonces querer ver los datos de otra manera y poder hacerlo de forma inmediata. El cubo podría adoptar una nueva orientación para que los datos aparezcan ahora en función de los períodos y el tipo de costo. Debido a que esta reorientación implica resumir una cantidad muy grande de datos, esta nueva vista de los datos se debe generar de manera eficiente para no malgastar el tiempo del analista, es decir, en cuestión de segundos, en lugar de las horas que serían necesarias en una base de datos relacional convencional. OLAP: Dimenciones regulares S Son aquellos datos que se quieren medir, por ejemplo, si desea seguir el control de sus ventas, puede utilizar: S Clientes: ¿Quiénes son los mejores, donde se encuentran, que es lo que compran? S Productos: ¿Con respecto a los clientes, quien los compra? ¿Qué productos se están vendiendo? S Tiempo: ¿Cómo voy ahora con respecto al ultimo año o último mes? OLAP: Dimensiones Regulares S En otro tipo de aplicaciones, por ejemplo cuentas por cobrar, se pueden utilizar dimensiones como el Tiempo para llevar control del vencimiento de sus documentos. En contabilidad, una dimensión podría ser su catalogo de cuentas, etc. S Estas dimensiones se conforman de elementos que están dispuestos en niveles jerárquicos o simplemente niveles. Los niveles pueden ser por ejemplo, país, estado, ciudad. Se puede navegar a través de esta jerarquía a través de los niveles o a través de sus elementos. OLAP: Dimensión de medida S Son los números que aparecen en el análisis dependiendo de los elementos seleccionados en las dimensiones regulares. Por ejemplo, en un cubo de ventas, podríamos escoger ver las ventas, el número de artículos vendidos, ganancia, costo, etc. OLAP: Dimensión de medida S Una vez que se tienen estos datos, se pueden poner en una estructura de datos altamente sofisticada que se llama cubo multidimensional. Este cubo puede residir en una base de datos sofisticada como Microsoft Analysis Services o en archivos independientes. Este cubo le permitirá analizar su información de la manera que desee. Usted podrá cruzar todas las dimensiones para obtener nueva información que responderá a las preguntas que hace y le permitirá tomar mejores decisiones. Microsoft Analysis Services S Microsoft SQL Server Analysis Services es parte de Microsoft SQL Server, un sistema de gestión de bases de datos. Microsoft ha incluido una serie de servicios de SQL Server relacionados con la inteligencia empresarial y almacenamiento de datos. Estos servicios incluyen servicios de integración y servicios de análisis. El servicio de análisis incluye un conjunto de capacidades OLAP y de minería de datos. OLAP: Operaciones basicas. Hay dos operaciones básicas que se pueden realizar en un cubo OLAP: S Rotar y Rebanar S Taladrar o Drilling OLAP: Rotar y Rebanar S Usted puede cambiar las dimensiones del cubo que esta viendo y obtener una nueva vista de información. Por ejemplo, 'Ventas por producto' puede cambiarse fácilmente a 'Ventas por vendedor'. Rebanar es cambiar el valor de una dimensión por otro valor, por ejemplo, de las ventas de Enero a las ventas de Febrero. Rotar es aventar el cubo como si fuera un dado para obtener una nueva cara del cubo OLAP: Taladrar o Drilling S Los datos de las dimensiones se pueden abrir para obtener mas detalle. Una especie de taladro que se hunde mas en la información. Si usted ve información geográfica, puede pasar de un continente a un país y luego a una ciudad en particular. S Con esta simple combinación de cosas, se puede abrir la información generada por un negocio o información corporativa para todos el personal tomador de decisiones en formas que antes no era posible realizarlo. Los sistemas OLAP deben: S Soportar requerimientos complejos de análisis S Analizar datos desde diferentes perspectivas S Soportar análisis complejos contra un volumen ingente de datos Data Mining S El Data Mining (DM) o minería de datos es una técnica orientada a extraer información desde grandes volúmenes de datos y corresponde a una de las claves de la inteligencia de negocios. El DM es un proceso conocido como KDD (Knowledge Discovery in Databases) que consta de tres fases: preparación de los datos, extracción de información e interpretación de los resultados. Data Mining S Normalmente, el DM se realiza con las llamadas “técnicas de verificación” -en donde se prueba una hipótesis del usuario- y los “métodos de descubrimiento” -búsqueda de patrones (incluyendo las técnicas de predicción)-. Lo anterior se traduce en análisis exploratorios, los cuales se apoyan en herramientas de visualización de datos y construcción de modelos, con el objetivo de realizar predicciones utilizando los patrones detectados en los datos conocidos con información del pasado. De allí que el DM no es una herramienta orientada sólo a las asociaciones estadísticas, sino una tecnología que es fundamentalmente prospectiva, esto es, que permite descubrir nuevos factores, tendencias y asociaciones desconocidas previamente, llegando incluso a ser predictiva. S Los modelos de minería de datos, se usan con éxito en aplicaciones de control de procesos productivos, como herramienta de ayuda a la planificación y a la decisión en marketing, finanzas, etc. S Asimismo, la minería de datos es fundamental en la investigación científica y técnica, como herramienta de análisis y descubrimiento de conocimiento a partir de datos de observación o de resultados de experimentos. Protocolo de un proyecto de minería de datos Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente: S Comprensión del negocio y del problema que se quiere resolver. S Determinación, obtención y limpieza de los datos necesarios. S Creación de modelos matemáticos. S Validación, comunicación, etc. de los resultados obtenidos. S Integración, si procede, de los resultados en un sistema transaccional o similar. S A través de la experiencia acumulada en proyectos de minería de datos se han ido desarrollando metodologías que permiten gestionar esta complejidad de una manera más o menos uniforme. Proceso general del Data mining S Selección del conjunto de datos S Análisis de las propiedades de los datos S Transformación del conjunto de datos de entrada S Seleccionar y aplicar la técnica de minería de datos S Extracción de conocimiento S Interpretación y evaluación de datos DM: Selección del conjunto de datos S Datos, tanto en lo que se refiere a las variables objetivo (aquellas que se quiere predecir, calcular o inferir), como a las variables independientes (las que sirven para hacer el cálculo o proceso), como posiblemente al muestreo de los registros disponibles. DM: Análisis de las propiedades de los datos S En especial los histogramas, diagramas de dispersión, presencia de valores atípicos y ausencia de datos (valores nulos). DM: Transformación del conjunto de datos de entrada S Se realizará de diversas formas en función del análisis previo, con el objetivo de prepararlo para aplicar la técnica de minería de datos que mejor se adapte a los datos y al problema, a este paso también se le conoce como preprocesamiento de los datos DM: Seleccionar y aplicar la técnica de minería de datos Se construye: S Modelo predictivo. S Modelo de clasificación . S Modelo de segmentación. DM: Modelo predictivo S Los modelos predictivos permiten estimar cual es el comportamiento esperado del cliente utilizando los datos de uso de los servicios. DM: Extracción de conocimiento S Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un preprocesado diferente de los datos DM: Técnicas de minería de datos S Las técnicas de la minería de datos provienen de la Inteligencia artificial y de la estadística, dichas técnicas, no son más que algoritmos, más o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados. DM: técnicas más representativas S Redes neuronales S Regresión lineal S Árboles de decisión S Modelos estadísticos S Agrupamiento o Clustering Redes neuronales S Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. Algunos ejemplos de red neuronal son: S El Perceptrón. S El Perceptrón multicapa. S Los Mapas Autoorganizados, también conocidos como redes de Kohonen. DM: Regresión lineal S Es la técnica más utilizada para formar relaciones entre datos. Rápida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse más de 2 variables. DM: Árboles de decisión S Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lógicas, muy similares a los sistemas de predicción basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema. Ejemplos de algoritmos de Árboles de decisión S Algoritmo ID3 S Algoritmo C4.5 Algoritmo ID3 S El algoritmo ID3 es utilizado dentro del ámbito de la inteligencia artificial. Su uso se engloba en la búsqueda de hipótesis o reglas en él, dado un conjunto de ejemplos. S El conjunto de ejemplos deberá estar conformado por una serie de tuplas de valores, cada uno de ellos denominados atributos, en el que uno de ellos, ( el atributo a clasificar ) es el objetivo, el cual es de tipo binario ( positivo o negativo, si o no, válido o inválido, etc. ). S De esta forma el algoritmo trata de obtener las hipótesis que clasifiquen ante nuevas instancias, si dicho ejemplo va a ser positivo o negativo. S ID3 realiza esta labor mediante la construcción de un árbol de decisión. DM: Modelos estadísticos S Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta. DM: Agrupamiento o Clustering S Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes. Ejemplos: S Algoritmo K-means. S Algoritmo K-medoids. DM: Extracción de conocimiento S Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un preprocesado diferente de los datos DM: Interpretación y evaluación de datos S Una vez obtenido el modelo, se debe proceder a su validación comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos Ejemplos de uso de la minería de datos S Negocios S Hábitos de compra en supermercados S Patrones de fuga S Fraudes S Recursos humanos S Comportamiento en Internet S Terrorismo S Juegos S Ciencia e Ingeniería S Genética S Análisis de gases Query & Report S Las herramientas de Query (consulta) y Report (reporte) son quizá las más conocidas en este ámbito, ya que son fundamentales para el desarrollo y manejo de listados e informes basados en la información presente en los almacenes de datos y Data Marts. Valor estratégico de la inteligencia de negocios S Tradicionalmente, el BI ha sido visto como una herramienta para distribuir información, sin embargo, hoy está tomando un rol más estratégico, siendo considerado por los especialistas como una herramienta fundamental para la transformación del negocio, para innovar y generar ventajas competitivas. Para ello, en los próximos años los proyectos de este tipo apuntarán más decididamente a llevar información de valor a un mayor número de miembros de la organización y a visualizarlas como un apoyo a la interconexión con clientes, proveedores y socios de negocios. Principales Aplicaciones Esto actúa como un factor necesario en las empresas hoy en día ya que es considerado información privilegiada para responder a los problemas de negocio (entradas de nuevos mercados, control financiero, etc.), los principales productos de la inteligencia de negocios son: S Cuadros de mando integrales (mirada global del negocio). S Sistemas de soporte de decisión ( Sistema que sirve de apoyo en la toma de desiciones). S Sistemas de información ejecutiva(Herramienta de BI monitoriza el estado de las variables de un area de la empresa apartir de informacion externa o interna). Actúa sobre.. Los principales componentes que integran hoy en día la inteligencia de negocios son: S Una solución de inteligencia de negocios completa nos permite: S Observar ¿qué está ocurriendo? S Datamart S Comprender ¿por qué ocurre? S Data Warehouse S Predecir ¿qué ocurriría? S Colaborar ¿qué debería hacer el equipo? S Decidir ¿qué camino se debe seguir? Inteligencia de negocios atreves del tiempo Arquitectura Retroalimentación de la BI La Inteligencia de negocios es esencialmente una ciencia de la economía, de acuerdo con el método científico. Esto significa que se basa en los datos en lugar de simples conjeturas. Estos datos son recolectados usando justa, exacta, imparcial medios, y organizados de una manera lógica con el fin de producir los mejores resultados. Bibliografía S Teorey, Toby J. Database modeling & design : logical design. San Francisco, Cal. : Morgan Kaufmann Publishers, 2006. S Kimball, Ralph. The data warehouse toolkit : The complete guide to dimensional modeling. New York, N.Y. : Wiley, c2002 S http://www.cientec.com/analisis/ana-claves.html S http://www.mitecnologico.com/Main/Introspeccion Biblioteca Digital S http://0delivery.acm.org.millenium.itesm.mx/10.1145/1460000/1452578/a11sell.pdf ?ip=200.34.202.224&CFID=42779719&CFTOKEN=85566243&__ac m__=1316112831_49ca913571de7c32aee07ceb571c8d4d S http://0delivery.acm.org.millenium.itesm.mx/10.1145/1970000/1966890/p12park.pdf ?ip=200.34.202.224&CFID=42779719&CFTOKEN=85566243&__a cm__=1316113077_9be4b3375928e9e7ae371620a711328a S http://0delivery.acm.org.millenium.itesm.mx/10.1145/1460000/1452575/a8van_damme.pdf ?ip=200.34.202.224&CFID=42779719&CFTOKEN=855662 43&__acm__=1316113134_8a666acbdda10b8fbd59881bc1f7e416 Bibliografía S http://www.sitcorp.com/?p=31 S http://www.olapxsoftware.com/es/WhatIsOlap.asp S http://www.slideshare.net/davidreyblanco/qu-es-un- modelo-predictivo-y-para-qu-vale S http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#P roceso S http://es.wikipedia.org/wiki/Perceptr%C3%B3n
© Copyright 2024