Inteligencia de Negocios

Inteligencia de Negocios
Lenin Alevski Huerta Arias A01063834
José Pablo Arciga Aragón A01062487
Filiberto Villagómez González A01063318
S
S Es conocida como la habilidad de trasformar datos e información
en conocimiento de forma que se pueda optimizar el proceso de
toma de decisiones en los negocios.
Datos
S Es un pequeño trozo de información que no tiene
significado o no nos es útil.
S 5 , 2, 4.0
Información
S En sentido
general, la información es un conjunto
organizado de datos procesados, que constituyen un
mensaje que cambia el estado de conocimiento del sujeto o
sistema que recibe dicho mensaje.
Conocimiento
S El conocimiento es un conjunto de información almacenada
mediante la experiencia o el aprendizaje (a posteriori), o a
través de la introspección (a priori). En el sentido más
amplio del término, se trata de la posesión de múltiples
datos interrelacionados que, al ser tomados por sí solos,
poseen un menor valor cualitativo.
Análisis de Canasta de Mercado
S Los esquemas de ventas al por menor nos dicen lo que fue
comprado en cada tienda y bajo que condiciones. No
obstante, este esquema no nos permite analizar fácilmente
que productos fueron vendidos juntos en la misma canasta
de mercado. El análisis de la canasta de mercado nos da una
idea de cómo comercializar varias combinaciones de
productos. Por ejemplo: si la pasta congelada se vende bien
en conjunto con refrescos, entonces estos 2 productos
deberían estar colocados cerca en el supermercado o
comercializados con precios complementarios.
Ejemplo
S El concepto del análisis de la canasta de mercado puede
extenderse fácilmente a otras situaciones. En la industria de la
manufactura, por ejemplo, es útil para ver qué productos se
ordenan juntos, porque la empresa podría querer ofrecer paquetes
de productos con precio de paquete.
S La tabla de hechos de ventas al por menor no puede ser usada
fácilmente para realizar análisis de canasta de mercado ya que en
las bases de datos relacionales simples, no fueron diseñadas para
este propósito. Las herramientas para la minería de datos y las
técnicas OLAP nos pueden ayudar para el análisis de la canasta
de mercado.
Inteligencia de negocios
( informática)
Desde un punto más asociado con los sistemas de información
podemos redefinir esta definición y decir que la Inteligencia de
Negocios es un conjunto de tecnologías, aplicaciones y
metodologías que permiten reunir, depurar y trasformar los
datos de los sistemas transaccionales
e información
desestructurada, para la explotación directa de (reportes, análisis
OLTP/OLAP, aletas).
Entre las herramientas de bases de datos encontradas en el apartado
de la inteligencia de negocios se encuentran:
S La minería de datos
S Las herramientas OLAP
S Data Warehouses
S Data Marts
S Query & Report
S Las funcionalidades de estas herramientas son complementarias
y están muy relacionadas entre sí. El Data Warehousing nos
proporciona almacenamiento eficiente, mantenimiento y
recuperación de datos históricos. OLAP es un servicio que
proporciona respuestas rápidas a consultas ad hoc a diferencia
del data warehouse. Los algoritmos empleados en La minería de
datos se encargan de encontrar patrones en los datos y de
reportar modelos al usuario final.
S Estas 3 herramientas se relacionan con la manera en que los
datos en un Data Warehouse son lógicamente organizados, y el
rendimiento es altamente sensible a las técnicas utilizadas para el
diseño de la base de datos. [Barquin and Edelstein, 1997].
Data Warehouse
S Un Data Warehouse (DW) o almacén de datos es una
colección de datos que es extraída desde diferentes fuentes
de información a lo largo de la empresa (bases de datos
departamentales, intranet, sistemas transaccionales, etc.)
con la finalidad de permitir la realización de consultas y
análisis, fundamentalmente, para ayudar a la toma de
decisiones.
Data Warehouse
S Un sistema de DW apunta a disponer de una visión única
de los clientes y proveer la mayor cantidad posible de
información a los usuarios de la empresa, facilitándose el
monitoreo del negocio.
Data Warehouse
S Los datos del DW poseen algunas cualidades fundamentales. La
primera de ellas es que están orientados a temas, diferenciándose así
de los sistemas transaccionales que estructuran los datos en procesos
funcionales.
S Por otro lado, se trata de datos integrados, es decir, están
consolidados, lo cual supone un proceso previo de depuración y
homogeneización, etapa que puede ser una de las más complejas al
implementar un DW. Por último, los datos son historiados, ya que
mantienen el registro histórico de sus valores, lo cual redunda en que,
a diferencia de los sistemas transaccionales, no sean “volátiles”.
Data Mart
S
Aunque para algunos se trata casi de un sinónimo de Data Warehouse, un
Data Mart o cubo de datos puede entenderse como un subconjunto del
repositorio de datos, que se orienta a un área específica del negocio, como
recursos humanos, ventas o marketing, por ejemplo. En otras palabras, un
Data Mart corresponde a un almacén de datos más restringido que un DW en
cuanto al volumen de datos que contiene y al alcance dentro de la
organización.
S
Desde ese punto de vista, se trata de un repositorio que requiere menores
costos y tiempo para construirse respecto de un DW, teniendo en común el
que ambos permiten la realización de consultas, a través del uso de las
herramientas OLAP.
Herramientas OLAP
S OLAP
(Online Analytical Processing) son un conjunto de
herramientas capaces de responder rápida y ágilmente a las
solicitudes de información de los usuarios y que deben reflejar
cualquier lógica de negocio por las que se consulte.
S En contraste con los sistemas transaccionales, OLTP (Online
Transaction Processing), las herramientas OLAP presentan
información multidimensional, es decir, desde múltiples perspectivas.
Del mismo modo, los sistemas analíticos, al igual que los datos del
Data Warehouse, están orientados a temas, y no sólo operan con
datos actuales, sino también con datos históricos.
Herramientas OLAP
S Una de las principales cualidades de las herramientas de
OLAP es identificar tendencias, es decir, permiten apoyar la
toma decisiones considerando diversas variables, así como
también permiten identificar cambios en las preferencias de
los clientes. Sin embargo, aunque pueden responder
consultas complejas y ratificar información, lo hacen
siempre dependiendo del usuario, que es quien define las
relaciones a considerar.
Que es OLAP
S
OLAP o Proceso analítico en línea es el nombre formal para el análisis de
cubos multidimensionales - una forma mas intuitiva de ver la información
empresarial.
S
Con OLAP se puede ver un conjunto de datos de su negocio de muchas y
diversas formas sin mucho esfuerzo. Los archivos OLAP o cubos
modelan los datos en dimensiones. Una dimensión es una clasificación de
alguna actividad en una organización por la cual se puede medir su éxito.
Por ejemplo, puede monitorear sus ventas contra los productos o clientes
en un periodo de tiempo.
S
Hay dos clases de dimensiones que se pueden utilizar, dimensiones
regulares y dimensión de medida.
OLAP: Cubo OLAP
S es una base de datos multidimensional, en la cual el
almacenamiento físico de los datos se realiza en un vector
multidimensional. Los cubos OLAP se pueden considerar
como una ampliación de las dos dimensiones de una hoja
de cálculo.
Ejemplo de aplicacion de cubo
OLAP
S
Un analista financiero podría querer ver los datos de diversas formas, por
ejemplo, visualizándolos en función de todas las ciudades (que podrían
figurar en el eje de abscisas) y todos los productos (en el eje de
ordenadas), y esto podría ser para un período determinado, para la
versión y el tipo de gastos. Después de haber visto los datos de esta forma
particular el analista podría entonces querer ver los datos de otra manera
y poder hacerlo de forma inmediata. El cubo podría adoptar una nueva
orientación para que los datos aparezcan ahora en función de los
períodos y el tipo de costo. Debido a que esta reorientación implica
resumir una cantidad muy grande de datos, esta nueva vista de los datos
se debe generar de manera eficiente para no malgastar el tiempo del
analista, es decir, en cuestión de segundos, en lugar de las horas que
serían necesarias en una base de datos relacional convencional.
OLAP: Dimenciones regulares
S
Son aquellos datos que se quieren medir, por ejemplo, si desea seguir el
control de sus ventas, puede utilizar:
S
Clientes: ¿Quiénes son los mejores, donde se encuentran, que es lo que
compran?
S
Productos: ¿Con respecto a los clientes, quien los compra? ¿Qué
productos se están vendiendo?
S
Tiempo: ¿Cómo voy ahora con respecto al ultimo año o último mes?
OLAP: Dimensiones Regulares
S En otro tipo de aplicaciones, por ejemplo cuentas por cobrar, se
pueden utilizar dimensiones como el Tiempo para llevar control
del vencimiento de sus documentos. En contabilidad, una
dimensión podría ser su catalogo de cuentas, etc.
S Estas dimensiones se conforman de elementos que están
dispuestos en niveles jerárquicos o simplemente niveles. Los
niveles pueden ser por ejemplo, país, estado, ciudad. Se puede
navegar a través de esta jerarquía a través de los niveles o a través
de sus elementos.
OLAP: Dimensión de medida
S Son los números que aparecen en el análisis dependiendo de
los elementos seleccionados en las dimensiones regulares.
Por ejemplo, en un cubo de ventas, podríamos escoger ver
las ventas, el número de artículos vendidos, ganancia, costo,
etc.
OLAP: Dimensión de medida
S Una vez que se tienen estos datos, se pueden poner en una
estructura de datos altamente sofisticada que se llama cubo
multidimensional. Este cubo puede residir en una base de
datos sofisticada como Microsoft Analysis Services o en
archivos independientes. Este cubo le permitirá analizar su
información de la manera que desee. Usted podrá cruzar
todas las dimensiones para obtener nueva información que
responderá a las preguntas que hace y le permitirá tomar
mejores decisiones.
Microsoft Analysis Services
S Microsoft SQL Server Analysis Services es parte de
Microsoft SQL Server, un sistema de gestión de bases de
datos. Microsoft ha incluido una serie de servicios de SQL
Server relacionados con la inteligencia empresarial y
almacenamiento de datos. Estos servicios incluyen servicios
de integración y servicios de análisis. El servicio de análisis
incluye un conjunto de capacidades OLAP y de minería de
datos.
OLAP: Operaciones basicas.
Hay dos
operaciones básicas
que se pueden
realizar en un cubo
OLAP:
S Rotar y
Rebanar
S Taladrar o
Drilling
OLAP: Rotar y Rebanar
S Usted puede cambiar las dimensiones del cubo que esta
viendo y obtener una nueva vista de información. Por
ejemplo, 'Ventas por producto' puede cambiarse fácilmente a
'Ventas por vendedor'. Rebanar es cambiar el valor de una
dimensión por otro valor, por ejemplo, de las ventas de
Enero a las ventas de Febrero. Rotar es aventar el cubo
como si fuera un dado para obtener una nueva cara del cubo
OLAP: Taladrar o Drilling
S Los datos de las dimensiones se pueden abrir para obtener
mas detalle. Una especie de taladro que se hunde mas en la
información. Si usted ve información geográfica, puede
pasar de un continente a un país y luego a una ciudad en
particular.
S Con esta simple combinación de cosas, se puede abrir la
información generada por un negocio o información
corporativa para todos el personal tomador de decisiones en
formas que antes no era posible realizarlo.
Los sistemas OLAP deben:
S Soportar requerimientos complejos de análisis
S Analizar datos desde diferentes perspectivas
S Soportar análisis complejos contra un volumen ingente de
datos
Data Mining
S El Data Mining (DM) o minería de datos es una técnica
orientada a extraer información desde grandes volúmenes
de datos y corresponde a una de las claves de la inteligencia
de negocios. El DM es un proceso conocido como KDD
(Knowledge Discovery in Databases) que consta de tres
fases: preparación de los datos, extracción de información e
interpretación de los resultados.
Data Mining
S Normalmente, el DM se realiza con las llamadas “técnicas de
verificación” -en donde se prueba una hipótesis del usuario- y los
“métodos de descubrimiento” -búsqueda de patrones (incluyendo
las técnicas de predicción)-. Lo anterior se traduce en análisis
exploratorios, los cuales se apoyan en herramientas de
visualización de datos y construcción de modelos, con el objetivo
de realizar predicciones utilizando los patrones detectados en los
datos conocidos con información del pasado. De allí que el DM
no es una herramienta orientada sólo a las asociaciones
estadísticas, sino una tecnología que es fundamentalmente
prospectiva, esto es, que permite descubrir nuevos factores,
tendencias y asociaciones desconocidas previamente, llegando
incluso a ser predictiva.
S Los modelos de minería de datos, se usan con éxito en
aplicaciones de control de procesos productivos, como
herramienta de ayuda a la planificación y a la decisión
en marketing, finanzas, etc.
S Asimismo, la minería de datos es fundamental en la
investigación científica y técnica, como herramienta de
análisis y descubrimiento de conocimiento a partir de
datos de observación o de resultados de experimentos.
Protocolo de un proyecto de
minería de datos
Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente:
S
Comprensión del negocio y del problema que se quiere resolver.
S
Determinación, obtención y limpieza de los datos necesarios.
S
Creación de modelos matemáticos.
S
Validación, comunicación, etc. de los resultados obtenidos.
S
Integración, si procede, de los resultados en un sistema transaccional o similar.
S
A través de la experiencia acumulada en proyectos de minería de datos se han ido
desarrollando metodologías que permiten gestionar esta complejidad de una
manera más o menos uniforme.
Proceso general del Data
mining
S Selección del conjunto de datos
S Análisis de las propiedades de los datos
S Transformación del conjunto de datos de entrada
S Seleccionar y aplicar la técnica de minería de datos
S Extracción de conocimiento
S Interpretación y evaluación de datos
DM: Selección del conjunto de
datos
S Datos, tanto en lo que se refiere a las variables objetivo
(aquellas que se quiere predecir, calcular o inferir), como a
las variables independientes (las que sirven para hacer el
cálculo o proceso), como posiblemente al muestreo de los
registros disponibles.
DM: Análisis de las propiedades de
los datos
S En especial los histogramas, diagramas de dispersión,
presencia de valores atípicos y ausencia de datos (valores
nulos).
DM: Transformación del conjunto
de datos de entrada
S Se realizará de diversas formas en función del análisis
previo, con el objetivo de prepararlo para aplicar la técnica
de minería de datos que mejor se adapte a los datos y al
problema, a este paso también se le conoce como
preprocesamiento de los datos
DM: Seleccionar y aplicar la técnica
de minería de datos
Se construye:
S Modelo predictivo.
S Modelo de clasificación .
S Modelo de segmentación.
DM: Modelo predictivo
S Los modelos predictivos permiten estimar cual es el
comportamiento esperado del cliente utilizando los datos de
uso de los servicios.
DM: Extracción de conocimiento
S Mediante una técnica de minería de datos, se obtiene un
modelo de conocimiento, que representa patrones de
comportamiento observados en los valores de las variables
del problema o relaciones de asociación entre dichas
variables. También pueden usarse varias técnicas a la vez
para generar distintos modelos, aunque generalmente cada
técnica obliga a un preprocesado diferente de los datos
DM: Técnicas de minería de
datos
S Las técnicas de la minería de datos provienen de la
Inteligencia artificial y de la estadística, dichas técnicas, no
son más que algoritmos, más o menos sofisticados que se
aplican sobre un conjunto de datos para obtener unos
resultados.
DM: técnicas más representativas
S Redes neuronales
S Regresión lineal
S Árboles de decisión
S Modelos estadísticos
S Agrupamiento o Clustering
Redes neuronales
S Son un paradigma de aprendizaje y procesamiento automático
inspirado en la forma en que funciona el sistema nervioso de los
animales. Se trata de un sistema de interconexión de neuronas en
una red que colabora para producir un estímulo de salida.
Algunos ejemplos de red neuronal son:
S El Perceptrón.
S El Perceptrón multicapa.
S Los Mapas Autoorganizados, también conocidos como redes de
Kohonen.
DM: Regresión lineal
S Es la técnica más utilizada para formar relaciones entre
datos. Rápida y eficaz pero insuficiente en espacios
multidimensionales donde puedan relacionarse más de 2
variables.
DM: Árboles de decisión
S Un árbol de decisión es un modelo de predicción utilizado
en el ámbito de la inteligencia artificial, dada una base de
datos se construyen estos diagramas de construcciones
lógicas, muy similares a los sistemas de predicción basados
en reglas, que sirven para representar y categorizar una serie
de condiciones que suceden de forma sucesiva, para la
resolución de un problema.
Ejemplos de algoritmos de Árboles
de decisión
S Algoritmo ID3
S Algoritmo C4.5
Algoritmo ID3
S El algoritmo ID3 es utilizado dentro del ámbito de la inteligencia
artificial. Su uso se engloba en la búsqueda de hipótesis o reglas en él,
dado un conjunto de ejemplos.
S El conjunto de ejemplos deberá estar conformado por una serie de
tuplas de valores, cada uno de ellos denominados atributos, en el que
uno de ellos, ( el atributo a clasificar ) es el objetivo, el cual es de tipo
binario ( positivo o negativo, si o no, válido o inválido, etc. ).
S De esta forma el algoritmo trata de obtener las hipótesis que
clasifiquen ante nuevas instancias, si dicho ejemplo va a ser positivo o
negativo.
S ID3 realiza esta labor mediante la construcción de un árbol de
decisión.
DM: Modelos estadísticos
S Es una expresión simbólica en forma de igualdad o
ecuación que se emplea en todos los diseños experimentales
y en la regresión para indicar los diferentes factores que
modifican la variable de respuesta.
DM: Agrupamiento o Clustering
S Es un procedimiento de agrupación de una serie de vectores
según criterios habitualmente de distancia; se tratará de
disponer los vectores de entrada de forma que estén más
cercanos aquellos que tengan características comunes.
Ejemplos:
S Algoritmo K-means.
S Algoritmo K-medoids.
DM: Extracción de conocimiento
S Mediante una técnica de minería de datos, se obtiene un
modelo de conocimiento, que representa patrones de
comportamiento observados en los valores de las variables
del problema o relaciones de asociación entre dichas
variables. También pueden usarse varias técnicas a la vez
para generar distintos modelos, aunque generalmente cada
técnica obliga a un preprocesado diferente de los datos
DM: Interpretación y evaluación de
datos
S Una vez obtenido el modelo, se debe proceder a su
validación comprobando que las conclusiones que arroja
son válidas y suficientemente satisfactorias. En el caso de
haber obtenido varios modelos mediante el uso de distintas
técnicas, se deben comparar los modelos en busca de aquel
que se ajuste mejor al problema. Si ninguno de los modelos
alcanza los resultados esperados, debe alterarse alguno de
los pasos anteriores para generar nuevos modelos
Ejemplos de uso de la minería de
datos
S
Negocios
S
Hábitos de compra en supermercados
S
Patrones de fuga
S
Fraudes
S
Recursos humanos
S
Comportamiento en Internet
S
Terrorismo
S
Juegos
S
Ciencia e Ingeniería
S
Genética
S
Análisis de gases
Query & Report
S Las herramientas de Query (consulta) y Report (reporte)
son quizá las más conocidas en este ámbito, ya que son
fundamentales para el desarrollo y manejo de listados e
informes basados en la información presente en los
almacenes de datos y Data Marts.
Valor estratégico de la inteligencia
de negocios
S Tradicionalmente, el BI ha sido visto como una herramienta para
distribuir información, sin embargo, hoy está tomando un rol más
estratégico, siendo considerado por los especialistas como una
herramienta fundamental para la transformación del negocio, para
innovar y generar ventajas competitivas. Para ello, en los próximos
años los proyectos de este tipo apuntarán más decididamente a
llevar información de valor a un mayor número de miembros de la
organización y a visualizarlas como un apoyo a la interconexión
con clientes, proveedores y socios de negocios.
Principales Aplicaciones
Esto actúa como un factor necesario en las empresas hoy en
día ya que es considerado información privilegiada para responder a los
problemas de negocio (entradas de nuevos mercados, control financiero,
etc.), los principales productos de la inteligencia de negocios son:
S Cuadros de mando integrales (mirada global del negocio).
S Sistemas de soporte de decisión ( Sistema que sirve de apoyo en la toma de
desiciones).
S Sistemas de información ejecutiva(Herramienta de BI monitoriza el estado
de las variables de un area de la empresa apartir de informacion externa o interna).
Actúa sobre..
Los principales componentes
que integran hoy en día la
inteligencia de negocios son:
S
Una solución de inteligencia
de negocios completa nos
permite:
S
Observar ¿qué está
ocurriendo?
S
Datamart
S
Comprender ¿por qué ocurre?
S
Data Warehouse
S
Predecir ¿qué ocurriría?
S
Colaborar ¿qué debería hacer
el equipo?
S
Decidir ¿qué camino se debe
seguir?
Inteligencia de negocios atreves del
tiempo
Arquitectura
Retroalimentación de la BI
La Inteligencia de negocios es esencialmente una ciencia de la
economía, de acuerdo con el método científico. Esto significa que
se basa en los datos en lugar de simples conjeturas. Estos datos son
recolectados usando justa, exacta, imparcial medios, y
organizados de una manera lógica con el fin de producir los
mejores resultados.
Bibliografía
S
Teorey, Toby J. Database modeling & design : logical design. San Francisco, Cal. :
Morgan Kaufmann Publishers, 2006.
S
Kimball, Ralph. The data warehouse toolkit : The complete guide to
dimensional modeling. New York, N.Y. : Wiley, c2002
S
http://www.cientec.com/analisis/ana-claves.html
S
http://www.mitecnologico.com/Main/Introspeccion
Biblioteca Digital
S
http://0delivery.acm.org.millenium.itesm.mx/10.1145/1460000/1452578/a11sell.pdf ?ip=200.34.202.224&CFID=42779719&CFTOKEN=85566243&__ac
m__=1316112831_49ca913571de7c32aee07ceb571c8d4d
S
http://0delivery.acm.org.millenium.itesm.mx/10.1145/1970000/1966890/p12park.pdf ?ip=200.34.202.224&CFID=42779719&CFTOKEN=85566243&__a
cm__=1316113077_9be4b3375928e9e7ae371620a711328a
S
http://0delivery.acm.org.millenium.itesm.mx/10.1145/1460000/1452575/a8van_damme.pdf ?ip=200.34.202.224&CFID=42779719&CFTOKEN=855662
43&__acm__=1316113134_8a666acbdda10b8fbd59881bc1f7e416
Bibliografía
S http://www.sitcorp.com/?p=31
S http://www.olapxsoftware.com/es/WhatIsOlap.asp
S http://www.slideshare.net/davidreyblanco/qu-es-un-
modelo-predictivo-y-para-qu-vale
S http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#P
roceso
S http://es.wikipedia.org/wiki/Perceptr%C3%B3n