Este documento presenta una introducción a los conceptos clave de Business Intelligence. Explica que BI implica transformar datos de una organización en conocimiento para obtener ventajas competitivas mediante el uso de metodologías y tecnologías de integración de datos. Describe los componentes clave de un sistema BI como el almacén de datos, herramientas ETL y presentación de informes, y explica conceptos como OLTP, OLAP, dimensiones y hechos. También proporciona ejemplos de herramientas BI y cómo pueden aplicarse soluciones BI en diferentes
4. 1. SISTEMA OPERACIONAL
Generalmente, la información que se quiere
investigar sobre un cierto dominio de la
organización se encuentra en bases de datos
y otras fuentes muy diversas, tanto internas
como externas.
Muchas de estas fuentes son las que se
utilizan para el trabajo transaccional diario
(conocido como OLTP, On-Line Transactional
Processing).
Sobre estas mismas bases de datos de
trabajo ya se puede extraer conocimiento
(visión tradicional).
5. 1. SISTEMA OPERACIONAL
Problemas para realizar el análisis en este sistema
(OLTP):
La información se encuentra en varias y
heterogéneas bases de datos y, en consecuencia,
no se puede explotar en conjunto.
Solo es posible el análisis de los datos actuales, no
mantiene valores históricos para tratar evolutivos.
Se obstaculiza el trabajo transaccional diario de los
sistemas de información originales, no permite el
análisis on-line.
La base de datos está diseñada para el trabajo
transaccional, no para el análisis de los datos.
7. 2. DATAWAREHOUSE
Motivación:
Disponer de una base de
datos que permita extraer conocimiento
de la información histórica almacenada
en la organización.
Objetivos:
Análisis
de la organización
Previsiones de evolución
Diseño de estrategias
8. 2. DATAWAREHOUSE
Almacén de datos para el análisis y toma de
decisiones.
Permite realizar análisis on-line, por lo que
aumenta el poder de toma de decisiones por
parte de los responsables en cuestión
Unifica información dispersa de diversos
sistemas operacionales
Contiene la información relevante de la
organización
Diseños orientados a conceptos de negocio
manejados por el usuario
Sistema OLAP (On-Line Analitical Procesing)
10. 3. OLTP vs OLAP
Operacional (OLTP)
Datawarehouse (OLAP)
• Almacén de datos
actuales
• Almacena datos al
detalle
• Bases de datos medianas
• Los datos son actuales
• Los procesos son
repetitivos
• Tiempo de respuesta
pequeño
• Soporta decisiones diarias
• Almacén de datos
históricos
• Almacena datos al
detalle y datos
agregados a distintos
niveles
• Bases de datos grandes
• Los datos son estáticos
• Los procesos no son
previsibles
• Tiempo de respuesta
variable
• Soporta decisiones
estratégicas.
11. 4. COMPONENTES DE SISTEMA
Fuentes externas
Presentación de
la Información
Históricos
Datos
transaccionales
Arquitectura técnica
Almacén de datos (DW)
ETL
Niveles
adicionales
transformación
OLAP
Niveles adicionales
sumarización
Aplicación usuario final
Usuario
Fuentes de Información
Procesos de extracción
12. 4. COMPONENTES DEL SISTEMA
Procesos de extracción (ETL)
Proceso de extracción y carga de la
información desde las distintas fuentes
origen al Datawarehouse. Incluye las
siguientes fases:
1.
2.
3.
Extracción: elaboración de interfaces entre
sistemas operacionales orígenes de datos
Transformación: validación de los datos
extraídos, transformándolos al formato
deseado
Carga: cargar físicamente los datos extraídos
de los sistemas operacionales y ya
transformados en el modelo de datos del
Datawarehouse
13. 4. COMPONENTES DEL SISTEMA
Almacén de datos (Datawarehouse)
Se soporta sobre el modelo físico dimensional
diferente de los sistemas de bases de datos que
están basados en el modelo Entidad-Relación
(E/R). Este modelo contiene la misma información
que el modelo E/R pero agrupa los datos con el
objetivo de ganar una mayor comprensión para
el usuario y garantizar la ejecución rápida y
eficiente de las consultas.
Existen dos tecnologías para implementar dicho
modelo:
Multidimensional OLAP (MOLAP): se indexa los datos
directamente en un modelo multidimensional (cubos)
en el cual todas las posibles combinaciones de los datos
ya están calculadas en una celda
Relational OLAP (ROLAP): implementa las estructuras
dimensionales mediante bases de datos con modelos
relacionales.
14. 4. COMPONENTES DEL SISTEMA
Presentación de la información
DSS (Decisión Support System):
EIS (Executive Information System):
Informes dinámicos, normalmente para representar un
indicador o un grupo de indicadores relacionados
funcionalmente en tablas de datos.
Además de estos informes predefinidos, los usuarios con
capacidades de análisis podrán crear sus propios informes y
obtener respuestas en demandas de información puntuales.
Informes estáticos, predefinidos, fáciles de manejar y orientados
a los directores. Son informes muy visuales (normalmente se
utilizan exclusivamente gráficos) y con un nivel alto de
agregación de la información. Deben estar orientados a la
gestión estratégica.
BSC (Balance Scored Card):
Informes estáticos para la gestión estratégica de la empresa.
Permite medir el rendimiento de áreas o personas mediante el
análisis de diversos de un conjunto de indicadores con valores
objetivo y pesos.
15. 4. COMPONENTES DEL SISTEMA
Cuadro de Mando Integral
DSS
Decision Support
System
Reporting de Excepción
CRC
Alta
Dirección
Analistas
lic.
Reporting Estándar
s Ap
Otra
GAIA
CIRO
COMPAS
/ DM
SIA
Planificación operativa:
Estructura, Actividad Asistencial,
RR.HH.,...
SIA
Gestión
Operacional
Ag
re
ga
Na
ció
ve
nd
ga
eI
ció
nf
ne
or
ma
nP
SIS
AL
ció
ro
fu
n
nd
id
ad
SIP
Gestión
Estratégica
EIS
Executive
Information
System
Nivel
Aplicativo
Transaccional
Información
de Gestión
Operativa
17. 5. MODELO LÓGICO
Ejemplo
Organización: Cadena de supermercados.
Actividad objeto de análisis: ventas de
productos.
Información registrada sobre una venta:
“del producto “X” se han vendido en el
almacén “nro.1” el día 17/2/2008, 5
unidades por un importe de 100 euros.”
19. Dimensiones (puntos de
vista) desde los que se
puede analizar la actividad.
Marca
Semana
Descripción
Categoría
Mes
Departamento
Trimestre
Día
Nro_producto
Año
Tipo
importe
unidades
Almacén
Actividad que es objeto de
análisis con los indicadores
que interesa analizar
Ciudad
Tipo
Región
20. 5. MODELO LÓGICO
Modelo multidimensional
en un esquema multidimensional se
representa una actividad que es objeto
de análisis (hecho) y las dimensiones que
caracterizan la actividad (dimensiones).
la información relevante sobre el hecho
(actividad) se representa por un conjunto
de indicadores.
la información descriptiva de cada
dimensión se representa por un conjunto
de atributos (atributos de dimensión).
21. 5. MODELO LÓGICO
Entre los atributos de una dimensión se definen
jerarquías
Producto
nro. producto
categoría
departamento
Almacén
región
ciudad
almacén
tipo
Tiempo
día
trimestre
mes
semana
año
23. 6. TERMINOLOGÍA
Hecho
Indicador
Fórmula matemática aplicada a un conjunto de
hechos
Dimensión/Eje de análisis
Un hecho es un elemento de información del
negocio. Es decir, es un elemento que se puede
medir
Una dimensión es el aspecto o perspectiva
mediante las cuales se pueden acceder a los
hechos
Atributo
Característica de una dimensión
Una jerarquía es la relación padre/hijo en la cual
se agrupan los atributos de una dimensión
Jerarquía
24. 6. TERMINOLOGÍA
Agregación
Sumarización
Método por el cual los datos se cambian de nivel de
granularidad
Desnormalización
Método por el cual los datos, son agrupados para
realizar una tabla de hechos específica
Introducir redundancias de la información en las
tablas de la base de datos para mejorar el
rendimiento de la aplicación
Datamart
Un Datamart, al igual que un Datawarehouse, es un
almacén de datos para el análisis y toma de
decisiones. La diferencia esta en el contenido, ya
que un Datamart es un subconjunto departamental
de un Datawarehouse corporativo o un
Datawarehose de un solo sistema funcional.
25. 6. TERMINOLOGÍA
Drill down / up
DataMining
Sistema estático orientado a los ejecutivos, con
informes predefinidos y fácil de manejar
DSS (Decision Support System)
Búsqueda de patrones de comportamiento, dentro
de datos, ya sea de un Datawarehouse, o cualquier
otra fuente de información
EIS (Executive Information System)
Navegar dentro de la información, desde niveles mas
altos a niveles mas bajos o viceversa
Sistema de ayuda a la decisión con la libertad de
poder realizar consultas e informes libres sobre la
información
BSC (Balance Scored Card):
Sistema estático para la gestión estratégica de la
empresa
27. 7. BUSSINES INTELLIGENCE
Business Intelligence suele definirse como la
transformación de los datos de la compañía en
conocimiento para obtener una ventaja
competitiva.
Desde un punto de vista más pragmático, y
asociándolo directamente a las tecnologías de la
información, podemos definir Business Intelligence
como:
el conjunto de metodologías, aplicaciones y
tecnologías que permiten reunir, depurar y transformar
datos de los sistemas transaccionales e información
desestructurada (interna y externa a la compañía) en
información estructurada, para su explotación directa
(reporting, análisis OLAP...) o para su análisis y
conversión en conocimiento soporte a la toma de
decisiones sobre el negocio.
30. 8. HERRAMIENTAS
IBM InfoSphere DataStage
SW ETL de IBM para plataformas distribuidas y mainframes
IBM Cognos DecisionStream
Software ETL de IBM para la construcción de Data Warehouses y Data Marts
para reporting y análisis
IBM InfoSphere Change Data Capture (CDC)
Software de IBM para la integración de información en tiempo real a través
de almacenes de datos heterogeneos.
Informatica Powercenter
Software de Integracion de datos empresariales de Informatica
Oracle Data Integrator (ODI)
Plataforma de integración de datos de Oracle Fusion Middleware
Oracle GoldenGate (CDC)
Sofware de integración de datos de Oracle Fusion Middleware, que permite
la replicación de datos en tiempo real en entornos de datos heterogéneos
31. 8. HERRAMIENTAS
SAP BusinessObjects Data Integrator
Software ETL de SAP BO, plataforma de Business Intelligence de SAP
SAS Enterprise Data Integration Server
Software de ETL y ELT de SAS, que permite transformar datos directamente en las bases de
datos origen
Microsoft SQL Server Integration Services (SSIS)
Software ETL de Microsoft, incluído en la base de datos SQL Server, y que reemplaza a Data
Transformation Services (DTS)
iWay DataMigrator
Herramienta ETL de iWay Software para Data Warehousing.
iWay Enterprise Information (EII)
Herramienta ETL de iWay Software para integración en tiempo real entre almacenes de
datos heterogéneos.
Open Source:
Google Refine
Pentaho Data Integration (PDI)
Software ETL Open Source de la suite de BI de Pentaho. La versión Community (PDI CE) es
tembién conocida como Kettle, que es el nombre del proyecto open source original.
Talend Open Studio for Data Integration
Software ETL Open Source para integración de datos de Talend.
33. 9. ENFOQUES
La solución Business Intelligence abarca tanto la
modelización y almacenamiento de los datos,
como la explotación de los mismos, para extraer
la máxima información y conocimiento.
Sistemas sanitarios
Sistemas bancarios
Sistemas gestión de productos (almacenes)
A nivel pequeño, puede servir para predecir:
Costes, recursos necesarios para una tarea/s,
tiempo medio de implementación, según tipo de
proyecto tiempo estimado de desarrollo,
diseño…millones de aspectos se pueden predecir.