Este documento presenta la cátedra de Tecnologías Aplicadas a Business Intelligence del año 2012. Detalla el plantel docente, los objetivos de analizar las etapas de construcción de un data warehouse y herramientas de BI, y estudiar técnicas como reporting y data mining. También introduce conceptos clave como data warehouse, sistemas de soporte a la toma de decisiones, y la importancia creciente de la inteligencia de negocios.
1. Tecnologías Aplicadas a Business Intelligence - 2012
Tecnologías Aplicadas a
Business Intelligence
2012
Clase 1
2. Tecnologías Aplicadas a Business Intelligence - 2012
Plantel Docente
• Prof. Paola Amadeo
• JTP. Dalila Romero
• Ayte. Luján Rosso
• Ayte. Juan Manuel Castro
• Ayte. Nestor Lopez
Nos comunicamos vía:
catedrabi@info.unlp.edu.ar
@catedrabi
http://www.facebook.com/groups/294053034035388/
3. Tecnologías Aplicadas a Business Intelligence - 2012
Objetivo
• Se estudiarán los fundamentos, características, ventajas,
desventajas de un Data Warehouse, como pilar de la
Inteligencia de Negocio donde la tecnología es
imprescindible para reunir, almacenar y analizar toda la
información de una organización, que facilite la toma de
decisiones en todos los niveles.
• Se analizará cada etapa de la construcción de un Data
Warehouse, así como también distintas herramientas
para su construcción.
• Se implementarán Datamarts a través de diferentes
herramientas, como Pentaho y O3.
• Se estudiarán otras técnicas de BI como Reporting, Data
Mining, Data Analytics, entre otras.
4. Tecnologías Aplicadas a Business Intelligence - 2012
¿Por qué?
• El crecimiento exponencial de las bases de datos
utilizadas en sistemas de información que dan
soporte a las actividades de la sociedad actual, han
abierto un nuevo mercado para esta tecnología. Esta
realidad es reflejada también por una encuesta
realizada en el mes de junio del año pasado sobre
los trabajos en IT por Dice.com, y publicada en la
revista InfoWorld. Uno de los trabajos más
solicitados y mejor pagos es el de Data scientist,
ubicado en la 2° posición según este ranking.
The 6 hottest new jobs in IT .
http://www.networkworld.com/news/2011/061411-the-6-hottest-new-jobs.html?
source=NWWNLE_nlt_daily_pm_2011-06-14
5. Tecnologías Aplicadas a Business Intelligence - 2012
Un problema de ejemplo
PLANTEAMIENTO
Vinos SA, posee sólo un sistema operacional, que refleja la
evolución de la empresa a lo largo del tiempo. Claro que
también maneja una información en forma “Artesanal” en
papeles e inventarios documentados, facturas, boletas, etc. Sus
éxitos y fracasos están en esa montaña de información sobre la
cual está estructurada la empresa.
OBJETIVO
¿Cómo transformar toda esa información contenida en el
sistema operacional de una manera rápida, aprovecharla para
ayudar a los ejecutivos a encontrar las claves para posicionar a
Vinos SA en el liderazgo como empresa distribuidora al por
mayor y menor de productos en el centro de Argentina?
6. Tecnologías Aplicadas a Business Intelligence - 2012
Inteligencia de Negocios
• La inteligencia de negocios es el conjunto de
estrategias y metodologías que nos van a
ayudar a convertir los datos en información de
calidad, y dicha información en conocimiento
que nos permita una toma de decisiones más
acertada y nos ayude así a mejorar la
competitividad. Salvador Ramos, SolidQ MS
BI, 2011
7. Tecnologías Aplicadas a Business Intelligence - 2012
Inteligencia de Negocios
• El desafío principal de BI es reunir y presentar de
manera organizada la información referente a todos
los factores relevantes que conducen el negocio y
habilitar el acceso al conocimiento a los usuarios
finales de manera fácil y eficiente, con el efecto de
maximizar el éxito de una organización.
• Incluye data warehousing, data mining, EIS, DSS,
reporting, paneles de control, tableros de
indicadores, web analytics, etc.
8. Tecnologías Aplicadas a Business Intelligence - 2012
• En la actualidad, las tecnologías de la
información han permitido automatizar los
procesos de carácter administrativos o
repetitivos, a través de los sistemas de
información, caracterizado por:
• Es difícil cubrir las necesidades de información
para la toma de decisiones a través de estos
sistemas:
Altos tiempos de respuesta Actualización
Visión Histórica Información Sumarizada Flexibilidad
9. Tecnologías Aplicadas a Business Intelligence - 2012
Algunas definiciones para comenzar:
Sistema para la toma de Decisiones
DSS
Existen distintas definiciones, pero la
mayoría concuerda en:
• Un DSS es un sistema que colabora en
las toma de decisiones gerenciales.
• Involucra el análisis de muchas unidades
de datos de una manera heurística.
• Es el soporte de los tomadores de
decisiones a nivel gerencial, tanto en
situaciones semi-estructuradas y no
estructuradas, permitiendo combinar el
juicio humano e información objetiva.
10. Tecnologías Aplicadas a Business Intelligence - 2012
Sistemas para la toma de decisiones
Características Principales
• Capacidad de análisis OLAP que permiten
analizar la información con distinto nivel de
detalle y desde diferentes perspectivas.
• ¿Qué otras?
– Completamos al menos una característica en el
mapa en línea que está publicado en la
plataforma.
12. Tecnologías Aplicadas a Business Intelligence - 2012
Vemos un ejemplo en línea
• http://demo.analytical-labs.com/
13. Tecnologías Aplicadas a Business Intelligence - 2012
Definiciones – Data warehousing
El Data warehouse (almacén o repositorio de datos)
posibilita la construcción y mantenimiento de
estructuras destinadas al análisis de los datos,
transformando los datos en información y la
información en conocimiento.
¿Qué entendemos por dato?
¿Qué entendemos por información?
¿Qué entendemos por conocimiento?
http://www.rocklandsolutions.com/images/DataWarehouse.jpg
15. Tecnologías Aplicadas a Business Intelligence - 2012
Sistemas Operacionales DSS
Evolución de los sistemas para la toma
de decisiones
Data warehouse
http://www.rocklandsolutions.com/images/DataWarehouse.jpg
16. Tecnologías Aplicadas a Business Intelligence - 2012
Arquitectura de evolución natural
IndicadorA=y
IndicadorA=x
Arquitectura naturalmente evolutiva y problema de credibilidad de la información.
Inmon 2002
17. Tecnologías Aplicadas a Business Intelligence - 2012
Problemas de la arquitectura
• Baja Productividad: datos en diferentes fuentes que es
necesario recopilar, analizar y normalizar.
• Carencia de Credibilidad: ¿se tomaron los datos en el mismo
momento? ¿se denominan igual en toda la organización?
¿tiene múltiples fuentes?
• Problemas para transformar Datos a Información: relacionado
con la integridad de los datos. ¿Datos iguales con distinto
nombre? ¿se pueden relacionar?
• Incorporación de datos externos.
18. Tecnologías Aplicadas a Business Intelligence - 2012
Arquitectura de los DSS según los
niveles de información
19. Tecnologías Aplicadas a Business Intelligence - 2012
Niveles de Información
Datos Primitivos Datos Derivados
Nivel de Detalle para operaciones
diarias
Datos sumarizados o calculados.
Se actualizan Se recalculan
Valores actuales Valores históricos
Operados sobre procedimientos
repetitivos
Operados heurísticamente por
programas y procedimientos
analíticos
El alumno Juan Pérez matrícula
6767 rindió “Análisis Matemático
I”(7865), el día 20/10/2005; aprobó
con calificación 8, y fue registrado
en el acta X, folio Z
Juan Pérez rindió 5 materias
durante el 2005, aprobó el 80% de
los exámenes rendidos durante ese
año y promedia 7,25 en la carrera
20. Tecnologías Aplicadas a Business Intelligence - 2012
Data warehouse, una definición clásica
• Constituyen el corazón del procesamiento DSS.
• Fuentes secundarias de información, no generan datos.
• DW es una colección de datos, obtenidos a partir de los datos
transaccionales y específicamente estructurados para realizar
consultas y analizar la información. Kim, 1992
• Según Inmon, una colección de datos
– orientados al sujeto
– Integrados
– variables en el tiempo
– no volátiles
para ayudar al proceso de toma de
decisiones gerenciales.
http://www.rocklandsolutions.com/images/DataWarehouse.jpg
21. Tecnologías Aplicadas a Business Intelligence - 2012
Data warehouse – Orientados al sujeto
• Información sobre un “sujeto” o asunto del
negocio en particular, no en las aplicaciones o
transacciones. Por ejemplo en un entorno
universitario se piensa en alumnos, carreras y
no en una inscripción a cursadas o un acta de
examen.
22. Tecnologías Aplicadas a Business Intelligence - 2012
Data warehouse - Integración
• Los datos con los que se nutre el DW
provienen de diferentes fuentes y son
integrados para dar una visión global
coherente y comparable.
23. Tecnologías Aplicadas a Business Intelligence - 2012
Data warehouse – No volátil
• Los datos son estables en el DW, no se
actualizan. Se pueden agregar más datos, pero
los datos existentes no son removidos.
• Cuando un dato ingresa al DW se carga como
una foto. Si ocurren cambios se cargan fotos
nuevas y se mantiene la historia.
• Actualmente, en algunos data warehouse se
permite actualizar información.
24. Tecnologías Aplicadas a Business Intelligence - 2012
Data warehouse –
Variable en el tiempo
• Todos los datos en el DW están asociados con un
período de tiempo específico.
• El DW puede concebirse como una serie de fotos
tomadas en algún momento de tiempo. El elemento
de tiempo puede tomar diferentes formas, desde
una estampilla de tiempo en cada registro del DW
hasta una estampilla de tiempo de la base de datos
completa.
25. Tecnologías Aplicadas a Business Intelligence - 2012
Data Warehouse – Datos Estructurados
• Las metas de un diseñador de DW deben
focalizarse en entregar un análisis
multidimensional y capacidades de reportes
ad hoc y brindarlos de manera eficiente. Estos
requerimientos necesitan un diseño específico
de la base de datos.
26. Tecnologías Aplicadas a Business Intelligence - 2012
Objetivos del Data Warehouse
• Debe proveer acceso fácil a la información de una
organización.
• Los datos del DW deben ser consistentes y de buena
calidad.
• Debe ser una fuente de información adaptable y
flexible a los cambios.
• El DW debe ser un lugar seguro donde la información
se encuentre protegida.
• Debe ser la base para la toma de decisiones.
• Debe ser aceptado por la comunidad usuaria
Para implementar un buen DW es necesario conocer my bien las
reglas del negocio, involucrar a los usuarios, contar con datos de
buenas calidad y herramientas adecuadas.
28. Tecnologías Aplicadas a Business Intelligence - 2012
Entorno del Data Warehouse
Fuentes de Datos
• Registran toda la información de la
organización.
• El éxito o fracaso del DW depende de que
los sistemas operaciones provean los
datos necesarios para entender el negocio
y la calidad de estos datos.
30. Tecnologías Aplicadas a Business Intelligence - 2012
Entorno del Data Warehouse
Almacenamiento y Presentación
• Lugar donde se ubican el DW y el Data
Marts
• Los datos se organizan y almacenan para
que puedan ser accedidos por los
usuarios finales o aplicaciones.
• Un Data Mart es un subconjunto lógico
del DW. Contiene datos personalizados
y/o sumarizados derivados del DW,
confeccionados para soportar los
requerimientos analíticos de un
determinado sector o función del
negocio
31. Tecnologías Aplicadas a Business Intelligence - 2012
Entorno del Data Warehouse
Análisis de la información
• Aplicaciones de usuario final.
• Herramientas de acceso a datos de
usuario final.
• Herramientas de consultas ad hoc.
• Aplicaciones analíticas
• Aplicaciones estadísticas
• Data Mining
• Herramientas ad-hoc
32. Tecnologías Aplicadas a Business Intelligence - 2012
Data Warehouse - Meta datos
• Otra característica del Data Warehouse es que
contiene datos relativos a los datos, concepto
que se ha venido asociando al término de
meta datos.
• Los meta datos permiten mantener
información de la procedencia de la misma, la
periodicidad de refresco, su fiabilidad, forma
de cálculo, etc., relativa a los datos del DW.
33. Tecnologías Aplicadas a Business Intelligence - 2012
Objetivos de los metadatos
• Simplificar la administración del DW, gestionando
información histórica, de auditoría, ETL, entre otros.
• Asistir al usuario final, ayudándole a acceder al Data
Warehouse con su propio lenguaje de negocio,
indicando qué información hay y qué significado
tiene.
• Ayudar a construir consultas, informes y análisis,
mediante herramientas de navegación.