Introducción a Microsoft Business Intelligence, mostrando toda la plataforma que nos ofrece basada en SQL Server (Integration Services, Analysis Services, Reporting Services)
2. Salvador Ramos
MVP SQL Server
MCP / MCTS SQL Server
Columnista de dotNetManía
Mi web: www.helpdna.net
webmaster@helpdna.net
3. Agenda
Tecnologías OLTP vs OLAP
Business Intelligence
Diseño de Datawarehouse y soluciones
OLAP
Introducción a Data Mining
Introducción al lenguaje MDX y
herramientras cliente OLAP
Novedades de OLAP y DTS (->SSIS)
en SQL Server 2005
4. Agenda
Tecnologías OLTP vs OLAP
Business Intelligence
Diseño de Datawarehouse y soluciones
OLAP
Introducción a Data Mining
Introducción al lenguaje MDX y
herramientras cliente OLAP
Novedades de OLAP y DTS en
SQL Server 2005
5. Tecnologías OLTP vs OLAP
OnLine Transaction Processing
Sistemas transaccionales, enfocados a
gestionar un gran número de transacciones
concurrentes
Permiten insertar, actualizar, borrar y
consultar una pequeña cantidad de registros
OnLine Analytical Processing
Enfocados al análisis de grandes cantidades
de datos
Proporcionan respuestas rápidas y complejas
6. Tecnologías OLTP vs OLAP
OLTP OLAP
Orientado a lo operativo Orientado a temas
(procesos)
Predomina la Predomina la consulta.
actualización Datos históricos
Se accede a pocos Procesos masivos, se
registros accede a muchos
registros
Datos altamente Datos Denormalizados
normalizados
Estructura relacional Estructura
multidimensional
Rápidos tiempos de Respuesta masiva, no
respuesta. inmediata
Estructura estática Estructura dinámica,
abundantes cambios
7. Agenda
Tecnologías OLTP vs OLAP
Business Intelligence
Diseño de Datawarehouse y soluciones
OLAP
Introducción a Data Mining
Introducción al lenguaje MDX y
herramientras cliente OLAP
Novedades de OLAP y DTS en
SQL Server 2005
8. Business Intelligence
“Conjunto de herramientas y servicios
destinado a la gestión eficiente del
conocimiento y la información en
empresas y organizaciones”
Nos permite:
Convertir los datos en información
Tomar mejores decisiones rápidamente
Utilizar un método razonable para la gestión
empresarial
11. Agenda
Tecnologías OLTP vs OLAP
Business Intelligence
Diseño de Datawarehouse y soluciones
OLAP
Introducción a Data Mining
Introducción al lenguaje MDX y
herramientras cliente OLAP
Novedades de OLAP y DTS en
SQL Server 2005
13. Sistemas OLAP
Otros
CRM
ERP
Informes de usuario
Informes analíticos
data
SSRS
E.T.C.L. Warehouse
Excel
(SSIS) (relacional)
Sharepoint
BI Portal,
Business Scorecard Manager,
Performance Point 2007
Otros…
cubos
(SSAS)
14. Componentes DW
ERP
Area Intermedia 1
E.T.C.L.
(SSIS)
data
E.T.C.L. Warehouse
CRM Area Intermedia 2
(SSIS) (relacional)
E.T.C.L.
(SSIS)
Otros
15. Datawarehouse
Almacén de datos procedentes de los
sistemas OLTP. Repositorio colectivo
Almacén de datos centralizado
Datos organizados en grupos temáticos
Los datos son:
Consistentes
Depurados
Históricos (no volátiles)
Suministra datos rápida y eficientemente
Datamarts
16. DTS herramienta ETL
Conjunto de servicios para ETL
(Extract, Transform and Load)
Modelo de objetos e interfaces gráficos
Pueden ser utilizados desde entornos de
desarrollo que soporten COM
Incluyen asistentes que facilitan las tareas
Diseñador de paquetes
17. DTS herramienta ETL
Permiten operar con los datos:
Importación
Exportación
Transporte
Transformación
Los datos pueden proceder de
Cualquier fuente Ole Db
Cualquier fuente ODBC
Ficheros planos
18. Herramientas de DTS
Asistente para la importación o
exportación
Diseñador DTS
DTSRun
DTSRunUI (interfaz gráfica)
SQLAgent
20. El diseñador de paquetes
Conexiones
Proveedor OLE DB para SQL Server
Data Link
Controlador ODBC para Oracle (MS)
dBase 5
Microsoft Access
Archivo HTML (origen)
Microsoft Excel
Paradox 5.x
21. El diseñador de paquetes
Conexiones
Archivo de texto (origen)
Archivo de texto (destino)
Otras conexiones
22. El diseñador de paquetes
Tareas
Transformar datos
Consulta controlada por datos
Inserción masiva
Ejecutar SQL
Copia de objetos de SQL Server
Transferencia de base de datos
Transferencia de mensajes de error
Transferencia de Inicios de sesión
Transferencia de trabajos
Transferencia de proced. almacenados
23. El diseñador de paquetes
Tareas
Secuencia de comandos ActiveX
Propiedades dinámicas
Ejecutar paquete
Ejecutar proceso (.exe o .bat)
FTP
Cola de mensajes
Enviar correo
Procesar Analysis Services
Extracción de datos (consultas de predicción)
24. DTS
Demo 1
Utilizando los asistentes
Utilizando el diseñador de paquetes
25. Diseño de un DW
Definir objetivos y requerimientos
Revisar los informes actuales
Investigar todas las posibles fuentes de
información que alimentarán el DW
Diseño y modelado
Definir las tablas del área intermedia, que
alimentarán dimensiones y tablas de hechos
Realizar los precálculos necesarios
Crear índices y vistas
Elegir el esquema más adecuado:
Estrella (star)
Copo de nieve (snowflacke)
26. Diseño de un DW
Estrategia de extracción y transformación
Decidir en cada caso si se realizará una
extracción completa o incremental
Diseño del sistema de extracción incremental
Utilizar triggers, replicación u otras técnicas
Transformación de los datos
Asegurar la validez, integridad y utilidad de
los datos
Comprobar que todas las claves externas
encuentren valores, y evitar claves nulas
(ej: sustituirlas por 0 -> „Sin familia‟)
27. Diseño de un DW
Ejercicios
Supongamos que vamos a gestionar las
ventas, teniendo en cuenta los vendedores
que las han realizado, los clientes, y la zona
geográfica a la que pertenecen.
Diseñar un sistema en el que los datos
históricos permanezcan inalterables ante los
cambios de residencia de los clientes
28. Diseño de un DW a fondo
Ralph Kimball
Slowly Changing Dimensions
Type 1: overwrite
Type 2: partitioning history
Type 3: alternate realities
Hybrid
Inferred members (miembros inferidos)
29. Diseño de un DW
Demo 2
Procesos ETL con SSIS (entorno)
30. BBDD Multidimensionales
Son contenedores de cubos relacionados
y objetos que comparten
La unidad de almacenamiento es el cubo
(en los SGDBR es la tabla)
cubos
SSAS
cubos
SSAS
cubos
SSAS
CUBOS
31. Opciones de almacenamiento
MOLAP
Almacenamiento en estructura
multidimensional de Analysis Services
Mayor rapidez de respuesta
ROLAP
Almacenamiento en base de datos relacional
Para grandes volúmenes de datos
HOLAP
Híbrido
Respuesta rápida y gran cantidad de datos en
origen
32. Elementos de la base de datos
Origenes de datos
Cubos
Dimensiones compartidas
Modelos de minería de datos
Funciones de base de datos (seguridad)
Sólo autenticación windows
33. Cubos Producto
Id
Tabla de
Hechos Cliente
Id
Nombre Nombre
Tamaño Provincia
Tabla de Hechos … …
Claves externas Tiempo
Fecha
Medidas Año
Mes
Dimensiones Dia
…
Producto1
Producto1
Producto2
Producto2
Producto 3
Producto 3
34. Dimensiones
Jerarquías y niveles
Tiempo (año, trim, mes, dia)
Geografía (país, prov,
poblac)
Artículo (fam, grupo, art)
Agregaciones
Son sumas precalculadas
de los datos para acelerar
el tiempo de respuesta
Producto1
Miembros Producto2
Producto 3
35. Tipos de dimensiones
Regulares
Virtuales (a partir de propiedades)
Padre-Hijo o Primario-Secundario
Según su ámbito
Privadas
Compartidas
36. Medidas y Miembros calculados
Medidas
Conjunto de valores de una columna de la
tabla de hechos del cubo
Miembros calculados
Medidas calculadas mediante una fórmula
MDX
37. Tipos de cubos
Normales
Vinculados
Apuntan a un cubo de otro servidor
Virtuales
Se crean a partir de varios cubos existentes
(‘equivalentes a vistas en SGDBR’)
40. Agenda
Tecnologías OLTP vs OLAP
Business Intelligence
Diseño de Datawarehouse y soluciones
OLAP
Introducción a Data Mining
Introducción al lenguaje MDX y
herramientras cliente OLAP
Novedades de OLAP y DTS en
SQL Server 2005
41. Data Mining
Uso de métodos automatizados para
obtener tendencias y pautas a partir de los
datos del DW
Se componen de
Escenarios (entidades a analizar)
Ej: un cliente y sus ventas
Atributos (información sobre los escenarios)
Ej: edad, número de hijos, total ventas, …
Una vez elegidos los escenarios y
atributos, procesamos el modelo
42. Data Mining
En Analysis Services disponemos de dos
proveedores, diseñados para obtener
agrupaciones eficazmente
Microsoft Decision Trees
Arbol de clasificación, con diversas ramificaciones
Microsoft Cluster
Agrupación de escenarios
43. Agenda
Tecnologías OLTP vs OLAP
Business Intelligence
Diseño de Datawarehouse y soluciones
OLAP
Introducción a Data Mining
Introducción al lenguaje MDX y
herramientras cliente OLAP
Novedades de OLAP y DTS en
SQL Server 2005
44. El lenguaje MDX
MultiDimensional eXpressions
(Lenguaje de expresiones multidimensionales)
Es el equivalente a SQL para bases de
datos multidimensionales
También tiene una instrucción SELECT
SELECT <espec-eje>, <espec-eje> …
FROM <espec-cubo>
WHERE <espec-rebanador>
Nos permite crear Miembros calculados y
Conjuntos con nombre
Dispone de múltiples funciones avanzadas
46. Conectividad
PivotTable Service (PTS)
Es el cliente de los servicios OLAP
Proporciona la interfaz para conectarnos
desde las aplicaciones
ADO MD
(ActiveX Data Objects MultiDimensional)
ADO MD .Net
47. Herramientas cliente OLAP
SQL Server Reporting Services
Microsoft Excel
Microsoft Data Analyzer
Herramientas desarrolladas por nosotros
AddIn para Excel
Aplicaciones asp o asp.net
Webparts para Sharepoint
Herramientas de terceros
48. Microsoft Excel
Consultas ad-hoc
Para mostrar datos utiliza
Tablas dinámicas
Gráficos dinámicos
Necesita MS Query instalado
Se puede publicar en web (OWC)
50. Agenda
Tecnologías OLTP vs OLAP
Business Intelligence
Diseño de Datawarehouse y soluciones
OLAP
Introducción a Data Mining
Introducción al lenguaje MDX y
herramientras cliente OLAP
Novedades de OLAP y DTS (SSIS) en
SQL Server 2005
51. Novedades SSIS (antes DTS)
DTS, ahora „Integration Services‟
Se ha reescrito todo el código
Servicio windows independiente
Incrementa su potencia y funcionalidad
Incrementa su rendimiento
Nuevo entorno de desarrollo
MS Development Environment
Integrados con la plataforma .Net
52. Novedades SSIS
Nuevo entorno de desarrollo, en vez de
crear un paquete, se crean proyectos
„Data Transformation Project‟
55. Novedades Analysis Services
Nuevas herramientas
2000
Enterprise Manager
Query Analyzer
Analysis Manager
Report Manager
2005
BI Development Studio (BIDS)
Orientado a Soluciones y Proyectos (vs.net)
Incluye un Debugger
SQL Server Management Studio
56. Novedades Analysis Services
Mejoras para el modelado de datos
Data Source Views
Tenemos una capa más de abstracción
Podemos trabajar de forma desconectada
Podemos renombrar entidades
Intellicube, nos facilita la construcción de
cubos
el Repository (por defecto en Access), se
sustituye por metadatos en XML
Deployment Wizard (facil despliegue)
57. Novedades Analysis Services
UDM – Unified Dimensional Model
Se integran todos los tipos de Data Sources
Combina las mejores características de los
modelos relacionales y OLAP
Querys interactivas con mejor rendimiento
Alto rendimiento gracias a Proactive
Caching