2. Representación multidimensional de los datos
detallados (filas concretas) y de los datos resumidos
(agregados).
• Son utilizados en consultas analíticas complejas que
buscan la información en la base de datos, desde
diversos puntos de vista establecidos por sus
dimensiones.
Representa una entidad diferente del negocio.
Son creados a partir de un esquema de base de datos
Estrella o Copo de Nieve, y se caracterizan por tener
tablas de Hechos y tablas de dimensiones.
Las tablas de Hechos guardan los datos históricos y
generalmente son medidas numéricas que describen
una transacción del negocio, por ejemplo: ventas,
transacciones bancarias, etc.
• Las tablas de Dimensiones dan significado de los datos
contenidos en la tabla de hechos.
CUBOS
3. Estructuras de Almacenamiento de Cubos
Los cubos son funciones de agregación que se calculan
de acuerdo al esquema de estrella o copo de nieve.
Los datos y agregaciones del cubo se almacenan en
diferentes modos:
Estructura MOLAP:
Almacena los datos y agregaciones en una
estructura multidimensional.
Permite dimensiones que contengan hasta 5
millones de miembros.
Es la más eficiente en búsquedas
independientemente del gestor, requiere mayor
tiempo de procesamiento y espacio en disco.
La desventaja es que hay que actualizarlo para
que incorpore los datos nuevos que vayan
entrando al DW.
4. Estructuras de Almacenamiento de
Cubos
Estructura ROLAP:
Mantiene los datos en la tabla de hechos
original y almacena las agregaciones en
las tablas relacionales de la misma base de
datos.
Es más lenta la búsqueda, pero es válida
aunque el tamaño del cubo exceda los 5
Gb donde MOLAP tiene problemas.
Estructura HOLAP:
Mantiene los datos en la tabla de hechos
original y almacena las agregaciones en
una estructura multidimensional.
6. CUBOS VS MODELO ESTRELLA
CUBOS
Resultado de N dimensiones
para
Metricas (total de ventas, Este
año vs el año anterior, etc).
Compuesto por
• Dimensiones
• Jerarquías
• Niveles
• Atributos
• Métricas
Modelo estrella
• Tablas de dimensiones
• Miles de registros
• Columnas de atributos
(nombre del producto)
• Historia
Tablas de hechos
Miles de registros
Columnas
agregadas(cantidad de
ventas)
Claves foráneas hacia las
dimensiones.
8. CUBOS
Cada tabla almacena registros de la forma:
D1, D2, D3, … M1, M2, M3….
Di es una dimensión
Describe un aspecto del negocio.
Define la organización lógica de los datos.
Provee un medio para analizar datos del negocio.
Permite filtrar y manipular los datos almacenados
Son catálogos de información complementaria
necesaria para la presentación de los datos a los
usuarios, como por ejemplo: descripciones, nombres,
zonas, rangos de tiempo, etc.
Mi es una medida (hecho) También llamada celda o variable
Siempre son numéricas
Cruzan todas las dimensiones en todos los niveles.
Son indicadores sumarizados (sumas, promedios,
mínimo, máximo, total, %)
9. Los atributos, son criterios utilizados para
analizar los indicadores. Se basan, en los datos
de referencia de las tablas de dimensiones.
En un cubo, los atributos son los ejes del
mismo.
• Son campos o criterios de análisis,
pertenecientes a tablas de dimensiones.
ATRIBUTOS Y JERARQUIAS
Los indicadores, son sumarizaciones (suma, conteo,
promedio, etc), efectuadas sobre algún hecho.
Dependen de los atributos/jerarquías que se utilicen
para analizarlos.
10. Una jerarquía representa una relación
lógica entre dos o más atributos; si
poseen una relación “padre-hijo”.
Tienen las siguientes características:
Existen varias en un mismo
cubo.
Tienen dos o más niveles.
Relación “1-n” o “padre-hijo”
entre atributos consecutivos
de un nivel superior y uno
inferior.
Se pueden identificar cuando existen
relaciones “1-n” o “padre-hijo” entre los
propios atributos de un cubo.
12. MIEMBROS
Cada nivel organiza los elementos
básicos de una dimension en Miembros.
Cada miembro representa Un elemento
de dato único dentro de una dimensión
Una rebanada del cubo
20. CONSULTAS
Ejecuta consultas relacionales, tales como Join y
agregaciones, y de consultas propias del análisis de datos,
como drill-up y drill-down.
Una consulta consiste en obtener indicadores desde una
tabla de hechos, restringidas por las propiedades o
condiciones de los atributos.
Las operaciones pueden ser:
Drill-down.
Drill-up.
Drill-across.
Roll-across.
Pivot.
Page.
Un atributo representa una propiedad de interés en una dimensión.
Ejemplo: atributos de la dimensión Cliente:
Nombre cliente
Grado de instrucción
Nro de hijos
Ciudad
País