1. Propuesta de un método para el diseño
y modelado de una bodega de datos
José Hernando Bahamón L.
Universidad Icesi
jbahamon@icesi.edu.co
Fecha de recepción: 15-4-2003 Fecha de aceptación: 25-8-2003
RESUMEN ses. La primera fase comprende la
El desarrollo de los Sistemas de In- identificación de las necesidades de
formación Gerencial basados en tec- información gerencial, desde la pers-
nologías de Data Warehouse y Herra- pectiva del negocio. La segunda fase
mientas Olap, es relativamente re- comprende todas las actividades re-
ciente y, por lo tanto, no existe una lacionadas con la elaboración de un
propuesta metodológica universal- modelo lógico-conceptual de la estruc-
mente válida y aceptada como tal, por tura de la bodega de datos. La terce-
la comunidad académica. ra fase incluye los pasos para reali-
zar el diseño físico de la estructura
El presente artículo expone una pro- de la bodega de datos.
puesta metodológica para la realiza-
ción del diseño de una bodega de da- PALABRAS CLAVES
tos, que utiliza como eje articulador
Bodegas de datos, método de diseño
la identificación de las necesidades de
de la estructura de una bodega de
información por parte de la gerencia,
datos.
para el soporte de los procesos de con-
trol y de toma de decisiones. ABSTRACT
El método propuesto está compuesto The development of Management In-
de ocho pasos agrupados en tres fa- formation Systems based on Ware-
SISTEMAS
& TELEMÁTICA 13
2. house Data technologies and Olap information requirements from a bu-
tools is relatively new. Therefore, the- siness perspective. The second one
re is no valid methodological appro- deals with all the activities associa-
ach that is generally accepted as such ted with the preparation of a logical
by the academic community. conceptual model for the data ware-
house structure, and the third stage
This article presents a methodologi-
includes the steps to make the phy-
cal approach to the design of a data
sical design of the data warehouse
warehouse using the identification of
structure.
management information require-
ments as a shaft that supports the
KEY WORDS
control and decision-making proces-
ses. The suggested approach consists Data warehouses, approach to the
of eight steps grouped in three diffe- design of a data warehouse struc-
rent stages. The first stage encompas- ture.
ses the identification of management Clasificación: A
14 SISTEMAS
& TELEMÁTICA
3. INTRODUCCIÓN MÉTODO PROPUESTO
El desarrollo de los Sistemas de In- El método de diseño propuesto está
formación Gerencial basados en tec- centrado en la identificación de la
nologías de Data Warehouse y herra- información clave y relevante para so-
mientas Olap, es relativamente re- portar los procesos de dirección y de
ciente y, por lo tanto, no existe una toma de decisiones dentro de la orga-
propuesta metodológica universal- nización. Este método utiliza, como
mente válida y aceptada como tal, por punto de partida, la identificación y
la comunidad académica. el modelado de: qué es lo que el
negocio está tratando de alcan-
Entre las propuestas más conocidas
zar, para luego elaborar una estruc-
están: 1. Ralph Kimball,1 con un es-
tura que apoye el proceso de gestión
quema centrado en la identificación
hacia el logro de las metas definidas.
de los procesos de la empresa, como
elemento clave para la definición de Una vez que la información clave de
la estructura de variables y dimen- apoyo a los procesos de gestión y con-
siones; 2. W.H. Inmon,2 con un esque- trol de la organización ha sido iden-
ma que parte de la construcción del tificada, se inicia la elaboración del
modelo de datos corporativos, elabo- modelo lógico-conceptual de la estruc-
rado al más alto nivel de abstracción, tura de la bodega de datos, que so-
para luego derivar la estructura del portará las consultas y la exploración
modelo de datos, para el diseño de la de los datos, a partir de los cuales se
bodega; 3. Golfarelli Matteo, Maio construirán los indicadores de gestión
Dario, Rizzi Stefano3 proponen un requeridos por los niveles directivos
esquema que parte de los modelos E- de la organización.
R descriptivos de los sistemas tran-
Para darle un orden a este proceso
saccionales de la organización, para
sistémico de diseño, los pasos del
luego derivar el modelo E-R de la es-
método propuesto, tal como se presen-
tructura, para la bodega de datos.
tan en la Figura 1, se han agrupado
En este artículo se presenta una pro- en las siguientes fases:
puesta de sistematización del proce-
• Fase 1: Identificación de las ne-
so de diseño de una bodega de datos,
cesidades de información geren-
que se aparta de los esquemas de di-
cial, desde la perspectiva del ne-
seño referidos, y que utiliza como eje
gocio.
articulador, la identificación de la in-
formación gerencial, para el soporte • Fase 2: Elaboración del modelo ló-
de los procesos de control y de toma gico-conceptual de la estructura
de decisiones en los niveles directi- de la bodega de datos.
vos de la organización.
1. Kimball R. The Data Warehouse Toolkit. John Wiley & Sons, 1996.
2. Inmon W.H. Building The Data Warehouse. QED Press / John Wiley & Sons, 1992.
3. Golfarelli M., Maio D., Rizzi S. Conceptual Design of Data Warehouse From E/R Schemes.
http//www.csr.unib.it/~golfare/db.html, 1998.
SISTEMAS
& TELEMÁTICA 15
4. • Fase 3: Elaboración del modelo fí- «¿Cuál es la información que desea
sico de la bodega de datos. obtener del sistema de información
gerencial?». Este enfoque puede resul-
tar muy peligroso, si el directivo no
Fase 1: realiza un proceso sistemático y orde-
Identificación de las necesidades nado, para establecer sus necesidades
de información gerencial, desde de información, en relación con sus ac-
la perspectiva del negocio. tividades de gestión y control.
La primera fase, a partir de la cual Una forma ordenada y sistemática
se realiza el proceso de diseño de la para realizar esta fase de identifica-
estructura para una bodega de datos, ción de las necesidades de informa-
comprende la identificación de las ne- ción, que soporte los procesos de ges-
cesidades de información gerencial, tión y control gerencial, es la aplica-
lo que significa hacer explícitos los ción del enfoque de sistemas, para
objetivos y los factores claves de éxi- guiar el proceso de revisión o defini-
to de la organización, o de un área ción de: 1. Los objetivos estratégicos
del negocio. del negocio o del área; 2. Los factores
clave para el logro de los objetivos de-
Es bastante común empezar este pro-
finidos y 3. Los indicadores de con-
ceso de identificación y modelado
trol, tanto de los objetivos como de los
mediante entrevistas a los directivos,
factores clave.4
en las cuales la pregunta central es:
4. Véase Bahamón José H. Construcción de indicadores de gestión bajo el enfoque de sistemas. S&T Revista
de la Facultad de Ingeniería, Universidad Icesi. 2003.
16 SISTEMAS
& TELEMÁTICA
5. Método para el diseño y modelado de una bodega de datos
Fase 1: Identificación de las necesidades de infor-
mación gerencial, desde la perspectiva del negocio.
Fase 2: Elaboración del modelo lógico-conceptual
de la estructura de la bodega de datos.
2.1. Definir las tablas de hechos o las variables de la
estructura.
2.2. Identificar, para cada tabla de hechos, las dimen-
siones que la referencian.
2.3. Establecer el nivel de granulación y los niveles de
agregación.
2.4. Elaborar el diagrama en estrella que representa
la estructura de la bodega.
Fase 3: Elaboración del modelo físico de la bodega
de datos.
3.1. Verificación y ajuste del modelo lógico.
3.2. Definición del esquema físico del almacenamien-
to de las dimensiones y sus jerarquías.
3.3. Definición de los atributos que conforman las
tablas de hechos.
Figura 1. Método para el diseño y modelado de una bodega.
SISTEMAS
& TELEMÁTICA 17
6. Como resultado de esta fase, se ten- tión (necesidades de información ge-
drá una visión del negocio y de la in- rencial), identificados en la fase an-
formación requerida para la dirección terior, y termina con la construcción
y el control gerencial, representada de una representación multidimen-
fundamentalmente por: Los objetivos sional de las variables que conforman
del negocio; los factores clave de éxi- cada indicador. En esta representa-
to y, en especial, un conjunto de indi- ción multidimensional, cada variable
cadores clave de la gestión. es modelada mediante un arreglo di-
mensional (multidimensional) de cel-
Fase 2: das, como se presenta en la Figura 2.
Elaboración del modelo lógico-
Para facilitar el proceso de elabora-
conceptual de la estructura de la
ción del modelo lógico, se utiliza una
bodega.
representación gráfica denominada
En esta fase se elabora el modelo ló- diagrama tipo estrella, donde el ele-
gico de la estructura de la bodega, que mento central del esquema es la Va-
soportará las consultas, mediante las riable o Tabla de Hechos («Fact»), la
cuales se obtendrá la información re- cual es referenciada por un conjunto
querida por los niveles directivos de ejes, denominados Dimensiones, a
como apoyo a sus procesos de gestión través de los cuales se seleccionan los
y de toma de decisiones. valores contenidos en la tabla de he-
chos. En la Figura 3, se esquematiza
La elaboración de este modelo lógico
el modelo de un diagrama en estrella.
comienza con los indicadores de ges-
18 SISTEMAS
& TELEMÁTICA
7. Figura 2. Vista multidimensional de una de las variables que conforman
un indicador.
Figura 3. Diagrama en estrella de una estructura multidimensional.
SISTEMAS
& TELEMÁTICA 19
8. Antes de presentar los pasos propues- Cuadro 1 se presentan las definicio-
tos por el método para la elaboración nes adoptadas para los diferentes
del modelo lógico, es pertinente pre- conceptos utilizados en el método pro-
cisar algunos de los términos utiliza- puesto.
dos en el método propuesto. En el
Cuadro 1: Definición de conceptos básicos.
Gráfica Una gráfica es una red de nodos interconectados.
Una gráfica direccional es aquella en la cual la conexión entre
dos nodos tiene una dirección específica.
Un modelo E-R puede ser considerado una gráfica direccional.
Trayectorias cíclicas En una gráfica, una trayectoria acíclica es aquella que sólo
y acíclicas tiene una forma de recorrido (en un solo sentido).
Una trayectoria cíclica es aquella que se puede recorrer en dos
o más secuencias diferentes.
Tabla de hechos Es la tabla central de la estructura de la bodega. Esta tabla
contiene los datos de interés para el negocio, es decir, los valo-
res para la construcción de los indicadores claves del negocio.
Técnicamente, la tabla de hechos es una entidad de intersec-
ción cuya llave primaria está compuesta por la unión de los
dominios de las diferentes dimensiones que la referencian.
Dimensión Las dimensiones corresponden a los ejes con los cuales se cons-
truye la vista multidimensional de la información clave del ne-
gocio, almacenada en la tabla de hechos.
Las atributos almacenados en las dimensiones determinan la
granulación adoptada para el modelo.
Las dimensiones pueden ser:
– Propias: Cuando el conjunto de entidades que conforman
la dimensión se encuentran unidas a la tabla de hechos, en
una trayectoria acíclica.
– Impropias: Cuando el conjunto de entidades que confor-
man la dimensión se encuentran unidas a la tabla de he-
chos, en una trayectoria cíclica.
– De Información: Cuando los atributos contenidos en la
dimensión definen qué tipo de datos se encuentran almace-
nados en la tabla de hechos.
Jerarquías Determinan cómo las instancias de la tabla de hechos pueden ser
agregadas. Las jerarquías permiten las operaciones de «drill-down»
o «rollup», en los procesos de consulta.
Una jerarquía está conformada por el conjunto de entidades
que constituyen la dimensión.
20 SISTEMAS
& TELEMÁTICA
9. A continuación se presentan los cua- • El indicador 1 del F.C.E1 puede
tro pasos propuestos para la sistema- ser construido con dos tablas de
tización del proceso de elaboración del hechos que son: ventas por ven-
modelo lógico: dedor y cuota de ventas de cada
vendedor.
Paso No. 1:
• El indicador 2 del F.C.E1 puede
Definir las tablas de hechos o las
ser construido con dos tablas de
variables de la estructura.
hechos que son: número de visi-
Este paso se realiza a partir del con- tas realizadas por cada vendedor,
junto de los indicadores de gestión, y número de visitas presupuesta-
definidos en la fase de identificación das por cada vendedor.
de las necesidades de información
• El indicador 1 del F.C.E2 puede
gerencial, desde la perspectiva del
ser construido con una tabla de
negocio. El paso se inicia con la eva-
hechos: número de clientes nue-
luación de las variables (divisores y
vos en la base de datos. En este
dividendos) de cada indicador, para
caso, el denominador del indica-
determinar cuáles de éstas pueden
dor se asume como un único valor
ser almacenadas en una tabla de he-
y, por lo tanto, no tiene sentido
chos, y cuáles no.
almacenarlo en otra tabla de he-
En el Cuadro 2 se presenta, a mane- chos.
ra de ejemplo, la información obteni-
• Los demás indicadores se anali-
da, al aplicar los pasos de la fase 1 al
zan de igual manera.
área de ventas de una organización.
A partir de estos resultados se iden- En suma, al realizar el análisis de
tifican las variables o tablas de he- todos los indicadores, obtenemos las
chos, como lo establece el paso 1 de siguientes tablas de hecho:
esta fase.
• Ventas.
Aplicación del paso 1: Identificación
• Ventas por vendedor.
de las tablas de hechos
• Cuota de ventas de cada vende-
• El indicador definido para el mo-
dor.
nitoreo del objetivo puede ser
construido con una sola tabla de • Número de visitas realizadas por
hechos: Ventas. Se toma una sola cada vendedor.
variable, por cuanto las ventas del • Número de visitas presupuesta-
año y las ventas del año anterior, das por cada vendedor.
que son las dos variables que con-
forman el indicador, se pueden • Número de clientes nuevos en la
almacenar en la misma tabla de base de datos.
hechos. • Número de vendedores capacita-
dos que aprobaron los cursos.
SISTEMAS
& TELEMÁTICA 21
10. Cuadro 2: Información gerencial del área de ventas,
obtenida al realizar la fase 1.
Área del Negocio - Descripción. Se trabaja con el área de ventas de una orga-
nización dedicada a la producción de recipientes elaborados en plástico.
Objetivo del Área: para propósitos del ejemplo, se toma el siguiente objetivo:
Lograr al final del año un incremento del 15% en las ventas totales de la
compañía, con respecto a las ventas del año anterior.
Factores claves de éxito. Luego de realizado el análisis de las acciones y las
condiciones necesarias para garantizar el logro del objetivo planteado, se identi-
ficaron los siguientes F.C.E:
• F.C.E.1: Planeación y control de la fuerza de ventas.
• F.C.E.2: Búsqueda de nuevos clientes rentables para la organización.
• F.C.E.3: Capacitación y entrenamiento de la fuerza de ventas.
Indicadores claves de gestión. Para el control y seguimiento de los F.C.E y los
objetivos, se proponen los siguientes indicadores:
Ventas del año
I_obj: -1
Ventas del año anterior
Ventas del vendedor
I1_FCE1:
Cuota de ventas
Número de visitas de venta realizadas
I2_FCE1:
Número de visitas presupuestadas
Número de clientes nuevos en la base de datos
I1_FCE2:
Número de clientes nuevos presupuestados
Número de vendedores capacitados que aprobaron los cursos
I1_FCE3:
Número presupuestado de vendedores capacitados
22 SISTEMAS
& TELEMÁTICA
11. Paso No. 2: En este paso, se espera que el usua-
Identificar, para cada tabla de rio visualice cada variable, como un
hechos, las dimensiones que la conjunto de valores almacenados en
referencian. una estructura de varias dimensio-
nes, donde los valores almacenados
Para cada variable o tabla de hechos
son referenciados por la combinación
se identifican, con la colaboración del
de los valores definidos para cada eje
usuario líder del área de negocio, los
(dominio de la dimensión), tal como
ejes de visualización multidimensio-
se esquematiza en la Figura 4.
nal los cuales constituyen las dimen-
siones de la variable.
Figura 4: Esquema de una vista multidimensional de una tabla de hechos.
Paso 3: Hechos sobre Ventas, definida en el
Establecer el nivel de granula- ejemplo anterior.
ción y los niveles de agregación
Aplicación del paso 2: Identificación
de cada dimensión.
de las dimensiones.
Una vez que las dimensiones han sido
Supongamos que el gerente de ven-
identificadas se debe establecer, para
tas expresa su interés por visualizar
cada una de ellas, el menor nivel de
la información de ventas organizada
granulación, el cual corresponde al
de la siguiente manera: primero, por
conjunto de atributos que referencian
cada producto de la compañía; en se-
el mayor nivel de detalle deseado
gundo término, por cada lugar en
para la variable o tabla de hechos.
donde se venden los productos y, fi-
A manera de ejemplo, se aplican los nalmente, por cada semana. Podemos
dos pasos anteriores para la Tabla de establecer la necesidad de utilizar
SISTEMAS
& TELEMÁTICA 23
12. tres ejes para elaborar la vista mul- chos, por cada dimensión. Estos ni-
tidimensional (dimensiones) de la veles de agregación representan la
Tabla de Hechos - Ventas: jerarquía de cada dimensión.
• Dim1: Producto • Jerarquía en la Dim. Produc-
to: Las ventas por productos pue-
• Dim2: Lugar de venta
den ser agregadas por grupos de
• Dim3: Tiempo. productos, por líneas de produc-
tos y, por el total de la venta. De
Aplicación del paso 3: Definición del
esta manera, los niveles de agre-
nivel de granulación.
gación de la dimensión producto
De acuerdo con la solicitud del geren- son:
te, se establece para cada dimensión
– Por grupos de productos.
la siguiente granulación:
• Dim. Producto: El menor nivel – Por líneas de productos.
de granulación es el Tipo de Pro- – Total.
ductos. Podemos establecer otros
• Jerarquía en la Dim. Lugar:
niveles como: Línea de Productos,
Las ventas por lugar pueden ser
que tiene un nivel de granulación
agregadas por regiones y por el
mayor, pero un menor nivel de de-
total del país.
talle en la variable ventas; o Re-
ferencias de Productos, que tiene • Jerarquía en la Dim. Tiempo:
un menor nivel de granulación, Las ventas por tiempo pueden ser
pero un mayor nivel de detalle. agregadas por mes, por trimestre,
por semestre, por año.
• Dim. Lugar: El nivel de granu-
lación requerido es la Ciudad. Se
habrían podido seleccionar otros
Paso 4:
niveles, como Almacén, que tiene
Elaborar el diagrama en estrella
un menor nivel, o Región, que tie-
que representa la estructura de
ne uno mayor.
la bodega.
• Dim. Tiempo: El menor nivel de
Luego de identificar los elementos
granulación requerido es la Sema-
que conforman la estructura de la
na. Se habrían podido seleccionar
vista multidimensional, de la infor-
otros niveles, como el Día, que tie-
mación gerencial requerida por la
ne un menor nivel, o el Mes, que
organización, se pasa a la elaboración
tiene uno mayor.
de una representación gráfica, en for-
Una vez se han definido los menores ma de estrella; para ello se puede uti-
niveles de granulación para cada di- lizar la notación simplificada de los
mensión, se identifican los niveles de diagramas E-R, o la notación deno-
agregación requeridos para los valo- minada «Dot modeling».5
res almacenados en la tabla de he-
5. Todman, Chris. Designing a Data Warehouse: Supporting Customer Relationship. Prentice Hall, 2001.
24 SISTEMAS
& TELEMÁTICA
13. Notación tipo E-R: junto de trayectorias de entidades y
En esta notación, el diagrama en es- relaciones de uno a muchos, que co-
trella está conformado por una enti- rresponde a las dimensiones y a sus
dad central asociativa, que correspon- jerarquías. En la Figura 5 se presen-
de a la tabla de hechos, y por un con- ta un diagrama en estrella con esta
notación.
Figura 5. Representación de un diagrama en estrella, mediante la
notación tipo E-R.
Notación «Dot Modeling» trayectorias compuestas por puntos
En esta notación, el diagrama en es- («dots»), que representan las dimen-
trella está conformado por una enti- siones y sus jerarquías. En la Figura
dad central que corresponde a la Ta- 6 se presenta un diagrama en estre-
bla de Hechos, y por un conjunto de lla con esta notación.
Figura 6. Representación de un diagrama en estrella, mediante la
notación «Dot Modeling».
SISTEMAS
& TELEMÁTICA 25
14. A manera de ejemplo se presenta en anterior. En la Figura 8 se represen-
la Figura 7, el diagrama en estrella, tan los mismos elementos de la es-
con notación «Dot Modeling», para la tructura de la bodega, pero con nota-
Tabla de Hechos y para las dimen- ción tipo E-R.
siones identificadas en el ejemplo
Figura 7. Representación, mediante la notación «Dot Modeling», de la
estructura para la bodega de datos del ejemplo anterior.
Figura 8. Representación, mediante la notación E-R, de la estructura para
la bodega de datos del ejemplo anterior.
26 SISTEMAS
& TELEMÁTICA
15. Fase 3: soportado. Si esta verificación no es
Elaboración de la estructura fí- correcta, se debe retornar a la fase
sica de la bodega anterior, para incorporar las estruc-
turas que soporten los requerimien-
Durante esta fase, se realiza la trans-
tos faltantes de información.
formación del modelo lógico concep-
tual en la estructura física, que pos- Terminada la revisión anterior, el
teriormente será implementada en proceso continúa con la evaluación de
alguna herramienta de «Data Ware- la estructura, para asegurar la vali-
house». dez de todas las consultas de infor-
mación realizadas sobre dicha estruc-
Este proceso de transformación se
tura.
realiza mediante los siguientes pasos:
1. Verificación y refinamiento del Para realizar este proceso de compro-
modelo lógico para determinar su con- bación de validez de la estructura,
sistencia. 2. Definición del esquema recurrimos a la teoría de grafos, se-
físico de almacenamiento de las es- gún la cual una estructura de consul-
tructuras jerárquicas de las dimen- ta es válida cuando está conformada
siones. 3. Identificación de los atri- por trayectorias acíclicas. Al aplicar
butos que conforman las tablas de esta teoría, se puede afirmar que
hechos y las dimensiones. cualquier diseño para una bodega de
datos permitirá siempre consultas co-
rrectas, si la estructura propuesta
Paso 1: está conformada únicamente por di-
Verificación y ajuste mensiones propias, es decir, por tra-
del modelo lógico. yectorias acíclicas.
Durante este paso, se realiza la veri- Si al realizar la comprobación de la
ficación del modelo lógico, obtenido en estructura se encuentran trayecto-
la fase anterior, para garantizar que rias acíclicas, éstas deben ser trans-
el modelo, además de soportar todas formadas, para asegurar la confiabi-
las consultas requeridas por los ni- lidad de las consultas. Las posibles
veles ejecutivos, siempre retorne in- transformaciones son:6
formación confiable.
Para iniciar este proceso de verifica- 1. Ajuste para los casos de trayecto-
ción se debe elaborar una matriz de rias cíclicas simples
cruce, entre los requerimientos de Este caso ocurre cuando la trayecto-
información gerencial, definidos en la ria de una dimensión presenta una
fase inicial, y las estructuras (estre- trayectoria alterna que tiene dos en-
llas), definidas en la fase anterior. En tidades comunes. En la Figura 9, se
la matriz de cruce se confirma si el esquematiza una trayectoria cíclica
requerimiento está completamente simple.
6. Mcguff, F. Designing the perfect Data Warehouse. 1998.
SISTEMAS
& TELEMÁTICA 27
16. Figura 9. Dimensión con trayectoria cíclica.
Las opciones de transformación para 2. Ajuste para los casos de trayecto-
esta clase de trayectorias son: rias alternas, mezcladas con trayec-
torias cíclicas.
• Tratar cada trayectoria como una
Se presenta cuando la trayectoria de
nueva dimensión, lo cual signifi-
una dimensión está conformada por
ca redibujar el diagrama, elimi-
una trayectoria alterna, más una tra-
nando las relaciones N1-A2 y A3-
yectoria cíclica, tal como se esquema-
N4, para luego crear la relación:
tiza en la Figura 10.
Tabla de Hechos - A2.
• Convertir la trayectoria cíclica en
una trayectoria alterna, eliminan-
do la relación A3-N4.
Figura 10. Dimensión con trayectoria alterna, más trayectoria cíclica.
28 SISTEMAS
& TELEMÁTICA
17. En estos casos, el problema ocurre con la bodega de datos, debe ser conver-
la trayectoria cíclica; por lo tanto, la tido en una estructura totalmente
transformación se maneja como se ex- desnormalizada, tal como se presen-
plicó en el caso anterior. ta en la Figura 11. Este modelo físico
está conformado por una tabla de
Paso 2: hechos, y por las entidades en las cua-
Definición del esquema físico del les se almacenarán los dominios de
almacenamiento de las dimensio- las dimensiones con sus correspon-
nes y sus jerarquías. dientes niveles jerárquicos.
El modelo en estrella que conforma
la estructura lógica propuesta para
Figura 11. Modelo lógico en estrella, y modelo físico de la bodega.
Para el proceso de conversión de cada todos los dominios de las entidades
una de las trayectorias que confor- que conforman la trayectoria de la
man el modelo en estrella, en entida- dimensión, es decir, si los dominios
des desnormalizadas, se puede utili- de las entidades que conforman la
zar uno de los siguientes esquemas trayectoria son: {enero, febrero, mar-
de conversión.7 zo, abril ....}; {1er_trim, 2º_trim,
3er_trim, 4º_trim}; {1er_sem,
1. Conversión vertical 2º_sem}, el dominio de la llave prima-
o recursiva ria será: {enero, febrero, marzo, abril,
En esta conversión, se utiliza una lla- ...., 1er_trim, 2º_trim, 3er_trim,
ve primaria única, para cada dimen- 4º_trim; 1er_sem,2º_sem}. En la Fi-
sión. El dominio de esta llave prima- gura 12 se presenta, de manera grá-
ria se obtiene mediante la unión de fica, este esquema de conversión.
7. Mcguff, F. Designing the perfect Data Warehouse. 1998.
SISTEMAS
& TELEMÁTICA 29
18. Figura 12. Conversión vertical de la trayectoria de una dimensión.
Adicionalmente, en este esquema de quico son precalculadas y almacena-
conversión a cada valor del dominio das en la bodega.
se le asocia un valor padre, el cual
Este esquema de conversión es el más
también pertenece al dominio; de esta
recomendado para implementar la
manera se implementa la jerarquía
estructura física de una bodega, cuan-
definida en la trayectoria, represen-
do las dimensiones están compuestas
tada en la dimensión, dentro del mo-
por jerarquías desbalanceadas.
delo en estrella.
Este esquema para el manejo de las 2. Conversión horizontal
jerarquías (id_dimensión, id_padre) En esta conversión, la llave primaria
permite implementar fácilmente la de la dimensión se conforma como
operación de desenrolle («drill- una llave compuesta por las llaves de
down»), cuando se realizan consultas cada una de las entidades que con-
a la bodega de datos. Sin embargo, forman la trayectoria de la dimen-
esta estructura es eficiente, si las sión. En la Figura 13 se presenta, de
agregaciones para cada nivel jerár- manera gráfica, este esquema de con-
versión.
Figura 13: Conversión horizontal de la trayectoria de una dimensión.
30 SISTEMAS
& TELEMÁTICA
19. Este esquema de conversión es el más tos que conforman cada estructura.
recomendable, si las agregaciones de Una vez asignados todos los atribu-
datos se realizan de manera dinámica. tos, se realiza un análisis cruzado en-
tre la tabla de hechos y las dimen-
Paso 3: siones, para establecer los tipos de
Definición de los atributos que cálculo matemático que pueden ser
conforman las tablas de hechos realizados, sobre la tabla de hechos.
y las dimensiones del modelo.
La especificación de los atributos que
En este paso final, se identifican para conforman la tabla de hechos se debe
cada tabla de hechos y cada dimen- realizar siguiendo el formato que apa-
sión las características de los atribu- rece en el Cuadro 3.
Cuadro 3: Formato para la definición de los atributos
de una tabla de hechos.
Igualmente, para la especificación de los atributos que conforman las dimen-
siones se debe utilizar el formato que aparece en el Cuadro 4.
Cuadro 4: Formato para la definición
de los atributos de una dimensión.
SISTEMAS
& TELEMÁTICA 31
20. Finalmente, se deben establecer los de hechos. El resultado de esta revi-
tipos de cálculos matemáticos como sión debe quedar consignado en una
suma, conteo, promedio, mínimo, matriz de cruce, como la presentada
máximo, que pueden ser aplicados a en el Cuadro 5.
los valores almacenados en las tablas
Cuadro 5: Operaciones matemáticas
para cada atributo de la tabla de hechos.
Tabla de hechos
Atributo 1
Dimensiones Suma Conteo Prom. Mín. Máx.
1. Dimensión a
2. Dimensión b
3. Dimensión c
.....
Atributo 2
Dimensiones Suma Conteo Prom. Mín. Máx.
1. Dimensión a
2. Dimensión b
3. Dimensión c
Atributo 3
Dimensiones Suma Conteo Prom. Mín. Máx.
1. Dimensión a
2. Dimensión b
3. Dimensión c
....
A manera de ejemplo, se presenta en los siguientes cuadros la definición de
atributos para la tabla de hechos y para las dimensiones definidas en el ejem-
plo anterior, y esquematizadas en la Figura 7.
32 SISTEMAS
& TELEMÁTICA
21. Cuadro 6: Definición de los atributos de la tabla de hechos sobre ventas.
Nombre de la estructura de la bodega Área de ventas
Tabla de hechos Ventas
Atributos tipo Pk Descripción
Id lugar C(35) Sí Identif. de la dimensión lugar
Id tiempo C(12) Sí Identif. de la dimensión tiempo
id producto C(30) Sí Identif. de la dimensión producto
Unidades vendidas N(8,0) Valor 1 de la tabla de hechos
Pesos-venta N(10,2) Valor 2 de la tabla de hechos
Cuadro 7: Definición de los atributos de las dimensiones,
para la estructura de ventas.
Nombre de la estructura de la bodega
Nombre de la estructura de la bodega
Nombre de la estructura de la bodega
SISTEMAS
& TELEMÁTICA 33
22. Cuadro 8: Operaciones matemáticas para cada atributo
de la tabla de hechos sobre ventas.
Tabla de hechos Ventas
Atributo 1 Unidades vendidas
Dimensiones Suma Conteo Prom Mín Máx
Lugar
Tiempo
Producto
Atributo 2 Pesos-venta
Dimensiones Suma Conteo Prom Mín Máx
Lugar
Tiempo
Producto
CONCLUSIÓN organizaciones se realiza de manera
Mediante la aplicación del enfoque de intuitiva y, en otras mediante la uti-
Sistemas para la definición de los in- lización de estructuras de bodegas
dicadores claves de gestión de la or- que han sido definidas para otras or-
ganización, se ha logrado articular ganizaciones. El modelo propuesto,
una propuesta para modelar, de ma- que se aparta de muchos de los enfo-
nera ordenada y sistémica, las estruc- ques presentados por los investigado-
turas de las bodegas de datos que ser- res en este campo, se convierte en una
virán de soporte a la implementación opción válida para el diseño de siste-
de sistemas de información gerencial, mas de información gerencial, en par-
hechos a la medida de las necesida- ticular para el diseño de bodegas de
des de información de la gerencia. datos departamentalizadas («Data
Esta propuesta facilita, ordena y sis- Marts»).
tematiza un proceso que en algunas
34 SISTEMAS
TELEMÁTICA
23. BIBLIOGRAFÍA Modeling Techniques for Data
Warehouse. IBM. 1998.
• Mcguff, F. Designing the perfect
Data Warehouse. 1998. http:// • Todman, C. Designing a Data
members.aol.com/fmcguff/dwmo- Warehouse: Supporting Customer
del/index.htm Relationship. Prentice Hall. 2001
• Kimball R. The Data Warehouse
Toolkit. John Wiley Sons, 1996.
CURRÍCULO
• Inmon W.H. Building The Data
Warehouse. QED Press /Jhon José Hernando Bahamón L. Inge-
Wiley, 1992. niero Electrónico de la Universidad
del Cauca, especialista en Adminis-
• Golfarelli, M; Maio, D; Rizzi, S.
tración de la Universidad Icesi y ma-
Conceptual Design of Data Ware-
gíster en Dirección Universitaria de
house From E/R schemes. http//
la Universidad de los Andes. Profe-
www.csr.unib.it/~golfare/db.html,
sor investigador de la Universidad
1998.
Icesi. Vinculado a la Universidad Ice-
• Bahamón, J. H. Construcción de si desde 1988. Ha sido jefe del Depar-
indicadores de gestión bajo el en- tamento Académico de Sistemas
foque de sistemas. ST Revista de (1988-1998), Director del programa
la Facultad de Ingeniería, Univer- de Ingeniería de Sistemas (1998-
sidad Icesi. 2003. 2000), y en la actualidad es el Direc-
• Chuck, B; Dick, H; Don, S; Rhon- tor Académico de la Universidad.
da; Eunsaeng, K.; Ann, V. Data
SISTEMAS
TELEMÁTICA 35