SlideShare ist ein Scribd-Unternehmen logo
1 von 24
Downloaden Sie, um offline zu lesen
Propuesta de un método para el diseño
                   y modelado de una bodega de datos




                                          José Hernando Bahamón L.
                                                               Universidad Icesi
                                                         jbahamon@icesi.edu.co




Fecha de recepción: 15-4-2003                                  Fecha de aceptación: 25-8-2003




RESUMEN                                    ses. La primera fase comprende la
El desarrollo de los Sistemas de In-       identificación de las necesidades de
formación Gerencial basados en tec-        información gerencial, desde la pers-
nologías de Data Warehouse y Herra-        pectiva del negocio. La segunda fase
mientas Olap, es relativamente re-         comprende todas las actividades re-
ciente y, por lo tanto, no existe una      lacionadas con la elaboración de un
propuesta metodológica universal-          modelo lógico-conceptual de la estruc-
mente válida y aceptada como tal, por      tura de la bodega de datos. La terce-
la comunidad académica.                    ra fase incluye los pasos para reali-
                                           zar el diseño físico de la estructura
El presente artículo expone una pro-       de la bodega de datos.
puesta metodológica para la realiza-
ción del diseño de una bodega de da-       PALABRAS CLAVES
tos, que utiliza como eje articulador
                                           Bodegas de datos, método de diseño
la identificación de las necesidades de
                                           de la estructura de una bodega de
información por parte de la gerencia,
                                           datos.
para el soporte de los procesos de con-
trol y de toma de decisiones.              ABSTRACT
El método propuesto está compuesto         The development of Management In-
de ocho pasos agrupados en tres fa-        formation Systems based on Ware-


                                               SISTEMAS
                                               & TELEMÁTICA                           13
house Data technologies and Olap           information requirements from a bu-
tools is relatively new. Therefore, the-   siness perspective. The second one
re is no valid methodological appro-       deals with all the activities associa-
ach that is generally accepted as such     ted with the preparation of a logical
by the academic community.                 conceptual model for the data ware-
                                           house structure, and the third stage
This article presents a methodologi-
                                           includes the steps to make the phy-
cal approach to the design of a data
                                           sical design of the data warehouse
warehouse using the identification of
                                           structure.
management information require-
ments as a shaft that supports the
                                           KEY WORDS
control and decision-making proces-
ses. The suggested approach consists       Data warehouses, approach to the
of eight steps grouped in three diffe-     design of a data warehouse struc-
rent stages. The first stage encompas-     ture.
ses the identification of management       Clasificación: A




14                       SISTEMAS
                    & TELEMÁTICA
INTRODUCCIÓN                                          MÉTODO PROPUESTO
El desarrollo de los Sistemas de In-                  El método de diseño propuesto está
formación Gerencial basados en tec-                   centrado en la identificación de la
nologías de Data Warehouse y herra-                   información clave y relevante para so-
mientas Olap, es relativamente re-                    portar los procesos de dirección y de
ciente y, por lo tanto, no existe una                 toma de decisiones dentro de la orga-
propuesta metodológica universal-                     nización. Este método utiliza, como
mente válida y aceptada como tal, por                 punto de partida, la identificación y
la comunidad académica.                               el modelado de: qué es lo que el
                                                      negocio está tratando de alcan-
Entre las propuestas más conocidas
                                                      zar, para luego elaborar una estruc-
están: 1. Ralph Kimball,1 con un es-
                                                      tura que apoye el proceso de gestión
quema centrado en la identificación
                                                      hacia el logro de las metas definidas.
de los procesos de la empresa, como
elemento clave para la definición de                  Una vez que la información clave de
la estructura de variables y dimen-                   apoyo a los procesos de gestión y con-
siones; 2. W.H. Inmon,2 con un esque-                 trol de la organización ha sido iden-
ma que parte de la construcción del                   tificada, se inicia la elaboración del
modelo de datos corporativos, elabo-                  modelo lógico-conceptual de la estruc-
rado al más alto nivel de abstracción,                tura de la bodega de datos, que so-
para luego derivar la estructura del                  portará las consultas y la exploración
modelo de datos, para el diseño de la                 de los datos, a partir de los cuales se
bodega; 3. Golfarelli Matteo, Maio                    construirán los indicadores de gestión
Dario, Rizzi Stefano3 proponen un                     requeridos por los niveles directivos
esquema que parte de los modelos E-                   de la organización.
R descriptivos de los sistemas tran-
                                                      Para darle un orden a este proceso
saccionales de la organización, para
                                                      sistémico de diseño, los pasos del
luego derivar el modelo E-R de la es-
                                                      método propuesto, tal como se presen-
tructura, para la bodega de datos.
                                                      tan en la Figura 1, se han agrupado
En este artículo se presenta una pro-                 en las siguientes fases:
puesta de sistematización del proce-
                                                      • Fase 1: Identificación de las ne-
so de diseño de una bodega de datos,
                                                        cesidades de información geren-
que se aparta de los esquemas de di-
                                                        cial, desde la perspectiva del ne-
seño referidos, y que utiliza como eje
                                                        gocio.
articulador, la identificación de la in-
formación gerencial, para el soporte                  • Fase 2: Elaboración del modelo ló-
de los procesos de control y de toma                    gico-conceptual de la estructura
de decisiones en los niveles directi-                   de la bodega de datos.
vos de la organización.




1.   Kimball R. The Data Warehouse Toolkit. John Wiley & Sons, 1996.
2.   Inmon W.H. Building The Data Warehouse. QED Press / John Wiley & Sons, 1992.
3.   Golfarelli M., Maio D., Rizzi S. Conceptual Design of Data Warehouse From E/R Schemes.
     http//www.csr.unib.it/~golfare/db.html, 1998.




                                                            SISTEMAS
                                                            & TELEMÁTICA                      15
• Fase 3: Elaboración del modelo fí-                   «¿Cuál es la información que desea
  sico de la bodega de datos.                          obtener del sistema de información
                                                       gerencial?». Este enfoque puede resul-
                                                       tar muy peligroso, si el directivo no
Fase 1:                                                realiza un proceso sistemático y orde-
Identificación de las necesidades                      nado, para establecer sus necesidades
de información gerencial, desde                        de información, en relación con sus ac-
la perspectiva del negocio.                            tividades de gestión y control.
La primera fase, a partir de la cual                   Una forma ordenada y sistemática
se realiza el proceso de diseño de la                  para realizar esta fase de identifica-
estructura para una bodega de datos,                   ción de las necesidades de informa-
comprende la identificación de las ne-                 ción, que soporte los procesos de ges-
cesidades de información gerencial,                    tión y control gerencial, es la aplica-
lo que significa hacer explícitos los                  ción del enfoque de sistemas, para
objetivos y los factores claves de éxi-                guiar el proceso de revisión o defini-
to de la organización, o de un área                    ción de: 1. Los objetivos estratégicos
del negocio.                                           del negocio o del área; 2. Los factores
                                                       clave para el logro de los objetivos de-
Es bastante común empezar este pro-
                                                       finidos y 3. Los indicadores de con-
ceso de identificación y modelado
                                                       trol, tanto de los objetivos como de los
mediante entrevistas a los directivos,
                                                       factores clave.4
en las cuales la pregunta central es:




4.   Véase Bahamón José H. Construcción de indicadores de gestión bajo el enfoque de sistemas. S&T Revista
     de la Facultad de Ingeniería, Universidad Icesi. 2003.




16                             SISTEMAS
                          & TELEMÁTICA
Método para el diseño y modelado de una bodega de datos


           Fase 1: Identificación de las necesidades de infor-
           mación gerencial, desde la perspectiva del negocio.



           Fase 2: Elaboración del modelo lógico-conceptual
           de la estructura de la bodega de datos.


                 2.1. Definir las tablas de hechos o las variables de la
                 estructura.

                 2.2. Identificar, para cada tabla de hechos, las dimen-
                 siones que la referencian.


                 2.3. Establecer el nivel de granulación y los niveles de
                 agregación.


                 2.4. Elaborar el diagrama en estrella que representa
                 la estructura de la bodega.


          Fase 3: Elaboración del modelo físico de la bodega
          de datos.


                  3.1. Verificación y ajuste del modelo lógico.


                 3.2. Definición del esquema físico del almacenamien-
                 to de las dimensiones y sus jerarquías.


                  3.3. Definición de los atributos que conforman las
                  tablas de hechos.


Figura 1. Método para el diseño y modelado de una bodega.




                                            SISTEMAS
                                            & TELEMÁTICA                    17
Como resultado de esta fase, se ten-      tión (necesidades de información ge-
drá una visión del negocio y de la in-    rencial), identificados en la fase an-
formación requerida para la dirección     terior, y termina con la construcción
y el control gerencial, representada      de una representación multidimen-
fundamentalmente por: Los objetivos       sional de las variables que conforman
del negocio; los factores clave de éxi-   cada indicador. En esta representa-
to y, en especial, un conjunto de indi-   ción multidimensional, cada variable
cadores clave de la gestión.              es modelada mediante un arreglo di-
                                          mensional (multidimensional) de cel-
Fase 2:                                   das, como se presenta en la Figura 2.
Elaboración del modelo lógico-
                                          Para facilitar el proceso de elabora-
conceptual de la estructura de la
                                          ción del modelo lógico, se utiliza una
bodega.
                                          representación gráfica denominada
En esta fase se elabora el modelo ló-     diagrama tipo estrella, donde el ele-
gico de la estructura de la bodega, que   mento central del esquema es la Va-
soportará las consultas, mediante las     riable o Tabla de Hechos («Fact»), la
cuales se obtendrá la información re-     cual es referenciada por un conjunto
querida por los niveles directivos        de ejes, denominados Dimensiones, a
como apoyo a sus procesos de gestión      través de los cuales se seleccionan los
y de toma de decisiones.                  valores contenidos en la tabla de he-
                                          chos. En la Figura 3, se esquematiza
La elaboración de este modelo lógico
                                          el modelo de un diagrama en estrella.
comienza con los indicadores de ges-




18                      SISTEMAS
                   & TELEMÁTICA
Figura 2. Vista multidimensional de una de las variables que conforman
          un indicador.




Figura 3. Diagrama en estrella de una estructura multidimensional.




                                         SISTEMAS
                                         & TELEMÁTICA                19
Antes de presentar los pasos propues-            Cuadro 1 se presentan las definicio-
tos por el método para la elaboración            nes adoptadas para los diferentes
del modelo lógico, es pertinente pre-            conceptos utilizados en el método pro-
cisar algunos de los términos utiliza-           puesto.
dos en el método propuesto. En el


                         Cuadro 1: Definición de conceptos básicos.


 Gráfica                    Una gráfica es una red de nodos interconectados.
                            Una gráfica direccional es aquella en la cual la conexión entre
                            dos nodos tiene una dirección específica.
                            Un modelo E-R puede ser considerado una gráfica direccional.

 Trayectorias cíclicas      En una gráfica, una trayectoria acíclica es aquella que sólo
 y acíclicas                tiene una forma de recorrido (en un solo sentido).
                            Una trayectoria cíclica es aquella que se puede recorrer en dos
                            o más secuencias diferentes.

 Tabla de hechos            Es la tabla central de la estructura de la bodega. Esta tabla
                            contiene los datos de interés para el negocio, es decir, los valo-
                            res para la construcción de los indicadores claves del negocio.
                            Técnicamente, la tabla de hechos es una entidad de intersec-
                            ción cuya llave primaria está compuesta por la unión de los
                            dominios de las diferentes dimensiones que la referencian.


 Dimensión                  Las dimensiones corresponden a los ejes con los cuales se cons-
                            truye la vista multidimensional de la información clave del ne-
                            gocio, almacenada en la tabla de hechos.
                            Las atributos almacenados en las dimensiones determinan la
                            granulación adoptada para el modelo.
                            Las dimensiones pueden ser:
                            – Propias: Cuando el conjunto de entidades que conforman
                              la dimensión se encuentran unidas a la tabla de hechos, en
                              una trayectoria acíclica.
                            – Impropias: Cuando el conjunto de entidades que confor-
                              man la dimensión se encuentran unidas a la tabla de he-
                              chos, en una trayectoria cíclica.
                            – De Información: Cuando los atributos contenidos en la
                              dimensión definen qué tipo de datos se encuentran almace-
                              nados en la tabla de hechos.

 Jerarquías                 Determinan cómo las instancias de la tabla de hechos pueden ser
                            agregadas. Las jerarquías permiten las operaciones de «drill-down»
                            o «rollup», en los procesos de consulta.
                            Una jerarquía está conformada por el conjunto de entidades
                            que constituyen la dimensión.




20                      SISTEMAS
                   & TELEMÁTICA
A continuación se presentan los cua-       • El indicador 1 del F.C.E1 puede
tro pasos propuestos para la sistema-        ser construido con dos tablas de
tización del proceso de elaboración del      hechos que son: ventas por ven-
modelo lógico:                               dedor y cuota de ventas de cada
                                             vendedor.
Paso No. 1:
                                           • El indicador 2 del F.C.E1 puede
Definir las tablas de hechos o las
                                             ser construido con dos tablas de
variables de la estructura.
                                             hechos que son: número de visi-
Este paso se realiza a partir del con-       tas realizadas por cada vendedor,
junto de los indicadores de gestión,         y número de visitas presupuesta-
definidos en la fase de identificación       das por cada vendedor.
de las necesidades de información
                                           • El indicador 1 del F.C.E2 puede
gerencial, desde la perspectiva del
                                             ser construido con una tabla de
negocio. El paso se inicia con la eva-
                                             hechos: número de clientes nue-
luación de las variables (divisores y
                                             vos en la base de datos. En este
dividendos) de cada indicador, para
                                             caso, el denominador del indica-
determinar cuáles de éstas pueden
                                             dor se asume como un único valor
ser almacenadas en una tabla de he-
                                             y, por lo tanto, no tiene sentido
chos, y cuáles no.
                                             almacenarlo en otra tabla de he-
En el Cuadro 2 se presenta, a mane-          chos.
ra de ejemplo, la información obteni-
                                           • Los demás indicadores se anali-
da, al aplicar los pasos de la fase 1 al
                                             zan de igual manera.
área de ventas de una organización.
A partir de estos resultados se iden-      En suma, al realizar el análisis de
tifican las variables o tablas de he-      todos los indicadores, obtenemos las
chos, como lo establece el paso 1 de       siguientes tablas de hecho:
esta fase.
                                           • Ventas.
Aplicación del paso 1: Identificación
                                           • Ventas por vendedor.
de las tablas de hechos
                                           • Cuota de ventas de cada vende-
• El indicador definido para el mo-
                                             dor.
  nitoreo del objetivo puede ser
  construido con una sola tabla de         • Número de visitas realizadas por
  hechos: Ventas. Se toma una sola           cada vendedor.
  variable, por cuanto las ventas del      • Número de visitas presupuesta-
  año y las ventas del año anterior,         das por cada vendedor.
  que son las dos variables que con-
  forman el indicador, se pueden           • Número de clientes nuevos en la
  almacenar en la misma tabla de             base de datos.
  hechos.                                  • Número de vendedores capacita-
                                             dos que aprobaron los cursos.




                                               SISTEMAS
                                               & TELEMÁTICA               21
Cuadro 2: Información gerencial del área de ventas,
                      obtenida al realizar la fase 1.

Área del Negocio - Descripción. Se trabaja con el área de ventas de una orga-
nización dedicada a la producción de recipientes elaborados en plástico.
Objetivo del Área: para propósitos del ejemplo, se toma el siguiente objetivo:
     Lograr al final del año un incremento del 15% en las ventas totales de la
     compañía, con respecto a las ventas del año anterior.
Factores claves de éxito. Luego de realizado el análisis de las acciones y las
condiciones necesarias para garantizar el logro del objetivo planteado, se identi-
ficaron los siguientes F.C.E:
 • F.C.E.1: Planeación y control de la fuerza de ventas.
 • F.C.E.2: Búsqueda de nuevos clientes rentables para la organización.
 • F.C.E.3: Capacitación y entrenamiento de la fuerza de ventas.
Indicadores claves de gestión. Para el control y seguimiento de los F.C.E y los
objetivos, se proponen los siguientes indicadores:


                Ventas del año
I_obj:                                    -1
            Ventas del año anterior

              Ventas del vendedor
I1_FCE1:
                Cuota de ventas

              Número de visitas de venta realizadas
I2_FCE1:
                Número de visitas presupuestadas

            Número de clientes nuevos en la base de datos
I1_FCE2:
              Número de clientes nuevos presupuestados

              Número de vendedores capacitados que aprobaron los cursos
I1_FCE3:
                  Número presupuestado de vendedores capacitados




22                      SISTEMAS
                   & TELEMÁTICA
Paso No. 2:                               En este paso, se espera que el usua-
Identificar, para cada tabla de           rio visualice cada variable, como un
hechos, las dimensiones que la            conjunto de valores almacenados en
referencian.                              una estructura de varias dimensio-
                                          nes, donde los valores almacenados
Para cada variable o tabla de hechos
                                          son referenciados por la combinación
se identifican, con la colaboración del
                                          de los valores definidos para cada eje
usuario líder del área de negocio, los
                                          (dominio de la dimensión), tal como
ejes de visualización multidimensio-
                                          se esquematiza en la Figura 4.
nal los cuales constituyen las dimen-
siones de la variable.




Figura 4: Esquema de una vista multidimensional de una tabla de hechos.



Paso 3:                                   Hechos sobre Ventas, definida en el
Establecer el nivel de granula-           ejemplo anterior.
ción y los niveles de agregación
                                          Aplicación del paso 2: Identificación
de cada dimensión.
                                          de las dimensiones.
Una vez que las dimensiones han sido
                                          Supongamos que el gerente de ven-
identificadas se debe establecer, para
                                          tas expresa su interés por visualizar
cada una de ellas, el menor nivel de
                                          la información de ventas organizada
granulación, el cual corresponde al
                                          de la siguiente manera: primero, por
conjunto de atributos que referencian
                                          cada producto de la compañía; en se-
el mayor nivel de detalle deseado
                                          gundo término, por cada lugar en
para la variable o tabla de hechos.
                                          donde se venden los productos y, fi-
A manera de ejemplo, se aplican los       nalmente, por cada semana. Podemos
dos pasos anteriores para la Tabla de     establecer la necesidad de utilizar


                                              SISTEMAS
                                              & TELEMÁTICA                 23
tres ejes para elaborar la vista mul-                 chos, por cada dimensión. Estos ni-
tidimensional (dimensiones) de la                     veles de agregación representan la
Tabla de Hechos - Ventas:                             jerarquía de cada dimensión.
• Dim1: Producto                                      • Jerarquía en la Dim. Produc-
                                                        to: Las ventas por productos pue-
• Dim2: Lugar de venta
                                                        den ser agregadas por grupos de
• Dim3: Tiempo.                                         productos, por líneas de produc-
                                                        tos y, por el total de la venta. De
Aplicación del paso 3: Definición del
                                                        esta manera, los niveles de agre-
nivel de granulación.
                                                        gación de la dimensión producto
De acuerdo con la solicitud del geren-                  son:
te, se establece para cada dimensión
                                                         – Por grupos de productos.
la siguiente granulación:
• Dim. Producto: El menor nivel                          – Por líneas de productos.
  de granulación es el Tipo de Pro-                      – Total.
  ductos. Podemos establecer otros
                                                      • Jerarquía en la Dim. Lugar:
  niveles como: Línea de Productos,
                                                        Las ventas por lugar pueden ser
  que tiene un nivel de granulación
                                                        agregadas por regiones y por el
  mayor, pero un menor nivel de de-
                                                        total del país.
  talle en la variable ventas; o Re-
  ferencias de Productos, que tiene                   • Jerarquía en la Dim. Tiempo:
  un menor nivel de granulación,                        Las ventas por tiempo pueden ser
  pero un mayor nivel de detalle.                       agregadas por mes, por trimestre,
                                                        por semestre, por año.
• Dim. Lugar: El nivel de granu-
  lación requerido es la Ciudad. Se
  habrían podido seleccionar otros
                                                      Paso 4:
  niveles, como Almacén, que tiene
                                                      Elaborar el diagrama en estrella
  un menor nivel, o Región, que tie-
                                                      que representa la estructura de
  ne uno mayor.
                                                      la bodega.
• Dim. Tiempo: El menor nivel de
                                                      Luego de identificar los elementos
  granulación requerido es la Sema-
                                                      que conforman la estructura de la
  na. Se habrían podido seleccionar
                                                      vista multidimensional, de la infor-
  otros niveles, como el Día, que tie-
                                                      mación gerencial requerida por la
  ne un menor nivel, o el Mes, que
                                                      organización, se pasa a la elaboración
  tiene uno mayor.
                                                      de una representación gráfica, en for-
Una vez se han definido los menores                   ma de estrella; para ello se puede uti-
niveles de granulación para cada di-                  lizar la notación simplificada de los
mensión, se identifican los niveles de                diagramas E-R, o la notación deno-
agregación requeridos para los valo-                  minada «Dot modeling».5
res almacenados en la tabla de he-



5.   Todman, Chris. Designing a Data Warehouse: Supporting Customer Relationship. Prentice Hall, 2001.




24                            SISTEMAS
                         & TELEMÁTICA
Notación tipo E-R:                       junto de trayectorias de entidades y
En esta notación, el diagrama en es-     relaciones de uno a muchos, que co-
trella está conformado por una enti-     rresponde a las dimensiones y a sus
dad central asociativa, que correspon-   jerarquías. En la Figura 5 se presen-
de a la tabla de hechos, y por un con-   ta un diagrama en estrella con esta
                                         notación.




Figura 5. Representación de un diagrama en estrella, mediante la
          notación tipo E-R.



Notación «Dot Modeling»                  trayectorias compuestas por puntos
En esta notación, el diagrama en es-     («dots»), que representan las dimen-
trella está conformado por una enti-     siones y sus jerarquías. En la Figura
dad central que corresponde a la Ta-     6 se presenta un diagrama en estre-
bla de Hechos, y por un conjunto de      lla con esta notación.




Figura 6. Representación de un diagrama en estrella, mediante la
          notación «Dot Modeling».


                                             SISTEMAS
                                             & TELEMÁTICA                25
A manera de ejemplo se presenta en      anterior. En la Figura 8 se represen-
la Figura 7, el diagrama en estrella,   tan los mismos elementos de la es-
con notación «Dot Modeling», para la    tructura de la bodega, pero con nota-
Tabla de Hechos y para las dimen-       ción tipo E-R.
siones identificadas en el ejemplo




Figura 7. Representación, mediante la notación «Dot Modeling», de la
          estructura para la bodega de datos del ejemplo anterior.




Figura 8. Representación, mediante la notación E-R, de la estructura para
          la bodega de datos del ejemplo anterior.




26                     SISTEMAS
                  & TELEMÁTICA
Fase 3:                                                soportado. Si esta verificación no es
Elaboración de la estructura fí-                       correcta, se debe retornar a la fase
sica de la bodega                                      anterior, para incorporar las estruc-
                                                       turas que soporten los requerimien-
Durante esta fase, se realiza la trans-
                                                       tos faltantes de información.
formación del modelo lógico concep-
tual en la estructura física, que pos-                 Terminada la revisión anterior, el
teriormente será implementada en                       proceso continúa con la evaluación de
alguna herramienta de «Data Ware-                      la estructura, para asegurar la vali-
house».                                                dez de todas las consultas de infor-
                                                       mación realizadas sobre dicha estruc-
Este proceso de transformación se
                                                       tura.
realiza mediante los siguientes pasos:
1. Verificación y refinamiento del                     Para realizar este proceso de compro-
modelo lógico para determinar su con-                  bación de validez de la estructura,
sistencia. 2. Definición del esquema                   recurrimos a la teoría de grafos, se-
físico de almacenamiento de las es-                    gún la cual una estructura de consul-
tructuras jerárquicas de las dimen-                    ta es válida cuando está conformada
siones. 3. Identificación de los atri-                 por trayectorias acíclicas. Al aplicar
butos que conforman las tablas de                      esta teoría, se puede afirmar que
hechos y las dimensiones.                              cualquier diseño para una bodega de
                                                       datos permitirá siempre consultas co-
                                                       rrectas, si la estructura propuesta
Paso 1:                                                está conformada únicamente por di-
Verificación y ajuste                                  mensiones propias, es decir, por tra-
del modelo lógico.                                     yectorias acíclicas.
Durante este paso, se realiza la veri-                 Si al realizar la comprobación de la
ficación del modelo lógico, obtenido en                estructura se encuentran trayecto-
la fase anterior, para garantizar que                  rias acíclicas, éstas deben ser trans-
el modelo, además de soportar todas                    formadas, para asegurar la confiabi-
las consultas requeridas por los ni-                   lidad de las consultas. Las posibles
veles ejecutivos, siempre retorne in-                  transformaciones son:6
formación confiable.
Para iniciar este proceso de verifica-                 1. Ajuste para los casos de trayecto-
ción se debe elaborar una matriz de                    rias cíclicas simples
cruce, entre los requerimientos de                     Este caso ocurre cuando la trayecto-
información gerencial, definidos en la                 ria de una dimensión presenta una
fase inicial, y las estructuras (estre-                trayectoria alterna que tiene dos en-
llas), definidas en la fase anterior. En               tidades comunes. En la Figura 9, se
la matriz de cruce se confirma si el                   esquematiza una trayectoria cíclica
requerimiento está completamente                       simple.




6.   Mcguff, F. Designing the perfect Data Warehouse. 1998.




                                                              SISTEMAS
                                                              & TELEMÁTICA              27
Figura 9. Dimensión con trayectoria cíclica.

Las opciones de transformación para     2. Ajuste para los casos de trayecto-
esta clase de trayectorias son:         rias alternas, mezcladas con trayec-
                                        torias cíclicas.
• Tratar cada trayectoria como una
                                        Se presenta cuando la trayectoria de
  nueva dimensión, lo cual signifi-
                                        una dimensión está conformada por
  ca redibujar el diagrama, elimi-
                                        una trayectoria alterna, más una tra-
  nando las relaciones N1-A2 y A3-
                                        yectoria cíclica, tal como se esquema-
  N4, para luego crear la relación:
                                        tiza en la Figura 10.
  Tabla de Hechos - A2.
• Convertir la trayectoria cíclica en
  una trayectoria alterna, eliminan-
  do la relación A3-N4.




Figura 10. Dimensión con trayectoria alterna, más trayectoria cíclica.




28                     SISTEMAS
                  & TELEMÁTICA
En estos casos, el problema ocurre con                 la bodega de datos, debe ser conver-
la trayectoria cíclica; por lo tanto, la               tido en una estructura totalmente
transformación se maneja como se ex-                   desnormalizada, tal como se presen-
plicó en el caso anterior.                             ta en la Figura 11. Este modelo físico
                                                       está conformado por una tabla de
Paso 2:                                                hechos, y por las entidades en las cua-
Definición del esquema físico del                      les se almacenarán los dominios de
almacenamiento de las dimensio-                        las dimensiones con sus correspon-
nes y sus jerarquías.                                  dientes niveles jerárquicos.
El modelo en estrella que conforma
la estructura lógica propuesta para




Figura 11. Modelo lógico en estrella, y modelo físico de la bodega.



Para el proceso de conversión de cada                  todos los dominios de las entidades
una de las trayectorias que confor-                    que conforman la trayectoria de la
man el modelo en estrella, en entida-                  dimensión, es decir, si los dominios
des desnormalizadas, se puede utili-                   de las entidades que conforman la
zar uno de los siguientes esquemas                     trayectoria son: {enero, febrero, mar-
de conversión.7                                        zo, abril ....}; {1er_trim, 2º_trim,
                                                       3er_trim, 4º_trim}; {1er_sem,
1. Conversión vertical                                 2º_sem}, el dominio de la llave prima-
    o recursiva                                        ria será: {enero, febrero, marzo, abril,
En esta conversión, se utiliza una lla-                ...., 1er_trim, 2º_trim, 3er_trim,
ve primaria única, para cada dimen-                    4º_trim; 1er_sem,2º_sem}. En la Fi-
sión. El dominio de esta llave prima-                  gura 12 se presenta, de manera grá-
ria se obtiene mediante la unión de                    fica, este esquema de conversión.




7.   Mcguff, F. Designing the perfect Data Warehouse. 1998.




                                                              SISTEMAS
                                                              & TELEMÁTICA                29
Figura 12. Conversión vertical de la trayectoria de una dimensión.




Adicionalmente, en este esquema de      quico son precalculadas y almacena-
conversión a cada valor del dominio     das en la bodega.
se le asocia un valor padre, el cual
                                        Este esquema de conversión es el más
también pertenece al dominio; de esta
                                        recomendado para implementar la
manera se implementa la jerarquía
                                        estructura física de una bodega, cuan-
definida en la trayectoria, represen-
                                        do las dimensiones están compuestas
tada en la dimensión, dentro del mo-
                                        por jerarquías desbalanceadas.
delo en estrella.
Este esquema para el manejo de las      2. Conversión horizontal
jerarquías (id_dimensión, id_padre)     En esta conversión, la llave primaria
permite implementar fácilmente la       de la dimensión se conforma como
operación de desenrolle («drill-        una llave compuesta por las llaves de
down»), cuando se realizan consultas    cada una de las entidades que con-
a la bodega de datos. Sin embargo,      forman la trayectoria de la dimen-
esta estructura es eficiente, si las    sión. En la Figura 13 se presenta, de
agregaciones para cada nivel jerár-     manera gráfica, este esquema de con-
                                        versión.




Figura 13: Conversión horizontal de la trayectoria de una dimensión.




30                     SISTEMAS
                  & TELEMÁTICA
Este esquema de conversión es el más      tos que conforman cada estructura.
recomendable, si las agregaciones de      Una vez asignados todos los atribu-
datos se realizan de manera dinámica.     tos, se realiza un análisis cruzado en-
                                          tre la tabla de hechos y las dimen-
Paso 3:                                   siones, para establecer los tipos de
Definición de los atributos que           cálculo matemático que pueden ser
conforman las tablas de hechos            realizados, sobre la tabla de hechos.
y las dimensiones del modelo.
                                          La especificación de los atributos que
En este paso final, se identifican para   conforman la tabla de hechos se debe
cada tabla de hechos y cada dimen-        realizar siguiendo el formato que apa-
sión las características de los atribu-   rece en el Cuadro 3.

           Cuadro 3: Formato para la definición de los atributos
                        de una tabla de hechos.




Igualmente, para la especificación de los atributos que conforman las dimen-
siones se debe utilizar el formato que aparece en el Cuadro 4.


                    Cuadro 4: Formato para la definición
                     de los atributos de una dimensión.




                                              SISTEMAS
                                              & TELEMÁTICA                  31
Finalmente, se deben establecer los        de hechos. El resultado de esta revi-
tipos de cálculos matemáticos como         sión debe quedar consignado en una
suma, conteo, promedio, mínimo,            matriz de cruce, como la presentada
máximo, que pueden ser aplicados a         en el Cuadro 5.
los valores almacenados en las tablas



                     Cuadro 5: Operaciones matemáticas
                    para cada atributo de la tabla de hechos.


  Tabla de hechos

  Atributo 1

  Dimensiones          Suma       Conteo        Prom.     Mín.        Máx.
  1. Dimensión a
  2. Dimensión b
  3. Dimensión c
  .....

  Atributo 2

  Dimensiones          Suma       Conteo        Prom.     Mín.        Máx.
  1. Dimensión a
  2. Dimensión b
  3. Dimensión c


  Atributo 3

  Dimensiones           Suma      Conteo       Prom.      Mín.        Máx.
  1. Dimensión a
  2. Dimensión b
  3. Dimensión c
     ....



A manera de ejemplo, se presenta en los siguientes cuadros la definición de
atributos para la tabla de hechos y para las dimensiones definidas en el ejem-
plo anterior, y esquematizadas en la Figura 7.




32                       SISTEMAS
                    & TELEMÁTICA
Cuadro 6: Definición de los atributos de la tabla de hechos sobre ventas.



 Nombre de la estructura de la bodega                  Área de ventas

 Tabla de hechos                                       Ventas

 Atributos                              tipo      Pk       Descripción
 Id lugar                               C(35)     Sí       Identif. de la dimensión lugar
 Id tiempo                              C(12)     Sí       Identif. de la dimensión tiempo
 id producto                            C(30)     Sí       Identif. de la dimensión producto
 Unidades vendidas                      N(8,0)             Valor 1 de la tabla de hechos
 Pesos-venta                            N(10,2)            Valor 2 de la tabla de hechos




            Cuadro 7: Definición de los atributos de las dimensiones,
                        para la estructura de ventas.


Nombre de la estructura de la bodega




 Nombre de la estructura de la bodega




 Nombre de la estructura de la bodega




                                                           SISTEMAS
                                                           & TELEMÁTICA                        33
Cuadro 8: Operaciones matemáticas para cada atributo
                    de la tabla de hechos sobre ventas.


   Tabla de hechos      Ventas

   Atributo 1           Unidades vendidas

   Dimensiones          Suma         Conteo      Prom         Mín       Máx
   Lugar                                                              
   Tiempo                                                             
   Producto                                                           

   Atributo 2         Pesos-venta

   Dimensiones          Suma         Conteo      Prom         Mín       Máx
   Lugar                                                              
   Tiempo                                                             
   Producto                                                           




CONCLUSIÓN                                  organizaciones se realiza de manera
Mediante la aplicación del enfoque de       intuitiva y, en otras mediante la uti-
Sistemas para la definición de los in-      lización de estructuras de bodegas
dicadores claves de gestión de la or-       que han sido definidas para otras or-
ganización, se ha logrado articular         ganizaciones. El modelo propuesto,
una propuesta para modelar, de ma-          que se aparta de muchos de los enfo-
nera ordenada y sistémica, las estruc-      ques presentados por los investigado-
turas de las bodegas de datos que ser-      res en este campo, se convierte en una
virán de soporte a la implementación        opción válida para el diseño de siste-
de sistemas de información gerencial,       mas de información gerencial, en par-
hechos a la medida de las necesida-         ticular para el diseño de bodegas de
des de información de la gerencia.          datos departamentalizadas («Data
Esta propuesta facilita, ordena y sis-      Marts»).
tematiza un proceso que en algunas




34                        SISTEMAS
                      TELEMÁTICA
BIBLIOGRAFÍA                              Modeling Techniques for Data
                                          Warehouse. IBM. 1998.
• Mcguff, F. Designing the perfect
  Data Warehouse. 1998. http://        • Todman, C. Designing a Data
  members.aol.com/fmcguff/dwmo-          Warehouse: Supporting Customer
  del/index.htm                          Relationship. Prentice Hall. 2001
• Kimball R. The Data Warehouse
  Toolkit. John Wiley  Sons, 1996.
                                       CURRÍCULO
• Inmon W.H. Building The Data
  Warehouse. QED Press /Jhon           José Hernando Bahamón L. Inge-
  Wiley, 1992.                         niero Electrónico de la Universidad
                                       del Cauca, especialista en Adminis-
• Golfarelli, M; Maio, D; Rizzi, S.
                                       tración de la Universidad Icesi y ma-
  Conceptual Design of Data Ware-
                                       gíster en Dirección Universitaria de
  house From E/R schemes. http//
                                       la Universidad de los Andes. Profe-
  www.csr.unib.it/~golfare/db.html,
                                       sor investigador de la Universidad
  1998.
                                       Icesi. Vinculado a la Universidad Ice-
• Bahamón, J. H. Construcción de       si desde 1988. Ha sido jefe del Depar-
  indicadores de gestión bajo el en-   tamento Académico de Sistemas
  foque de sistemas. ST Revista de    (1988-1998), Director del programa
  la Facultad de Ingeniería, Univer-   de Ingeniería de Sistemas (1998-
  sidad Icesi. 2003.                   2000), y en la actualidad es el Direc-
• Chuck, B; Dick, H; Don, S; Rhon-     tor Académico de la Universidad.
  da; Eunsaeng, K.; Ann, V. Data




                                           SISTEMAS
                                            TELEMÁTICA                 35
36        SISTEMAS
      TELEMÁTICA

Weitere ähnliche Inhalte

Was ist angesagt?

Computación vi todas las unidades
Computación vi   todas las unidadesComputación vi   todas las unidades
Computación vi todas las unidadesCHEK77
 
Introducción a los sistemas de Información
Introducción a los sistemas de Información Introducción a los sistemas de Información
Introducción a los sistemas de Información Danianny Verónica Senju
 
Evolución de los sistemas de información gerencial
Evolución de los sistemas de información gerencialEvolución de los sistemas de información gerencial
Evolución de los sistemas de información gerencialLuis Carlos Restrepo Jimenez
 
Unidad1 op dep_sistemas
Unidad1 op dep_sistemasUnidad1 op dep_sistemas
Unidad1 op dep_sistemasDavid Amaya
 
Planeación estratégica los sistemas de información
Planeación estratégica los sistemas de informaciónPlaneación estratégica los sistemas de información
Planeación estratégica los sistemas de informaciónabraham moreno
 
Diapositivas sistemas de información
Diapositivas sistemas de informaciónDiapositivas sistemas de información
Diapositivas sistemas de informaciónelicamar
 
Clase Diez PlaneacióN Y Analisis 2009
Clase Diez PlaneacióN Y Analisis 2009Clase Diez PlaneacióN Y Analisis 2009
Clase Diez PlaneacióN Y Analisis 2009infosistemasuno
 
Sistemas de información.
Sistemas de información.Sistemas de información.
Sistemas de información.Vectorinox01
 
INTRODUCCION A LAS TI
INTRODUCCION A LAS TIINTRODUCCION A LAS TI
INTRODUCCION A LAS TIfreddy_itsm
 
La cadena de valor de la administración del conocimiento
La cadena de valor de la administración del conocimientoLa cadena de valor de la administración del conocimiento
La cadena de valor de la administración del conocimientoHarakanova
 
Sistema como cambio organizacional planeado 2
Sistema como cambio organizacional planeado 2Sistema como cambio organizacional planeado 2
Sistema como cambio organizacional planeado 2johannalp
 
Sistemas de información gerencial
Sistemas de información gerencialSistemas de información gerencial
Sistemas de información gerencialjegutierrez1
 
Sistema como cambio organizacional planeado
Sistema como cambio organizacional planeadoSistema como cambio organizacional planeado
Sistema como cambio organizacional planeadojohannalp
 
Sistemas de información adriana boscán
Sistemas de información   adriana boscánSistemas de información   adriana boscán
Sistemas de información adriana boscánboscanandrade
 

Was ist angesagt? (19)

Computación vi todas las unidades
Computación vi   todas las unidadesComputación vi   todas las unidades
Computación vi todas las unidades
 
King joe
King joeKing joe
King joe
 
Introducción a los sistemas de Información
Introducción a los sistemas de Información Introducción a los sistemas de Información
Introducción a los sistemas de Información
 
Evolución de los sistemas de información gerencial
Evolución de los sistemas de información gerencialEvolución de los sistemas de información gerencial
Evolución de los sistemas de información gerencial
 
Unidad1 op dep_sistemas
Unidad1 op dep_sistemasUnidad1 op dep_sistemas
Unidad1 op dep_sistemas
 
Planeación estratégica los sistemas de información
Planeación estratégica los sistemas de informaciónPlaneación estratégica los sistemas de información
Planeación estratégica los sistemas de información
 
Diapositivas sistemas de información
Diapositivas sistemas de informaciónDiapositivas sistemas de información
Diapositivas sistemas de información
 
Sistema de información
Sistema de informaciónSistema de información
Sistema de información
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Clase Diez PlaneacióN Y Analisis 2009
Clase Diez PlaneacióN Y Analisis 2009Clase Diez PlaneacióN Y Analisis 2009
Clase Diez PlaneacióN Y Analisis 2009
 
Clase31 de ad gesinfo
Clase31 de ad gesinfoClase31 de ad gesinfo
Clase31 de ad gesinfo
 
Sistemas de información.
Sistemas de información.Sistemas de información.
Sistemas de información.
 
INTRODUCCION A LAS TI
INTRODUCCION A LAS TIINTRODUCCION A LAS TI
INTRODUCCION A LAS TI
 
La cadena de valor de la administración del conocimiento
La cadena de valor de la administración del conocimientoLa cadena de valor de la administración del conocimiento
La cadena de valor de la administración del conocimiento
 
Sistema como cambio organizacional planeado 2
Sistema como cambio organizacional planeado 2Sistema como cambio organizacional planeado 2
Sistema como cambio organizacional planeado 2
 
Sistemas de información gerencial
Sistemas de información gerencialSistemas de información gerencial
Sistemas de información gerencial
 
Sistema como cambio organizacional planeado
Sistema como cambio organizacional planeadoSistema como cambio organizacional planeado
Sistema como cambio organizacional planeado
 
Sistemas de informacion tipos
Sistemas de informacion  tiposSistemas de informacion  tipos
Sistemas de informacion tipos
 
Sistemas de información adriana boscán
Sistemas de información   adriana boscánSistemas de información   adriana boscán
Sistemas de información adriana boscán
 

Andere mochten auch

Rciu peru rev go mexico
Rciu peru   rev go mexicoRciu peru   rev go mexico
Rciu peru rev go mexicoPercy Pacora
 
Rx Torax torax normal lo basico
Rx Torax torax normal lo basicoRx Torax torax normal lo basico
Rx Torax torax normal lo basicosmallbogs
 
4518761 evangelio-de-san-marcos-analisis
4518761 evangelio-de-san-marcos-analisis4518761 evangelio-de-san-marcos-analisis
4518761 evangelio-de-san-marcos-analisismramosryes
 
The Near Future of CSS
The Near Future of CSSThe Near Future of CSS
The Near Future of CSSRachel Andrew
 
Classroom Management Tips for Kids and Adolescents
Classroom Management Tips for Kids and AdolescentsClassroom Management Tips for Kids and Adolescents
Classroom Management Tips for Kids and AdolescentsShelly Sanchez Terrell
 
The Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris LemaThe Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris LemaChris Lema
 
The Presentation Come-Back Kid
The Presentation Come-Back KidThe Presentation Come-Back Kid
The Presentation Come-Back KidEthos3
 

Andere mochten auch (7)

Rciu peru rev go mexico
Rciu peru   rev go mexicoRciu peru   rev go mexico
Rciu peru rev go mexico
 
Rx Torax torax normal lo basico
Rx Torax torax normal lo basicoRx Torax torax normal lo basico
Rx Torax torax normal lo basico
 
4518761 evangelio-de-san-marcos-analisis
4518761 evangelio-de-san-marcos-analisis4518761 evangelio-de-san-marcos-analisis
4518761 evangelio-de-san-marcos-analisis
 
The Near Future of CSS
The Near Future of CSSThe Near Future of CSS
The Near Future of CSS
 
Classroom Management Tips for Kids and Adolescents
Classroom Management Tips for Kids and AdolescentsClassroom Management Tips for Kids and Adolescents
Classroom Management Tips for Kids and Adolescents
 
The Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris LemaThe Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris Lema
 
The Presentation Come-Back Kid
The Presentation Come-Back KidThe Presentation Come-Back Kid
The Presentation Come-Back Kid
 

Ähnlich wie Jbahamon diseno modelado-bodega_datos

928 article text-959-1-10-20110707 (2)
928 article text-959-1-10-20110707 (2)928 article text-959-1-10-20110707 (2)
928 article text-959-1-10-20110707 (2)HaroldPerez35
 
Metodologias de diseño y desarrollo de los sistemas de informacion
Metodologias de diseño y desarrollo de los sistemas de informacionMetodologias de diseño y desarrollo de los sistemas de informacion
Metodologias de diseño y desarrollo de los sistemas de informacionArgimiro Dominguez
 
sistemas de informacion
sistemas de informacionsistemas de informacion
sistemas de informacionargentm
 
Sistema de Informacion: Ciclo de Vida y Diseño
Sistema de Informacion: Ciclo de Vida y DiseñoSistema de Informacion: Ciclo de Vida y Diseño
Sistema de Informacion: Ciclo de Vida y DiseñoRaimonKoudsi
 
Trabajo de Análisis y Diseños de Sistemas
Trabajo de Análisis y Diseños de SistemasTrabajo de Análisis y Diseños de Sistemas
Trabajo de Análisis y Diseños de SistemasFreddy Ramos
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Planificacion de proyecto software (1)
Planificacion de proyecto software  (1)Planificacion de proyecto software  (1)
Planificacion de proyecto software (1)Jesús Cuarez
 
Syllabus sistema de informacion gerencial
Syllabus sistema de informacion gerencialSyllabus sistema de informacion gerencial
Syllabus sistema de informacion gerencialMartha Perez
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informaciongenesisptc_
 
Trabajo de sistemas de informacion 5
Trabajo de sistemas de informacion 5Trabajo de sistemas de informacion 5
Trabajo de sistemas de informacion 5JeanCavallo2
 
Sistema de informacion gerencial (estudio)
Sistema de informacion gerencial (estudio)Sistema de informacion gerencial (estudio)
Sistema de informacion gerencial (estudio)samico01
 
Metodologias para la planeación de sistemas de información
Metodologias para la planeación de sistemas de informaciónMetodologias para la planeación de sistemas de información
Metodologias para la planeación de sistemas de informaciónfavo100
 
Expo metodologia de implementacion BI 01
Expo metodologia de implementacion BI 01Expo metodologia de implementacion BI 01
Expo metodologia de implementacion BI 01Cristian Quinteros
 

Ähnlich wie Jbahamon diseno modelado-bodega_datos (20)

928 article text-959-1-10-20110707 (2)
928 article text-959-1-10-20110707 (2)928 article text-959-1-10-20110707 (2)
928 article text-959-1-10-20110707 (2)
 
Juan velasquez
Juan velasquezJuan velasquez
Juan velasquez
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacion
 
Metodologias de diseño y desarrollo de los sistemas de informacion
Metodologias de diseño y desarrollo de los sistemas de informacionMetodologias de diseño y desarrollo de los sistemas de informacion
Metodologias de diseño y desarrollo de los sistemas de informacion
 
sistemas de informacion
sistemas de informacionsistemas de informacion
sistemas de informacion
 
Sistema de Informacion: Ciclo de Vida y Diseño
Sistema de Informacion: Ciclo de Vida y DiseñoSistema de Informacion: Ciclo de Vida y Diseño
Sistema de Informacion: Ciclo de Vida y Diseño
 
Trabajo de Análisis y Diseños de Sistemas
Trabajo de Análisis y Diseños de SistemasTrabajo de Análisis y Diseños de Sistemas
Trabajo de Análisis y Diseños de Sistemas
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Planificacion de proyecto software (1)
Planificacion de proyecto software  (1)Planificacion de proyecto software  (1)
Planificacion de proyecto software (1)
 
Ciclo de un sistema de informacion
Ciclo de un sistema de informacionCiclo de un sistema de informacion
Ciclo de un sistema de informacion
 
Syllabus sistema de informacion gerencial
Syllabus sistema de informacion gerencialSyllabus sistema de informacion gerencial
Syllabus sistema de informacion gerencial
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacion
 
Trabajo de sistemas de informacion 5
Trabajo de sistemas de informacion 5Trabajo de sistemas de informacion 5
Trabajo de sistemas de informacion 5
 
Sistema de informacion gerencial (estudio)
Sistema de informacion gerencial (estudio)Sistema de informacion gerencial (estudio)
Sistema de informacion gerencial (estudio)
 
Metodologias para la planeación de sistemas de información
Metodologias para la planeación de sistemas de informaciónMetodologias para la planeación de sistemas de información
Metodologias para la planeación de sistemas de información
 
Expo metodologia de implementacion BI 01
Expo metodologia de implementacion BI 01Expo metodologia de implementacion BI 01
Expo metodologia de implementacion BI 01
 

Jbahamon diseno modelado-bodega_datos

  • 1. Propuesta de un método para el diseño y modelado de una bodega de datos José Hernando Bahamón L. Universidad Icesi jbahamon@icesi.edu.co Fecha de recepción: 15-4-2003 Fecha de aceptación: 25-8-2003 RESUMEN ses. La primera fase comprende la El desarrollo de los Sistemas de In- identificación de las necesidades de formación Gerencial basados en tec- información gerencial, desde la pers- nologías de Data Warehouse y Herra- pectiva del negocio. La segunda fase mientas Olap, es relativamente re- comprende todas las actividades re- ciente y, por lo tanto, no existe una lacionadas con la elaboración de un propuesta metodológica universal- modelo lógico-conceptual de la estruc- mente válida y aceptada como tal, por tura de la bodega de datos. La terce- la comunidad académica. ra fase incluye los pasos para reali- zar el diseño físico de la estructura El presente artículo expone una pro- de la bodega de datos. puesta metodológica para la realiza- ción del diseño de una bodega de da- PALABRAS CLAVES tos, que utiliza como eje articulador Bodegas de datos, método de diseño la identificación de las necesidades de de la estructura de una bodega de información por parte de la gerencia, datos. para el soporte de los procesos de con- trol y de toma de decisiones. ABSTRACT El método propuesto está compuesto The development of Management In- de ocho pasos agrupados en tres fa- formation Systems based on Ware- SISTEMAS & TELEMÁTICA 13
  • 2. house Data technologies and Olap information requirements from a bu- tools is relatively new. Therefore, the- siness perspective. The second one re is no valid methodological appro- deals with all the activities associa- ach that is generally accepted as such ted with the preparation of a logical by the academic community. conceptual model for the data ware- house structure, and the third stage This article presents a methodologi- includes the steps to make the phy- cal approach to the design of a data sical design of the data warehouse warehouse using the identification of structure. management information require- ments as a shaft that supports the KEY WORDS control and decision-making proces- ses. The suggested approach consists Data warehouses, approach to the of eight steps grouped in three diffe- design of a data warehouse struc- rent stages. The first stage encompas- ture. ses the identification of management Clasificación: A 14 SISTEMAS & TELEMÁTICA
  • 3. INTRODUCCIÓN MÉTODO PROPUESTO El desarrollo de los Sistemas de In- El método de diseño propuesto está formación Gerencial basados en tec- centrado en la identificación de la nologías de Data Warehouse y herra- información clave y relevante para so- mientas Olap, es relativamente re- portar los procesos de dirección y de ciente y, por lo tanto, no existe una toma de decisiones dentro de la orga- propuesta metodológica universal- nización. Este método utiliza, como mente válida y aceptada como tal, por punto de partida, la identificación y la comunidad académica. el modelado de: qué es lo que el negocio está tratando de alcan- Entre las propuestas más conocidas zar, para luego elaborar una estruc- están: 1. Ralph Kimball,1 con un es- tura que apoye el proceso de gestión quema centrado en la identificación hacia el logro de las metas definidas. de los procesos de la empresa, como elemento clave para la definición de Una vez que la información clave de la estructura de variables y dimen- apoyo a los procesos de gestión y con- siones; 2. W.H. Inmon,2 con un esque- trol de la organización ha sido iden- ma que parte de la construcción del tificada, se inicia la elaboración del modelo de datos corporativos, elabo- modelo lógico-conceptual de la estruc- rado al más alto nivel de abstracción, tura de la bodega de datos, que so- para luego derivar la estructura del portará las consultas y la exploración modelo de datos, para el diseño de la de los datos, a partir de los cuales se bodega; 3. Golfarelli Matteo, Maio construirán los indicadores de gestión Dario, Rizzi Stefano3 proponen un requeridos por los niveles directivos esquema que parte de los modelos E- de la organización. R descriptivos de los sistemas tran- Para darle un orden a este proceso saccionales de la organización, para sistémico de diseño, los pasos del luego derivar el modelo E-R de la es- método propuesto, tal como se presen- tructura, para la bodega de datos. tan en la Figura 1, se han agrupado En este artículo se presenta una pro- en las siguientes fases: puesta de sistematización del proce- • Fase 1: Identificación de las ne- so de diseño de una bodega de datos, cesidades de información geren- que se aparta de los esquemas de di- cial, desde la perspectiva del ne- seño referidos, y que utiliza como eje gocio. articulador, la identificación de la in- formación gerencial, para el soporte • Fase 2: Elaboración del modelo ló- de los procesos de control y de toma gico-conceptual de la estructura de decisiones en los niveles directi- de la bodega de datos. vos de la organización. 1. Kimball R. The Data Warehouse Toolkit. John Wiley & Sons, 1996. 2. Inmon W.H. Building The Data Warehouse. QED Press / John Wiley & Sons, 1992. 3. Golfarelli M., Maio D., Rizzi S. Conceptual Design of Data Warehouse From E/R Schemes. http//www.csr.unib.it/~golfare/db.html, 1998. SISTEMAS & TELEMÁTICA 15
  • 4. • Fase 3: Elaboración del modelo fí- «¿Cuál es la información que desea sico de la bodega de datos. obtener del sistema de información gerencial?». Este enfoque puede resul- tar muy peligroso, si el directivo no Fase 1: realiza un proceso sistemático y orde- Identificación de las necesidades nado, para establecer sus necesidades de información gerencial, desde de información, en relación con sus ac- la perspectiva del negocio. tividades de gestión y control. La primera fase, a partir de la cual Una forma ordenada y sistemática se realiza el proceso de diseño de la para realizar esta fase de identifica- estructura para una bodega de datos, ción de las necesidades de informa- comprende la identificación de las ne- ción, que soporte los procesos de ges- cesidades de información gerencial, tión y control gerencial, es la aplica- lo que significa hacer explícitos los ción del enfoque de sistemas, para objetivos y los factores claves de éxi- guiar el proceso de revisión o defini- to de la organización, o de un área ción de: 1. Los objetivos estratégicos del negocio. del negocio o del área; 2. Los factores clave para el logro de los objetivos de- Es bastante común empezar este pro- finidos y 3. Los indicadores de con- ceso de identificación y modelado trol, tanto de los objetivos como de los mediante entrevistas a los directivos, factores clave.4 en las cuales la pregunta central es: 4. Véase Bahamón José H. Construcción de indicadores de gestión bajo el enfoque de sistemas. S&T Revista de la Facultad de Ingeniería, Universidad Icesi. 2003. 16 SISTEMAS & TELEMÁTICA
  • 5. Método para el diseño y modelado de una bodega de datos Fase 1: Identificación de las necesidades de infor- mación gerencial, desde la perspectiva del negocio. Fase 2: Elaboración del modelo lógico-conceptual de la estructura de la bodega de datos. 2.1. Definir las tablas de hechos o las variables de la estructura. 2.2. Identificar, para cada tabla de hechos, las dimen- siones que la referencian. 2.3. Establecer el nivel de granulación y los niveles de agregación. 2.4. Elaborar el diagrama en estrella que representa la estructura de la bodega. Fase 3: Elaboración del modelo físico de la bodega de datos. 3.1. Verificación y ajuste del modelo lógico. 3.2. Definición del esquema físico del almacenamien- to de las dimensiones y sus jerarquías. 3.3. Definición de los atributos que conforman las tablas de hechos. Figura 1. Método para el diseño y modelado de una bodega. SISTEMAS & TELEMÁTICA 17
  • 6. Como resultado de esta fase, se ten- tión (necesidades de información ge- drá una visión del negocio y de la in- rencial), identificados en la fase an- formación requerida para la dirección terior, y termina con la construcción y el control gerencial, representada de una representación multidimen- fundamentalmente por: Los objetivos sional de las variables que conforman del negocio; los factores clave de éxi- cada indicador. En esta representa- to y, en especial, un conjunto de indi- ción multidimensional, cada variable cadores clave de la gestión. es modelada mediante un arreglo di- mensional (multidimensional) de cel- Fase 2: das, como se presenta en la Figura 2. Elaboración del modelo lógico- Para facilitar el proceso de elabora- conceptual de la estructura de la ción del modelo lógico, se utiliza una bodega. representación gráfica denominada En esta fase se elabora el modelo ló- diagrama tipo estrella, donde el ele- gico de la estructura de la bodega, que mento central del esquema es la Va- soportará las consultas, mediante las riable o Tabla de Hechos («Fact»), la cuales se obtendrá la información re- cual es referenciada por un conjunto querida por los niveles directivos de ejes, denominados Dimensiones, a como apoyo a sus procesos de gestión través de los cuales se seleccionan los y de toma de decisiones. valores contenidos en la tabla de he- chos. En la Figura 3, se esquematiza La elaboración de este modelo lógico el modelo de un diagrama en estrella. comienza con los indicadores de ges- 18 SISTEMAS & TELEMÁTICA
  • 7. Figura 2. Vista multidimensional de una de las variables que conforman un indicador. Figura 3. Diagrama en estrella de una estructura multidimensional. SISTEMAS & TELEMÁTICA 19
  • 8. Antes de presentar los pasos propues- Cuadro 1 se presentan las definicio- tos por el método para la elaboración nes adoptadas para los diferentes del modelo lógico, es pertinente pre- conceptos utilizados en el método pro- cisar algunos de los términos utiliza- puesto. dos en el método propuesto. En el Cuadro 1: Definición de conceptos básicos. Gráfica Una gráfica es una red de nodos interconectados. Una gráfica direccional es aquella en la cual la conexión entre dos nodos tiene una dirección específica. Un modelo E-R puede ser considerado una gráfica direccional. Trayectorias cíclicas En una gráfica, una trayectoria acíclica es aquella que sólo y acíclicas tiene una forma de recorrido (en un solo sentido). Una trayectoria cíclica es aquella que se puede recorrer en dos o más secuencias diferentes. Tabla de hechos Es la tabla central de la estructura de la bodega. Esta tabla contiene los datos de interés para el negocio, es decir, los valo- res para la construcción de los indicadores claves del negocio. Técnicamente, la tabla de hechos es una entidad de intersec- ción cuya llave primaria está compuesta por la unión de los dominios de las diferentes dimensiones que la referencian. Dimensión Las dimensiones corresponden a los ejes con los cuales se cons- truye la vista multidimensional de la información clave del ne- gocio, almacenada en la tabla de hechos. Las atributos almacenados en las dimensiones determinan la granulación adoptada para el modelo. Las dimensiones pueden ser: – Propias: Cuando el conjunto de entidades que conforman la dimensión se encuentran unidas a la tabla de hechos, en una trayectoria acíclica. – Impropias: Cuando el conjunto de entidades que confor- man la dimensión se encuentran unidas a la tabla de he- chos, en una trayectoria cíclica. – De Información: Cuando los atributos contenidos en la dimensión definen qué tipo de datos se encuentran almace- nados en la tabla de hechos. Jerarquías Determinan cómo las instancias de la tabla de hechos pueden ser agregadas. Las jerarquías permiten las operaciones de «drill-down» o «rollup», en los procesos de consulta. Una jerarquía está conformada por el conjunto de entidades que constituyen la dimensión. 20 SISTEMAS & TELEMÁTICA
  • 9. A continuación se presentan los cua- • El indicador 1 del F.C.E1 puede tro pasos propuestos para la sistema- ser construido con dos tablas de tización del proceso de elaboración del hechos que son: ventas por ven- modelo lógico: dedor y cuota de ventas de cada vendedor. Paso No. 1: • El indicador 2 del F.C.E1 puede Definir las tablas de hechos o las ser construido con dos tablas de variables de la estructura. hechos que son: número de visi- Este paso se realiza a partir del con- tas realizadas por cada vendedor, junto de los indicadores de gestión, y número de visitas presupuesta- definidos en la fase de identificación das por cada vendedor. de las necesidades de información • El indicador 1 del F.C.E2 puede gerencial, desde la perspectiva del ser construido con una tabla de negocio. El paso se inicia con la eva- hechos: número de clientes nue- luación de las variables (divisores y vos en la base de datos. En este dividendos) de cada indicador, para caso, el denominador del indica- determinar cuáles de éstas pueden dor se asume como un único valor ser almacenadas en una tabla de he- y, por lo tanto, no tiene sentido chos, y cuáles no. almacenarlo en otra tabla de he- En el Cuadro 2 se presenta, a mane- chos. ra de ejemplo, la información obteni- • Los demás indicadores se anali- da, al aplicar los pasos de la fase 1 al zan de igual manera. área de ventas de una organización. A partir de estos resultados se iden- En suma, al realizar el análisis de tifican las variables o tablas de he- todos los indicadores, obtenemos las chos, como lo establece el paso 1 de siguientes tablas de hecho: esta fase. • Ventas. Aplicación del paso 1: Identificación • Ventas por vendedor. de las tablas de hechos • Cuota de ventas de cada vende- • El indicador definido para el mo- dor. nitoreo del objetivo puede ser construido con una sola tabla de • Número de visitas realizadas por hechos: Ventas. Se toma una sola cada vendedor. variable, por cuanto las ventas del • Número de visitas presupuesta- año y las ventas del año anterior, das por cada vendedor. que son las dos variables que con- forman el indicador, se pueden • Número de clientes nuevos en la almacenar en la misma tabla de base de datos. hechos. • Número de vendedores capacita- dos que aprobaron los cursos. SISTEMAS & TELEMÁTICA 21
  • 10. Cuadro 2: Información gerencial del área de ventas, obtenida al realizar la fase 1. Área del Negocio - Descripción. Se trabaja con el área de ventas de una orga- nización dedicada a la producción de recipientes elaborados en plástico. Objetivo del Área: para propósitos del ejemplo, se toma el siguiente objetivo: Lograr al final del año un incremento del 15% en las ventas totales de la compañía, con respecto a las ventas del año anterior. Factores claves de éxito. Luego de realizado el análisis de las acciones y las condiciones necesarias para garantizar el logro del objetivo planteado, se identi- ficaron los siguientes F.C.E: • F.C.E.1: Planeación y control de la fuerza de ventas. • F.C.E.2: Búsqueda de nuevos clientes rentables para la organización. • F.C.E.3: Capacitación y entrenamiento de la fuerza de ventas. Indicadores claves de gestión. Para el control y seguimiento de los F.C.E y los objetivos, se proponen los siguientes indicadores: Ventas del año I_obj: -1 Ventas del año anterior Ventas del vendedor I1_FCE1: Cuota de ventas Número de visitas de venta realizadas I2_FCE1: Número de visitas presupuestadas Número de clientes nuevos en la base de datos I1_FCE2: Número de clientes nuevos presupuestados Número de vendedores capacitados que aprobaron los cursos I1_FCE3: Número presupuestado de vendedores capacitados 22 SISTEMAS & TELEMÁTICA
  • 11. Paso No. 2: En este paso, se espera que el usua- Identificar, para cada tabla de rio visualice cada variable, como un hechos, las dimensiones que la conjunto de valores almacenados en referencian. una estructura de varias dimensio- nes, donde los valores almacenados Para cada variable o tabla de hechos son referenciados por la combinación se identifican, con la colaboración del de los valores definidos para cada eje usuario líder del área de negocio, los (dominio de la dimensión), tal como ejes de visualización multidimensio- se esquematiza en la Figura 4. nal los cuales constituyen las dimen- siones de la variable. Figura 4: Esquema de una vista multidimensional de una tabla de hechos. Paso 3: Hechos sobre Ventas, definida en el Establecer el nivel de granula- ejemplo anterior. ción y los niveles de agregación Aplicación del paso 2: Identificación de cada dimensión. de las dimensiones. Una vez que las dimensiones han sido Supongamos que el gerente de ven- identificadas se debe establecer, para tas expresa su interés por visualizar cada una de ellas, el menor nivel de la información de ventas organizada granulación, el cual corresponde al de la siguiente manera: primero, por conjunto de atributos que referencian cada producto de la compañía; en se- el mayor nivel de detalle deseado gundo término, por cada lugar en para la variable o tabla de hechos. donde se venden los productos y, fi- A manera de ejemplo, se aplican los nalmente, por cada semana. Podemos dos pasos anteriores para la Tabla de establecer la necesidad de utilizar SISTEMAS & TELEMÁTICA 23
  • 12. tres ejes para elaborar la vista mul- chos, por cada dimensión. Estos ni- tidimensional (dimensiones) de la veles de agregación representan la Tabla de Hechos - Ventas: jerarquía de cada dimensión. • Dim1: Producto • Jerarquía en la Dim. Produc- to: Las ventas por productos pue- • Dim2: Lugar de venta den ser agregadas por grupos de • Dim3: Tiempo. productos, por líneas de produc- tos y, por el total de la venta. De Aplicación del paso 3: Definición del esta manera, los niveles de agre- nivel de granulación. gación de la dimensión producto De acuerdo con la solicitud del geren- son: te, se establece para cada dimensión – Por grupos de productos. la siguiente granulación: • Dim. Producto: El menor nivel – Por líneas de productos. de granulación es el Tipo de Pro- – Total. ductos. Podemos establecer otros • Jerarquía en la Dim. Lugar: niveles como: Línea de Productos, Las ventas por lugar pueden ser que tiene un nivel de granulación agregadas por regiones y por el mayor, pero un menor nivel de de- total del país. talle en la variable ventas; o Re- ferencias de Productos, que tiene • Jerarquía en la Dim. Tiempo: un menor nivel de granulación, Las ventas por tiempo pueden ser pero un mayor nivel de detalle. agregadas por mes, por trimestre, por semestre, por año. • Dim. Lugar: El nivel de granu- lación requerido es la Ciudad. Se habrían podido seleccionar otros Paso 4: niveles, como Almacén, que tiene Elaborar el diagrama en estrella un menor nivel, o Región, que tie- que representa la estructura de ne uno mayor. la bodega. • Dim. Tiempo: El menor nivel de Luego de identificar los elementos granulación requerido es la Sema- que conforman la estructura de la na. Se habrían podido seleccionar vista multidimensional, de la infor- otros niveles, como el Día, que tie- mación gerencial requerida por la ne un menor nivel, o el Mes, que organización, se pasa a la elaboración tiene uno mayor. de una representación gráfica, en for- Una vez se han definido los menores ma de estrella; para ello se puede uti- niveles de granulación para cada di- lizar la notación simplificada de los mensión, se identifican los niveles de diagramas E-R, o la notación deno- agregación requeridos para los valo- minada «Dot modeling».5 res almacenados en la tabla de he- 5. Todman, Chris. Designing a Data Warehouse: Supporting Customer Relationship. Prentice Hall, 2001. 24 SISTEMAS & TELEMÁTICA
  • 13. Notación tipo E-R: junto de trayectorias de entidades y En esta notación, el diagrama en es- relaciones de uno a muchos, que co- trella está conformado por una enti- rresponde a las dimensiones y a sus dad central asociativa, que correspon- jerarquías. En la Figura 5 se presen- de a la tabla de hechos, y por un con- ta un diagrama en estrella con esta notación. Figura 5. Representación de un diagrama en estrella, mediante la notación tipo E-R. Notación «Dot Modeling» trayectorias compuestas por puntos En esta notación, el diagrama en es- («dots»), que representan las dimen- trella está conformado por una enti- siones y sus jerarquías. En la Figura dad central que corresponde a la Ta- 6 se presenta un diagrama en estre- bla de Hechos, y por un conjunto de lla con esta notación. Figura 6. Representación de un diagrama en estrella, mediante la notación «Dot Modeling». SISTEMAS & TELEMÁTICA 25
  • 14. A manera de ejemplo se presenta en anterior. En la Figura 8 se represen- la Figura 7, el diagrama en estrella, tan los mismos elementos de la es- con notación «Dot Modeling», para la tructura de la bodega, pero con nota- Tabla de Hechos y para las dimen- ción tipo E-R. siones identificadas en el ejemplo Figura 7. Representación, mediante la notación «Dot Modeling», de la estructura para la bodega de datos del ejemplo anterior. Figura 8. Representación, mediante la notación E-R, de la estructura para la bodega de datos del ejemplo anterior. 26 SISTEMAS & TELEMÁTICA
  • 15. Fase 3: soportado. Si esta verificación no es Elaboración de la estructura fí- correcta, se debe retornar a la fase sica de la bodega anterior, para incorporar las estruc- turas que soporten los requerimien- Durante esta fase, se realiza la trans- tos faltantes de información. formación del modelo lógico concep- tual en la estructura física, que pos- Terminada la revisión anterior, el teriormente será implementada en proceso continúa con la evaluación de alguna herramienta de «Data Ware- la estructura, para asegurar la vali- house». dez de todas las consultas de infor- mación realizadas sobre dicha estruc- Este proceso de transformación se tura. realiza mediante los siguientes pasos: 1. Verificación y refinamiento del Para realizar este proceso de compro- modelo lógico para determinar su con- bación de validez de la estructura, sistencia. 2. Definición del esquema recurrimos a la teoría de grafos, se- físico de almacenamiento de las es- gún la cual una estructura de consul- tructuras jerárquicas de las dimen- ta es válida cuando está conformada siones. 3. Identificación de los atri- por trayectorias acíclicas. Al aplicar butos que conforman las tablas de esta teoría, se puede afirmar que hechos y las dimensiones. cualquier diseño para una bodega de datos permitirá siempre consultas co- rrectas, si la estructura propuesta Paso 1: está conformada únicamente por di- Verificación y ajuste mensiones propias, es decir, por tra- del modelo lógico. yectorias acíclicas. Durante este paso, se realiza la veri- Si al realizar la comprobación de la ficación del modelo lógico, obtenido en estructura se encuentran trayecto- la fase anterior, para garantizar que rias acíclicas, éstas deben ser trans- el modelo, además de soportar todas formadas, para asegurar la confiabi- las consultas requeridas por los ni- lidad de las consultas. Las posibles veles ejecutivos, siempre retorne in- transformaciones son:6 formación confiable. Para iniciar este proceso de verifica- 1. Ajuste para los casos de trayecto- ción se debe elaborar una matriz de rias cíclicas simples cruce, entre los requerimientos de Este caso ocurre cuando la trayecto- información gerencial, definidos en la ria de una dimensión presenta una fase inicial, y las estructuras (estre- trayectoria alterna que tiene dos en- llas), definidas en la fase anterior. En tidades comunes. En la Figura 9, se la matriz de cruce se confirma si el esquematiza una trayectoria cíclica requerimiento está completamente simple. 6. Mcguff, F. Designing the perfect Data Warehouse. 1998. SISTEMAS & TELEMÁTICA 27
  • 16. Figura 9. Dimensión con trayectoria cíclica. Las opciones de transformación para 2. Ajuste para los casos de trayecto- esta clase de trayectorias son: rias alternas, mezcladas con trayec- torias cíclicas. • Tratar cada trayectoria como una Se presenta cuando la trayectoria de nueva dimensión, lo cual signifi- una dimensión está conformada por ca redibujar el diagrama, elimi- una trayectoria alterna, más una tra- nando las relaciones N1-A2 y A3- yectoria cíclica, tal como se esquema- N4, para luego crear la relación: tiza en la Figura 10. Tabla de Hechos - A2. • Convertir la trayectoria cíclica en una trayectoria alterna, eliminan- do la relación A3-N4. Figura 10. Dimensión con trayectoria alterna, más trayectoria cíclica. 28 SISTEMAS & TELEMÁTICA
  • 17. En estos casos, el problema ocurre con la bodega de datos, debe ser conver- la trayectoria cíclica; por lo tanto, la tido en una estructura totalmente transformación se maneja como se ex- desnormalizada, tal como se presen- plicó en el caso anterior. ta en la Figura 11. Este modelo físico está conformado por una tabla de Paso 2: hechos, y por las entidades en las cua- Definición del esquema físico del les se almacenarán los dominios de almacenamiento de las dimensio- las dimensiones con sus correspon- nes y sus jerarquías. dientes niveles jerárquicos. El modelo en estrella que conforma la estructura lógica propuesta para Figura 11. Modelo lógico en estrella, y modelo físico de la bodega. Para el proceso de conversión de cada todos los dominios de las entidades una de las trayectorias que confor- que conforman la trayectoria de la man el modelo en estrella, en entida- dimensión, es decir, si los dominios des desnormalizadas, se puede utili- de las entidades que conforman la zar uno de los siguientes esquemas trayectoria son: {enero, febrero, mar- de conversión.7 zo, abril ....}; {1er_trim, 2º_trim, 3er_trim, 4º_trim}; {1er_sem, 1. Conversión vertical 2º_sem}, el dominio de la llave prima- o recursiva ria será: {enero, febrero, marzo, abril, En esta conversión, se utiliza una lla- ...., 1er_trim, 2º_trim, 3er_trim, ve primaria única, para cada dimen- 4º_trim; 1er_sem,2º_sem}. En la Fi- sión. El dominio de esta llave prima- gura 12 se presenta, de manera grá- ria se obtiene mediante la unión de fica, este esquema de conversión. 7. Mcguff, F. Designing the perfect Data Warehouse. 1998. SISTEMAS & TELEMÁTICA 29
  • 18. Figura 12. Conversión vertical de la trayectoria de una dimensión. Adicionalmente, en este esquema de quico son precalculadas y almacena- conversión a cada valor del dominio das en la bodega. se le asocia un valor padre, el cual Este esquema de conversión es el más también pertenece al dominio; de esta recomendado para implementar la manera se implementa la jerarquía estructura física de una bodega, cuan- definida en la trayectoria, represen- do las dimensiones están compuestas tada en la dimensión, dentro del mo- por jerarquías desbalanceadas. delo en estrella. Este esquema para el manejo de las 2. Conversión horizontal jerarquías (id_dimensión, id_padre) En esta conversión, la llave primaria permite implementar fácilmente la de la dimensión se conforma como operación de desenrolle («drill- una llave compuesta por las llaves de down»), cuando se realizan consultas cada una de las entidades que con- a la bodega de datos. Sin embargo, forman la trayectoria de la dimen- esta estructura es eficiente, si las sión. En la Figura 13 se presenta, de agregaciones para cada nivel jerár- manera gráfica, este esquema de con- versión. Figura 13: Conversión horizontal de la trayectoria de una dimensión. 30 SISTEMAS & TELEMÁTICA
  • 19. Este esquema de conversión es el más tos que conforman cada estructura. recomendable, si las agregaciones de Una vez asignados todos los atribu- datos se realizan de manera dinámica. tos, se realiza un análisis cruzado en- tre la tabla de hechos y las dimen- Paso 3: siones, para establecer los tipos de Definición de los atributos que cálculo matemático que pueden ser conforman las tablas de hechos realizados, sobre la tabla de hechos. y las dimensiones del modelo. La especificación de los atributos que En este paso final, se identifican para conforman la tabla de hechos se debe cada tabla de hechos y cada dimen- realizar siguiendo el formato que apa- sión las características de los atribu- rece en el Cuadro 3. Cuadro 3: Formato para la definición de los atributos de una tabla de hechos. Igualmente, para la especificación de los atributos que conforman las dimen- siones se debe utilizar el formato que aparece en el Cuadro 4. Cuadro 4: Formato para la definición de los atributos de una dimensión. SISTEMAS & TELEMÁTICA 31
  • 20. Finalmente, se deben establecer los de hechos. El resultado de esta revi- tipos de cálculos matemáticos como sión debe quedar consignado en una suma, conteo, promedio, mínimo, matriz de cruce, como la presentada máximo, que pueden ser aplicados a en el Cuadro 5. los valores almacenados en las tablas Cuadro 5: Operaciones matemáticas para cada atributo de la tabla de hechos. Tabla de hechos Atributo 1 Dimensiones Suma Conteo Prom. Mín. Máx. 1. Dimensión a 2. Dimensión b 3. Dimensión c ..... Atributo 2 Dimensiones Suma Conteo Prom. Mín. Máx. 1. Dimensión a 2. Dimensión b 3. Dimensión c Atributo 3 Dimensiones Suma Conteo Prom. Mín. Máx. 1. Dimensión a 2. Dimensión b 3. Dimensión c .... A manera de ejemplo, se presenta en los siguientes cuadros la definición de atributos para la tabla de hechos y para las dimensiones definidas en el ejem- plo anterior, y esquematizadas en la Figura 7. 32 SISTEMAS & TELEMÁTICA
  • 21. Cuadro 6: Definición de los atributos de la tabla de hechos sobre ventas. Nombre de la estructura de la bodega Área de ventas Tabla de hechos Ventas Atributos tipo Pk Descripción Id lugar C(35) Sí Identif. de la dimensión lugar Id tiempo C(12) Sí Identif. de la dimensión tiempo id producto C(30) Sí Identif. de la dimensión producto Unidades vendidas N(8,0) Valor 1 de la tabla de hechos Pesos-venta N(10,2) Valor 2 de la tabla de hechos Cuadro 7: Definición de los atributos de las dimensiones, para la estructura de ventas. Nombre de la estructura de la bodega Nombre de la estructura de la bodega Nombre de la estructura de la bodega SISTEMAS & TELEMÁTICA 33
  • 22. Cuadro 8: Operaciones matemáticas para cada atributo de la tabla de hechos sobre ventas. Tabla de hechos Ventas Atributo 1 Unidades vendidas Dimensiones Suma Conteo Prom Mín Máx Lugar Tiempo Producto Atributo 2 Pesos-venta Dimensiones Suma Conteo Prom Mín Máx Lugar Tiempo Producto CONCLUSIÓN organizaciones se realiza de manera Mediante la aplicación del enfoque de intuitiva y, en otras mediante la uti- Sistemas para la definición de los in- lización de estructuras de bodegas dicadores claves de gestión de la or- que han sido definidas para otras or- ganización, se ha logrado articular ganizaciones. El modelo propuesto, una propuesta para modelar, de ma- que se aparta de muchos de los enfo- nera ordenada y sistémica, las estruc- ques presentados por los investigado- turas de las bodegas de datos que ser- res en este campo, se convierte en una virán de soporte a la implementación opción válida para el diseño de siste- de sistemas de información gerencial, mas de información gerencial, en par- hechos a la medida de las necesida- ticular para el diseño de bodegas de des de información de la gerencia. datos departamentalizadas («Data Esta propuesta facilita, ordena y sis- Marts»). tematiza un proceso que en algunas 34 SISTEMAS TELEMÁTICA
  • 23. BIBLIOGRAFÍA Modeling Techniques for Data Warehouse. IBM. 1998. • Mcguff, F. Designing the perfect Data Warehouse. 1998. http:// • Todman, C. Designing a Data members.aol.com/fmcguff/dwmo- Warehouse: Supporting Customer del/index.htm Relationship. Prentice Hall. 2001 • Kimball R. The Data Warehouse Toolkit. John Wiley Sons, 1996. CURRÍCULO • Inmon W.H. Building The Data Warehouse. QED Press /Jhon José Hernando Bahamón L. Inge- Wiley, 1992. niero Electrónico de la Universidad del Cauca, especialista en Adminis- • Golfarelli, M; Maio, D; Rizzi, S. tración de la Universidad Icesi y ma- Conceptual Design of Data Ware- gíster en Dirección Universitaria de house From E/R schemes. http// la Universidad de los Andes. Profe- www.csr.unib.it/~golfare/db.html, sor investigador de la Universidad 1998. Icesi. Vinculado a la Universidad Ice- • Bahamón, J. H. Construcción de si desde 1988. Ha sido jefe del Depar- indicadores de gestión bajo el en- tamento Académico de Sistemas foque de sistemas. ST Revista de (1988-1998), Director del programa la Facultad de Ingeniería, Univer- de Ingeniería de Sistemas (1998- sidad Icesi. 2003. 2000), y en la actualidad es el Direc- • Chuck, B; Dick, H; Don, S; Rhon- tor Académico de la Universidad. da; Eunsaeng, K.; Ann, V. Data SISTEMAS TELEMÁTICA 35
  • 24. 36 SISTEMAS TELEMÁTICA