SlideShare una empresa de Scribd logo
1 de 5
Descargar para leer sin conexión
Mauricio Quintuña                              6to C Ingeniería de Sistemas




                                     Temario
1.   Definición.
2.   Objetivo
3.   Qué es un Data WareHouse?
4.   Importancia
5.   Procesos de un Data Warehouse

                                        1
Mauricio Quintuña                                                                    6to C Ingeniería de Sistemas


6.    Desarrollo gradual
7.    Beneficios de un Data WareHouse
8.    Cómo justificar la inversión en un DataWarehouse?
9.    Ventajas y desventajas del DataWarehouse?
10.   Tipos de usuarios de un DataWarehouse
11.   Las razones básicas de porque una organización implementa Data Warehouse:
12.   Los procesos básicos del Data WareHouse (ETL)
13.   Los elementos básicos de un Data WareHouse:
14.   El Data Mining y su relación con el Data Warehouse.
15.   Características clave del Data Warehouse
16.   Arquitectura del Data Warehouse
17.   ESTRUCTURA DEL DATA WAREHOUSE


                                        DataWareHouse
Definición
“El Data Warehouse es una colección de datos orientados al tema, integrados, no volátiles e historiados,
organizados para el apoyo de un proceso de ayuda a la decisión.

Objetivo
El objetivo del DW se expresa en términos puramente de negocio como “mantener la fidelidad de la
clientela”

¿Que es un Data Warehouse?
Un Data Warehouse es un almacenamiento separado y homogéneo donde son cargados datos
transformados provenientes de diferentes bases de datos.

Importancia
    Un sistema de Data Warehouse permite transformar datos o información bruta en información
       con sentido y extremadamente útil.
    Uno de los valores más importantes de una organización es la información. Estos valores
       normalmente son guardados por la empresa de dos formas:
    Los sistemas operacionales de registros (de donde el Data Warehouse obtiene los datos) y
       nuestro almacén de datos.

Procesos de un Data Warehouse

      a)   Extracción: obtención de información de las distintas fuentes tanto internas como externas.
      b)   Elaboración: filtrado, limpieza, depuración, homogeneización y agrupación de la información.
      c)   Carga: organización y actualización de los datos y los metadatos en la base de datos.
      d)   Explotación: extracción y análisis de la información en los distintos niveles de agrupación.

Desde el punto de vista del usuario, el único proceso visible es la explotación del almacén de datos,
aunque el éxito del Data Warehouse radica en los tres procesos iniciales que alimentan la información del
mismo y suponen el mayor porcentaje de esfuerzo (en torno a un 80%) a la hora de desarrollar el almacén.


Desarrollo gradual

      1) Una de las claves del éxito en la construcción de un Data Warehouse es el desarrollo de forma
         gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el
         almacén de datos a los demás usuarios.



                                                     2
Mauricio Quintuña                                                                      6to C Ingeniería de Sistemas


     2) Por ello es importante elegir este usuario inicial o piloto, siendo importante que sea un
        departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se
        puedan obtener y medir resultados a corto plazo.

Beneficios de un Data WareHouse

     a) Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose
        en información integrada y global del negocio.
     b) Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones
        ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha
        información.
     c) Proporciona la capacidad de aprender de los datos del pasado y de
        predecir situaciones futuras en diversos escenarios.
     d) Simplifica dentro de la empresa la implantación de sistemas de gestión
        integral de la relación con el cliente.
     e) Supone una optimización tecnológica y económica en entornos de
        Centro de Información, estadística o de generación de informes con
        retornos de la inversión espectaculares


¿Cómo justificar la inversión en un data warehouse?

- ¿Están las ventas de artículos deportivos sujetas a tendencias por temporada?
¿Qué artículos se ven afectados y cuándo?

- ¿Cuántos autos se vendieron el mes pasado? ¿Cómo se compara esta cantidad con el mismo mes en los
últimos cinco años?

- ¿Quiénes son los diez primeros vendedores o clientes en Latinoamérica? ¿Qué porcentaje del ingreso
generan?

- ¿Cuáles son los diez artículos de menor rentabilidad en el catálogo de ventas?


Ventajas - Data Warehouse

     a) Datos de toda la compañía, organizados para facilitar las consultas más analíticas que
        transaccionales.
     b) Los procesos de transformación han sido aplicados a los datos para permitir un tiempo de
        respuesta mínimo a las consultas.
     c) Modelo de datos multidimensional para hacer más fácil la navegación y explotación de datos.
     d) La administración de la seguridad está centralizada para garantizar la necesidad de información
        dependiendo del perfil de los usuarios.

Desventajas:
   a) No es muy útil para la toma de decisiones en tiempo real debido al largo tiempo de
       procesamiento que puede requerir.
   b) Requiere de continua limpieza, transformación e integración de datos.
   c) En un proceso de implantación puede encontrarse dificultades ante los diferentes objetivos que
       pretende una organización.
   d) Una vez implantado puede ser complicado añadir nuevas fuentes de datos.

Tipos de usuarios de un DW:

     1) Turistas
                                                     3
Mauricio Quintuña                                                                     6to C Ingeniería de Sistemas


     2) Exploradores
     3) Labradores.

  Las razones básicas de porque una organización implementa Data Warehouse:

     a)    Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores y
           discos que no son utilizados por sistemas de proceso de transacciones.

  b) Para utilizar modelos de datos o tecnologías de servidores que agilizan los queries y reportes, y que
  no son apropiados para los procesos de transacciones.

  c) Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los
  aspectos técnicos de tecnología de bases de datos es requerida para escribir y mantener queries y
  reportes.

  d) Para proveer un almacén del sistema de proceso de transacciones limpio que puede ser reportado y
  que no necesariamente requiere que se arregle el sistema de proceso de transacciones.

  e) Para hacer los queries y reportes de datos básicamente más fácil de los múltiples procesos de
  transacciones y de las fuentes externas y de los datos que deben ser almacenados solamente para el
  propósito de hacer queries y reportes.

  Los procesos básicos del Data WareHouse (ETL):

     a) Extracción: este es el primer paso de obtener la información hacia el ambiente del Data
         Warehouse.
  b) Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay
  posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve,
  seleccionar únicamente los campos necesarios para el Data Warehouse, combinar fuentes de datos,
  haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una
  dimensión.
  c) Carga: al final del proceso de transformación, los datos están en forma para ser cargados.


  Los elementos básicos de un Data WareHouse:

     a) Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las
          transacciones del negocio. A los sistemas fuentes también se le conoce como Legacy System.
     b) Área de tráfico de datos: es un área de almacenamiento y grupo de procesos, que limpian
     transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para
     ser usados en el Data Warehouse.
     c) Servidor de presentación: la maquina física en donde los datos del Data Warehouse son
     organizados y almacenados para Queries directos por los usuarios finales, reportes y otras
     aplicaciones.
     d) Modelo dimensional: una disciplina especifica para el modelado de datos que es una alternativa
     para los modelos de entidad – relación.
     e) Data Warehouse system.
     f) OLAP: actividad general de búsquedas para presentación de texto y números del Data WareHouse,
     también un estilo dimensional especifico de búsquedas y presentación de información.
     g) ROLAP: un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional
     un estilo dimensional.
     h) MOLAP: un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnología de bases
     de datos que tienen un fuerte estilo dimensional.
     i) Aplicaciones para usuarios finales: una colección de herramientas que hacen los queries, analizan
     y presentan la información objetivo para el soporte de las necesidades del negocio.
                                                     4
Mauricio Quintuña                                                                             6to C Ingeniería de Sistemas




     El Data Mining y su relación con el Data Warehouse.

     Un sistema Data Mining es una tecnología de soporte para usuario final cuyo objetivo es extraer
     conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las
     empresas.
     Las herramientas de Data Mining sirven para predecir tendencias y comportamientos, de esta manera
     permiten a las organizaciones tomar decisiones proactivas para adaptarse rápidamente a los cambios
     del mercado obteniendo así ventajas heterogéneas Bases de Datos relacionales, ficheros planos y
     registros de transacciones en línea.
     El Data Warehouse dota a las organizaciones de memoria, y el Data Mining de inteligencia.

     Cuatro características clave del Data Warehouse

     1)    Las evoluciones tecnológicas
     2)    La vinculación implícita con la estrategia de la empresa
     3)    Una lógica de mejora continua
     4)    Un nivel de madurez diferente según las empresas


     Arquitectura Data Warehouse

                                          Base de datos operacional / Nivel de base de datos externo
                                          Nivel de acceso a la información
                                          Nivel de acceso a los datos
                                          Nivel de directorio de datos (Metadata)
                                          Nivel de gestión de proceso
                                          Nivel de mensaje de la aplicación
                                          Nivel de data warehouse
                                          Nivel de organización de datos

     Estructura del data warehouse

           a) Datos antiguos: La data antigua es aquella que se almacena sobre alguna forma de
              almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle,
              consistente con los datos detallados actuales.

           b) Datos Actuales: Refleja las ocurrencias más recientes, las cuales son de gran interés

           c)       Datos ligeramente resumidos: La data ligeramente resumida es aquella que proviene desde
                    un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel de la data warehouse
                    casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para
                    construirlo son:

           d) Datos completamente resumidos: El siguiente nivel de datos encontrado en el data
              warehouse es el de los datos completamente resumidos. Estos datos son compactos y
              fácilmente accesibles.




                                                           5

Más contenido relacionado

La actualidad más candente

Presentacion de BI asignacion 5
Presentacion de BI asignacion 5Presentacion de BI asignacion 5
Presentacion de BI asignacion 5
siusma
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
Nintendo
 
Date warehousing concepts
Date warehousing conceptsDate warehousing concepts
Date warehousing concepts
pcherukumalla
 
Comandos básicos para bases de datos mysql y workbench
Comandos básicos para bases de datos mysql y workbenchComandos básicos para bases de datos mysql y workbench
Comandos básicos para bases de datos mysql y workbench
Robedgar MX
 

La actualidad más candente (20)

Enterprise Data Architect Job Description
Enterprise Data Architect Job DescriptionEnterprise Data Architect Job Description
Enterprise Data Architect Job Description
 
Oracle
OracleOracle
Oracle
 
SGBD Sybase
SGBD SybaseSGBD Sybase
SGBD Sybase
 
Presentacion de BI asignacion 5
Presentacion de BI asignacion 5Presentacion de BI asignacion 5
Presentacion de BI asignacion 5
 
Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...
Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...
Estrategia de Datos, ¿por dónde iniciar una iniciativa de gestión y gobierno ...
 
gobierno de datos
gobierno de datosgobierno de datos
gobierno de datos
 
ETL
ETLETL
ETL
 
BCBS239 - A Roadmap for Data Governance - 04202016.pdf
BCBS239 - A Roadmap for Data Governance - 04202016.pdfBCBS239 - A Roadmap for Data Governance - 04202016.pdf
BCBS239 - A Roadmap for Data Governance - 04202016.pdf
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Enabling a Data Mesh Architecture and Data Sharing Culture with Denodo
Enabling a Data Mesh Architecture and Data Sharing Culture with DenodoEnabling a Data Mesh Architecture and Data Sharing Culture with Denodo
Enabling a Data Mesh Architecture and Data Sharing Culture with Denodo
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
 
Date warehousing concepts
Date warehousing conceptsDate warehousing concepts
Date warehousing concepts
 
Data Lake,beyond the Data Warehouse
Data Lake,beyond the Data WarehouseData Lake,beyond the Data Warehouse
Data Lake,beyond the Data Warehouse
 
Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.Big data, NoSQL y tendencias en Bases de Datos 2018.
Big data, NoSQL y tendencias en Bases de Datos 2018.
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
The Importance of Metadata
The Importance of MetadataThe Importance of Metadata
The Importance of Metadata
 
Modernizing to a Cloud Data Architecture
Modernizing to a Cloud Data ArchitectureModernizing to a Cloud Data Architecture
Modernizing to a Cloud Data Architecture
 
Comandos básicos para bases de datos mysql y workbench
Comandos básicos para bases de datos mysql y workbenchComandos básicos para bases de datos mysql y workbench
Comandos básicos para bases de datos mysql y workbench
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Etl
EtlEtl
Etl
 

Destacado

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
guest10616d
 
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseConstrucción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Julio Pari
 
Datawarehouse1
Datawarehouse1Datawarehouse1
Datawarehouse1
nestor
 
DATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosDATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datos
María Isabel Bautista
 
2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouse2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouse
Julio Pari
 
1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegocios1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegocios
Julio Pari
 
4 t218162dw tolap
4 t218162dw tolap4 t218162dw tolap
4 t218162dw tolap
Julio Pari
 
3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouse3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouse
Julio Pari
 

Destacado (20)

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Data WareHouse. Introduccion
Data WareHouse. IntroduccionData WareHouse. Introduccion
Data WareHouse. Introduccion
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Introducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosIntroducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de Negocios
 
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouseConstrucción de un DataWareHouse - FISI - UNMSM - DataWareHouse
Construcción de un DataWareHouse - FISI - UNMSM - DataWareHouse
 
Como crear un vocky
Como crear un vockyComo crear un vocky
Como crear un vocky
 
Datawarehouse1
Datawarehouse1Datawarehouse1
Datawarehouse1
 
Diseño de almacen de datos
Diseño de almacen de datosDiseño de almacen de datos
Diseño de almacen de datos
 
DATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datosDATAWAREHOUSE, importancia del almacén de datos
DATAWAREHOUSE, importancia del almacén de datos
 
Diseño Dimensional
Diseño DimensionalDiseño Dimensional
Diseño Dimensional
 
BUSINESS INTELLIGENCE
BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
BUSINESS INTELLIGENCE
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
DATA WAREHOUSING
DATA WAREHOUSINGDATA WAREHOUSING
DATA WAREHOUSING
 
Caracteristicas de las bases de datos
Caracteristicas de las bases de datosCaracteristicas de las bases de datos
Caracteristicas de las bases de datos
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datawarehouse práctica 6
Datawarehouse   práctica 6Datawarehouse   práctica 6
Datawarehouse práctica 6
 
2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouse2 t218162dw t_fundamentosdatawarehouse
2 t218162dw t_fundamentosdatawarehouse
 
1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegocios1 t218162dw t_inteligencianegocios
1 t218162dw t_inteligencianegocios
 
4 t218162dw tolap
4 t218162dw tolap4 t218162dw tolap
4 t218162dw tolap
 
3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouse3 t218162dw t_construcciondatawarehouse
3 t218162dw t_construcciondatawarehouse
 

Similar a Que Es Un Datawarehouse

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
guest10616d
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
Irene Lorza
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1
Calzada Meza
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
Maryy Aqua
 
Almacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datosAlmacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datos
Fiorella Urbina Vera
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
Nintendo
 
rueda-tecnologica-datamart
rueda-tecnologica-datamartrueda-tecnologica-datamart
rueda-tecnologica-datamart
Felix Luque
 

Similar a Que Es Un Datawarehouse (20)

Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
La planificacion segun_data_ware_house
La planificacion segun_data_ware_houseLa planificacion segun_data_ware_house
La planificacion segun_data_ware_house
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
 
ALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptxALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptx
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Cuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utplCuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utpl
 
Data mart
Data martData mart
Data mart
 
1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt1DATA WAREHOUSE.ppt
1DATA WAREHOUSE.ppt
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Datawarehouse 1
Datawarehouse   1Datawarehouse   1
Datawarehouse 1
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De Desiciones
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1Topicos de ingeneria_de_sistema_sii_calzada1
Topicos de ingeneria_de_sistema_sii_calzada1
 
Bussiness inteligence
Bussiness inteligenceBussiness inteligence
Bussiness inteligence
 
Almacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datosAlmacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datos
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Kdd fase1
Kdd fase1Kdd fase1
Kdd fase1
 
data warehouse
data warehousedata warehouse
data warehouse
 
rueda-tecnologica-datamart
rueda-tecnologica-datamartrueda-tecnologica-datamart
rueda-tecnologica-datamart
 

Último

TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
jlorentemartos
 

Último (20)

Los dos testigos. Testifican de la Verdad
Los dos testigos. Testifican de la VerdadLos dos testigos. Testifican de la Verdad
Los dos testigos. Testifican de la Verdad
 
Factores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdfFactores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdf
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
Posición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxPosición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptx
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptFUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
 
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
 
activ4-bloque4 transversal doctorado.pdf
activ4-bloque4 transversal doctorado.pdfactiv4-bloque4 transversal doctorado.pdf
activ4-bloque4 transversal doctorado.pdf
 
PP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomasPP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomas
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPCTRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
 
Sesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdfSesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdf
 

Que Es Un Datawarehouse

  • 1. Mauricio Quintuña 6to C Ingeniería de Sistemas Temario 1. Definición. 2. Objetivo 3. Qué es un Data WareHouse? 4. Importancia 5. Procesos de un Data Warehouse 1
  • 2. Mauricio Quintuña 6to C Ingeniería de Sistemas 6. Desarrollo gradual 7. Beneficios de un Data WareHouse 8. Cómo justificar la inversión en un DataWarehouse? 9. Ventajas y desventajas del DataWarehouse? 10. Tipos de usuarios de un DataWarehouse 11. Las razones básicas de porque una organización implementa Data Warehouse: 12. Los procesos básicos del Data WareHouse (ETL) 13. Los elementos básicos de un Data WareHouse: 14. El Data Mining y su relación con el Data Warehouse. 15. Características clave del Data Warehouse 16. Arquitectura del Data Warehouse 17. ESTRUCTURA DEL DATA WAREHOUSE DataWareHouse Definición “El Data Warehouse es una colección de datos orientados al tema, integrados, no volátiles e historiados, organizados para el apoyo de un proceso de ayuda a la decisión. Objetivo El objetivo del DW se expresa en términos puramente de negocio como “mantener la fidelidad de la clientela” ¿Que es un Data Warehouse? Un Data Warehouse es un almacenamiento separado y homogéneo donde son cargados datos transformados provenientes de diferentes bases de datos. Importancia  Un sistema de Data Warehouse permite transformar datos o información bruta en información con sentido y extremadamente útil.  Uno de los valores más importantes de una organización es la información. Estos valores normalmente son guardados por la empresa de dos formas:  Los sistemas operacionales de registros (de donde el Data Warehouse obtiene los datos) y nuestro almacén de datos. Procesos de un Data Warehouse a) Extracción: obtención de información de las distintas fuentes tanto internas como externas. b) Elaboración: filtrado, limpieza, depuración, homogeneización y agrupación de la información. c) Carga: organización y actualización de los datos y los metadatos en la base de datos. d) Explotación: extracción y análisis de la información en los distintos niveles de agrupación. Desde el punto de vista del usuario, el único proceso visible es la explotación del almacén de datos, aunque el éxito del Data Warehouse radica en los tres procesos iniciales que alimentan la información del mismo y suponen el mayor porcentaje de esfuerzo (en torno a un 80%) a la hora de desarrollar el almacén. Desarrollo gradual 1) Una de las claves del éxito en la construcción de un Data Warehouse es el desarrollo de forma gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el almacén de datos a los demás usuarios. 2
  • 3. Mauricio Quintuña 6to C Ingeniería de Sistemas 2) Por ello es importante elegir este usuario inicial o piloto, siendo importante que sea un departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se puedan obtener y medir resultados a corto plazo. Beneficios de un Data WareHouse a) Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio. b) Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información. c) Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios. d) Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente. e) Supone una optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares ¿Cómo justificar la inversión en un data warehouse? - ¿Están las ventas de artículos deportivos sujetas a tendencias por temporada? ¿Qué artículos se ven afectados y cuándo? - ¿Cuántos autos se vendieron el mes pasado? ¿Cómo se compara esta cantidad con el mismo mes en los últimos cinco años? - ¿Quiénes son los diez primeros vendedores o clientes en Latinoamérica? ¿Qué porcentaje del ingreso generan? - ¿Cuáles son los diez artículos de menor rentabilidad en el catálogo de ventas? Ventajas - Data Warehouse a) Datos de toda la compañía, organizados para facilitar las consultas más analíticas que transaccionales. b) Los procesos de transformación han sido aplicados a los datos para permitir un tiempo de respuesta mínimo a las consultas. c) Modelo de datos multidimensional para hacer más fácil la navegación y explotación de datos. d) La administración de la seguridad está centralizada para garantizar la necesidad de información dependiendo del perfil de los usuarios. Desventajas: a) No es muy útil para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir. b) Requiere de continua limpieza, transformación e integración de datos. c) En un proceso de implantación puede encontrarse dificultades ante los diferentes objetivos que pretende una organización. d) Una vez implantado puede ser complicado añadir nuevas fuentes de datos. Tipos de usuarios de un DW: 1) Turistas 3
  • 4. Mauricio Quintuña 6to C Ingeniería de Sistemas 2) Exploradores 3) Labradores. Las razones básicas de porque una organización implementa Data Warehouse: a) Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores y discos que no son utilizados por sistemas de proceso de transacciones. b) Para utilizar modelos de datos o tecnologías de servidores que agilizan los queries y reportes, y que no son apropiados para los procesos de transacciones. c) Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los aspectos técnicos de tecnología de bases de datos es requerida para escribir y mantener queries y reportes. d) Para proveer un almacén del sistema de proceso de transacciones limpio que puede ser reportado y que no necesariamente requiere que se arregle el sistema de proceso de transacciones. e) Para hacer los queries y reportes de datos básicamente más fácil de los múltiples procesos de transacciones y de las fuentes externas y de los datos que deben ser almacenados solamente para el propósito de hacer queries y reportes. Los procesos básicos del Data WareHouse (ETL): a) Extracción: este es el primer paso de obtener la información hacia el ambiente del Data Warehouse. b) Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data Warehouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión. c) Carga: al final del proceso de transformación, los datos están en forma para ser cargados. Los elementos básicos de un Data WareHouse: a) Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes también se le conoce como Legacy System. b) Área de tráfico de datos: es un área de almacenamiento y grupo de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data Warehouse. c) Servidor de presentación: la maquina física en donde los datos del Data Warehouse son organizados y almacenados para Queries directos por los usuarios finales, reportes y otras aplicaciones. d) Modelo dimensional: una disciplina especifica para el modelado de datos que es una alternativa para los modelos de entidad – relación. e) Data Warehouse system. f) OLAP: actividad general de búsquedas para presentación de texto y números del Data WareHouse, también un estilo dimensional especifico de búsquedas y presentación de información. g) ROLAP: un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional. h) MOLAP: un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnología de bases de datos que tienen un fuerte estilo dimensional. i) Aplicaciones para usuarios finales: una colección de herramientas que hacen los queries, analizan y presentan la información objetivo para el soporte de las necesidades del negocio. 4
  • 5. Mauricio Quintuña 6to C Ingeniería de Sistemas El Data Mining y su relación con el Data Warehouse. Un sistema Data Mining es una tecnología de soporte para usuario final cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas. Las herramientas de Data Mining sirven para predecir tendencias y comportamientos, de esta manera permiten a las organizaciones tomar decisiones proactivas para adaptarse rápidamente a los cambios del mercado obteniendo así ventajas heterogéneas Bases de Datos relacionales, ficheros planos y registros de transacciones en línea. El Data Warehouse dota a las organizaciones de memoria, y el Data Mining de inteligencia. Cuatro características clave del Data Warehouse 1) Las evoluciones tecnológicas 2) La vinculación implícita con la estrategia de la empresa 3) Una lógica de mejora continua 4) Un nivel de madurez diferente según las empresas Arquitectura Data Warehouse  Base de datos operacional / Nivel de base de datos externo  Nivel de acceso a la información  Nivel de acceso a los datos  Nivel de directorio de datos (Metadata)  Nivel de gestión de proceso  Nivel de mensaje de la aplicación  Nivel de data warehouse  Nivel de organización de datos Estructura del data warehouse a) Datos antiguos: La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales. b) Datos Actuales: Refleja las ocurrencias más recientes, las cuales son de gran interés c) Datos ligeramente resumidos: La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel de la data warehouse casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para construirlo son: d) Datos completamente resumidos: El siguiente nivel de datos encontrado en el data warehouse es el de los datos completamente resumidos. Estos datos son compactos y fácilmente accesibles. 5