SlideShare ist ein Scribd-Unternehmen logo
1 von 9
 El proceso tradicional de base de datos más parecido a la carga
de un almacén de datos es el proceso de migración, aunque a
diferencia de él, existe un mantenimiento posterior.
 La carga y mantenimiento de un almacén de datos es uno de los
aspectos más delicados y que más esfuerzo requiere (50 % de
la implantación del almacén de datos). Existe un sistema
especializado para realizar estas tareas, denominado sistema
ETL.
 Dicho sistema no se compra en el súper mercado, ni se
descarga de internet, sino que:
 La construcción del ETL es responsabilidad del equipo de
desarrollo del almacén de datos y se realiza específicamente
para cada almacén de datos.
 Los procesos ETL es una parte de la integración de datos, es
un elemento importante cuya función completa el resultado
de todo el desarrollo de la cohesión de aplicaciones y
sistemas.
La palabra ETL corresponde a las siglas en inglés
de:
Extraer:
extract.
Transformar:
transform.
Cargar:
load.
Para llevar a cabo de manera correcta el proceso
de extracción, primera fase del ETL, hay que seguir
los siguientes pasos:
Fase de Extracción
● Extraer los datos desde los sistemas de origen.
● Analizar los datos extraídos obteniendo un chequeo.
● Interpretar este chequeo para verificar que los datos
extraídos cumplen la pauta o estructura que se
esperaba.
● Convertir los datos a un formato preparado para
iniciar el proceso de transformación.
Fase de
Transformaci
ón
La fase de transformación
de un proceso de ETL aplica
una serie de reglas de
negocio o funciones sobre
los datos extraídos para
convertirlos en datos que
serán cargados. Estas
directrices pueden ser
declarativas, pueden
basarse en excepciones o
restricciones pero, para
potenciar su pragmatismo y
eficacia, hay que asegurarse
de que sean:
● Declarativas.
● Independientes.
● Claras.
● Inteligibles.
● Con una finalidad
útil para el negocio.
Proceso de
Carga
En esta fase, los datos
procedentes de la fase
anterior (fase de
transformación) son
cargados en el sistema
de destino.
Dependiendo de los
requerimientos de la
organización, este
proceso puede abarcar
una amplia variedad de
acciones diferentes.
GRAFICA DE UN SISTEMA
ETL
DENTRO DE LAS TAREAS QUE REALIZA EL
ETL DESTACAN:
Lectura de datos
transaccionales
Se trata generalmente
de obtener los datos
mediante consultas
SQL sobre la base de
datos transaccional.
Generalmente se
intenta que esta lectura
sea en horarios de
poca carga
transaccional (fines de
semana o noches).
En general se recomienda
crear claves primarias
nuevas para todas las
tablas que se vallan
creando en el
almacenamiento
intermedio o en el
almacén de datos.
Creación de
claves:
Creación y mantenimiento de metadatos: para que
todo el ETL pueda funcionar es necesario crear y
mantener metadatos sobre el propio proceso ETL y los
pasos realizados y por realizar.
consiste en definir las fases de
carga, el orden, para evitar
violar restricciones de
integridad, del mismo modo
que se realizan las
migraciones, y las ventanas de
carga, con el objetivo de poder
hacer la carga sin saturar la
base de datos transaccional,
así como el mantenimiento sin
paralizar el almacén de datos.
Planificación de la
carga y mantenimiento:
Pruebas de calidad:
En realidad, se trata de definir
métricas de calidad de datos
del almacén de datos, así
como implantar un programa
de calidad de datos, con un
responsable de calidad que
realice un seguimiento,
especialmente si el almacén
de datos se desea utilizar para
el apoyo en decisiones
estratégicas.

Weitere ähnliche Inhalte

Ähnlich wie R105044

Conceptos de terminos bi
Conceptos de terminos biConceptos de terminos bi
Conceptos de terminos bi
Lucia Mendez
 

Ähnlich wie R105044 (20)

ETL
ETLETL
ETL
 
ETL
ETLETL
ETL
 
Etl
EtlEtl
Etl
 
OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014 OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014
 
Data Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdfData Warehouse en las empresas y negocios.pdf
Data Warehouse en las empresas y negocios.pdf
 
Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETL
 
Business inteligence
Business inteligenceBusiness inteligence
Business inteligence
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Conceptos de terminos bi
Conceptos de terminos biConceptos de terminos bi
Conceptos de terminos bi
 
Datewarehouse.ppt
Datewarehouse.pptDatewarehouse.ppt
Datewarehouse.ppt
 
Webinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
Webinario: importancia de una estrategia de ETL en proyectos de BI y AnalíticaWebinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
Webinario: importancia de una estrategia de ETL en proyectos de BI y Analítica
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Negocios inteligentes
Negocios inteligentesNegocios inteligentes
Negocios inteligentes
 
Ms SQL Server
Ms SQL ServerMs SQL Server
Ms SQL Server
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Cuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utplCuestiones de repaso_cap_31_utpl
Cuestiones de repaso_cap_31_utpl
 
Trabajo final
Trabajo finalTrabajo final
Trabajo final
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
Perspectiva practica de la administracion de base de datos
Perspectiva practica de la administracion de base de datosPerspectiva practica de la administracion de base de datos
Perspectiva practica de la administracion de base de datos
 
Construyendo pruebas para un DWH usando un paradigma de modelado Data Vault
Construyendo pruebas para un DWH usando un paradigma de modelado Data VaultConstruyendo pruebas para un DWH usando un paradigma de modelado Data Vault
Construyendo pruebas para un DWH usando un paradigma de modelado Data Vault
 

Kürzlich hochgeladen

Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdfComparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
AJYSCORP
 
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdfSENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
JaredQuezada3
 
3ro - Semana 1 (EDA 2) 2023 (3).ppt. edx
3ro - Semana 1 (EDA 2) 2023 (3).ppt. edx3ro - Semana 1 (EDA 2) 2023 (3).ppt. edx
3ro - Semana 1 (EDA 2) 2023 (3).ppt. edx
Evafabi
 
senati-powerpoint_5TOS-_ALUMNOS (1).pptx
senati-powerpoint_5TOS-_ALUMNOS (1).pptxsenati-powerpoint_5TOS-_ALUMNOS (1).pptx
senati-powerpoint_5TOS-_ALUMNOS (1).pptx
nathalypaolaacostasu
 
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
i7ingenieria
 

Kürzlich hochgeladen (20)

2024 - 04 PPT Directiva para la formalizacion, sustento y registro del gasto ...
2024 - 04 PPT Directiva para la formalizacion, sustento y registro del gasto ...2024 - 04 PPT Directiva para la formalizacion, sustento y registro del gasto ...
2024 - 04 PPT Directiva para la formalizacion, sustento y registro del gasto ...
 
Empresa Sazonadores Lopesa estudio de mercado
Empresa Sazonadores Lopesa estudio de mercadoEmpresa Sazonadores Lopesa estudio de mercado
Empresa Sazonadores Lopesa estudio de mercado
 
Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdfComparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
Comparativo DS 024-2016-EM vs DS 023-2017-EM - 21.08.17 (1).pdf
 
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdfSENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
SENTENCIA COLOMBIA DISCRIMINACION SELECCION PERSONAL.pdf
 
Maria_diaz.pptx mapa conceptual gerencia industral
Maria_diaz.pptx mapa conceptual   gerencia industralMaria_diaz.pptx mapa conceptual   gerencia industral
Maria_diaz.pptx mapa conceptual gerencia industral
 
mapa-conceptual-evidencias-de-auditoria_compress.pdf
mapa-conceptual-evidencias-de-auditoria_compress.pdfmapa-conceptual-evidencias-de-auditoria_compress.pdf
mapa-conceptual-evidencias-de-auditoria_compress.pdf
 
el impuesto genera A LAS LAS lasventas IGV
el impuesto genera A LAS  LAS lasventas IGVel impuesto genera A LAS  LAS lasventas IGV
el impuesto genera A LAS LAS lasventas IGV
 
EL REFERENDO para una exposición de sociales
EL REFERENDO para una exposición de socialesEL REFERENDO para una exposición de sociales
EL REFERENDO para una exposición de sociales
 
liderazgo guia.pdf.............................
liderazgo guia.pdf.............................liderazgo guia.pdf.............................
liderazgo guia.pdf.............................
 
S05_s2+Prueba+d.pdfsfeaefadwwwwwwwwwwwwwwwwwwwwwwwwww
S05_s2+Prueba+d.pdfsfeaefadwwwwwwwwwwwwwwwwwwwwwwwwwwS05_s2+Prueba+d.pdfsfeaefadwwwwwwwwwwwwwwwwwwwwwwwwww
S05_s2+Prueba+d.pdfsfeaefadwwwwwwwwwwwwwwwwwwwwwwwwww
 
3ro - Semana 1 (EDA 2) 2023 (3).ppt. edx
3ro - Semana 1 (EDA 2) 2023 (3).ppt. edx3ro - Semana 1 (EDA 2) 2023 (3).ppt. edx
3ro - Semana 1 (EDA 2) 2023 (3).ppt. edx
 
implemenatcion de un data mart en logistica
implemenatcion de un data mart en logisticaimplemenatcion de un data mart en logistica
implemenatcion de un data mart en logistica
 
____ABC de las constelaciones con enfoque centrado en soluciones - Gabriel de...
____ABC de las constelaciones con enfoque centrado en soluciones - Gabriel de...____ABC de las constelaciones con enfoque centrado en soluciones - Gabriel de...
____ABC de las constelaciones con enfoque centrado en soluciones - Gabriel de...
 
DECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADA
DECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADADECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADA
DECRETO-2535-DE-1993-pdf.pdf VIGILANCIA PRIVADA
 
Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedadesLas sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
Las sociedades anónimas en el Perú , de acuerdo a la Ley general de sociedades
 
ADMINISTRACIÓN DE CUENTAS POR COBRAR CGSR.pptx
ADMINISTRACIÓN DE CUENTAS POR COBRAR CGSR.pptxADMINISTRACIÓN DE CUENTAS POR COBRAR CGSR.pptx
ADMINISTRACIÓN DE CUENTAS POR COBRAR CGSR.pptx
 
senati-powerpoint_5TOS-_ALUMNOS (1).pptx
senati-powerpoint_5TOS-_ALUMNOS (1).pptxsenati-powerpoint_5TOS-_ALUMNOS (1).pptx
senati-powerpoint_5TOS-_ALUMNOS (1).pptx
 
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
260813887-diagrama-de-flujo-de-proceso-de-esparrago-fresco-verde.pptx
 
Fabricación de Cremas en Industria Farmacéutica
Fabricación de Cremas en Industria FarmacéuticaFabricación de Cremas en Industria Farmacéutica
Fabricación de Cremas en Industria Farmacéutica
 
Sostenibilidad y continuidad huamcoli robin-cristian.pptx
Sostenibilidad y continuidad huamcoli robin-cristian.pptxSostenibilidad y continuidad huamcoli robin-cristian.pptx
Sostenibilidad y continuidad huamcoli robin-cristian.pptx
 

R105044

  • 1.  El proceso tradicional de base de datos más parecido a la carga de un almacén de datos es el proceso de migración, aunque a diferencia de él, existe un mantenimiento posterior.  La carga y mantenimiento de un almacén de datos es uno de los aspectos más delicados y que más esfuerzo requiere (50 % de la implantación del almacén de datos). Existe un sistema especializado para realizar estas tareas, denominado sistema ETL.
  • 2.  Dicho sistema no se compra en el súper mercado, ni se descarga de internet, sino que:  La construcción del ETL es responsabilidad del equipo de desarrollo del almacén de datos y se realiza específicamente para cada almacén de datos.  Los procesos ETL es una parte de la integración de datos, es un elemento importante cuya función completa el resultado de todo el desarrollo de la cohesión de aplicaciones y sistemas.
  • 3. La palabra ETL corresponde a las siglas en inglés de: Extraer: extract. Transformar: transform. Cargar: load.
  • 4. Para llevar a cabo de manera correcta el proceso de extracción, primera fase del ETL, hay que seguir los siguientes pasos: Fase de Extracción ● Extraer los datos desde los sistemas de origen. ● Analizar los datos extraídos obteniendo un chequeo. ● Interpretar este chequeo para verificar que los datos extraídos cumplen la pauta o estructura que se esperaba. ● Convertir los datos a un formato preparado para iniciar el proceso de transformación.
  • 5. Fase de Transformaci ón La fase de transformación de un proceso de ETL aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Estas directrices pueden ser declarativas, pueden basarse en excepciones o restricciones pero, para potenciar su pragmatismo y eficacia, hay que asegurarse de que sean: ● Declarativas. ● Independientes. ● Claras. ● Inteligibles. ● Con una finalidad útil para el negocio.
  • 6. Proceso de Carga En esta fase, los datos procedentes de la fase anterior (fase de transformación) son cargados en el sistema de destino. Dependiendo de los requerimientos de la organización, este proceso puede abarcar una amplia variedad de acciones diferentes.
  • 7. GRAFICA DE UN SISTEMA ETL
  • 8. DENTRO DE LAS TAREAS QUE REALIZA EL ETL DESTACAN: Lectura de datos transaccionales Se trata generalmente de obtener los datos mediante consultas SQL sobre la base de datos transaccional. Generalmente se intenta que esta lectura sea en horarios de poca carga transaccional (fines de semana o noches). En general se recomienda crear claves primarias nuevas para todas las tablas que se vallan creando en el almacenamiento intermedio o en el almacén de datos. Creación de claves:
  • 9. Creación y mantenimiento de metadatos: para que todo el ETL pueda funcionar es necesario crear y mantener metadatos sobre el propio proceso ETL y los pasos realizados y por realizar. consiste en definir las fases de carga, el orden, para evitar violar restricciones de integridad, del mismo modo que se realizan las migraciones, y las ventanas de carga, con el objetivo de poder hacer la carga sin saturar la base de datos transaccional, así como el mantenimiento sin paralizar el almacén de datos. Planificación de la carga y mantenimiento: Pruebas de calidad: En realidad, se trata de definir métricas de calidad de datos del almacén de datos, así como implantar un programa de calidad de datos, con un responsable de calidad que realice un seguimiento, especialmente si el almacén de datos se desea utilizar para el apoyo en decisiones estratégicas.