SlideShare ist ein Scribd-Unternehmen logo
1 von 4
Downloaden Sie, um offline zu lesen
UNIVERSIDAD CATÓLICA DE CUENCA
COMUNIDAD EDUCATIVA AL SERVICIO DEL PUEBLO
EXTENSION CAÑAR
CARRERA:
TECNOLOGIAS DE LA INFORMACIÓN
CÁTEDRA:
ARQUITECTURA DE DATOS EMPRESARIALES
CATEDRÁTICO:
ING. ANONIO CAJAMARCA
ESTUDIANTE:
CARLOS TENELEMA
CICLO:
SEXTO
CAÑAR – ECUADOR
Data Warehouse
El Data Warehouse normalmente se nutre de herramientas como OLAP (Online
Analitical Processing), o DARTs (data access and repoding tools) y técnicas de Data
Mining para obtener información útil para la toma de decisiones. Las bases de datos
operativas de una empresa (facturación, compras, ventas, producción, personal, finanzas,
márketing, etc) son alimentadas por los llamados sistemas OLTP (Online Transactional
Processing), entendiendo como tales el concepto tradicional que manejamos de bases de
datos relacionales con las que las distintas unidades empresariales van trabajando
diariamente. Las bases de datos que conforman un Data Warehouse tienen que estar
integradas, ser temáticas, de carácter histórico y no volátiles77
Cada vez más estos sistemas de almacenamiento y gestión de datos hacen la
búsqueda y recuperación usando modelos de metainformación. Por esta razón gran parte
del software comercial de metadatos está dirigido a este sector. Así, uno de los problemas
con el que pueden encontrarse los usuarios de un Data
Warehouse es saber lo que hay en él y cómo se puede acceder a la información.
Otro componente elemental de un Data Warehouse son las herramientas de acceso
(business infelligence tool), su misión consiste en transformar los datos capturados en
información útil para el negocio. Cada usuario final debe seleccionar la más idónea para
sus necesidades. A las técnicas que posibilitan la extracción coherente de información las
conocemos como minería de datos o Data Mining.
En todo caso, se pretende integrar la información para permitir a los usuarios
localizar y recuperarla dentro de toda la información que una compañía posee. De esta
forma se garantiza que la información adecuada llegue al usuario idóneo, en tiempo y con
el formato exacto para favorecer la toma de decisiones en la organización. (González,
2005)
Extracción de conocimiento en bases de datos y minería de datos
El descubrimiento de conocimiento en bases de datos (KDD) se define como el
proceso de identificar patrones significativos en los datos que sean válidos, novedosos,
potencialmente útiles y comprensibles para un usuario [4,8,10,12]. El proceso global
consiste en transformar información de bajo nivel en conocimiento de alto nivel. El
proceso KDD es interactivo e iterativo conteniendo los siguientes pasos:
1. Comprender el dominio de aplicación: este paso incluye el conocimiento relevante
previo y las metas de la aplicación.
2. Extraer la base de datos objetivo: recogida de los datos, evaluar la calidad de los
datos y utilizar análisis exploratorio de los datos para familiarizarse con ellos.
3. Preparar los datos: incluye limpieza, transformación, integración y reducción de
datos. Se intenta mejorar la calidad de los datos a la vez que disminuir el tiempo
requerido por el algoritmo de aprendizaje aplicado posteriormente.
4. Minería de datos: como se ha señalado anteriormente, este es la fase fundamental
del proceso. Está constituido por una o más de las siguientes funciones,
clasificación, regresión, clustering, resumen, recuperación de imágenes, extracción
de reglas, etc.
5. Interpretación: explicar los patrones descubiertos, así como la posibilidad de
visualizarlos.
6. Utilizar el conocimiento descubierto: hacer uso del modelo creado.
El paso fundamental del proceso es el señalado con el número 4. A continuación
se comentan brevemente las tareas más comunes de la minería de datos, con un ejemplo
de uso.
• Clasificación: clasifica un dato dentro de una de las clases categóricas predefinidas.
Responde a preguntas tales como, ¿Cuál es el riesgo de conceder un crédito a este
cliente? ¿Dado este nuevo paciente qué estado de la enfermedad indican sus
análisis?
• Regresión: el propósito de este modelo es hacer corresponder un dato con un valor
real de una variable. Responde a cuestiones como ¿Cuál es la previsión de ventas
para el mes que viene? ¿De qué depende?
• Clustering: se refiere a la agrupación de registros, observaciones, o casos en clases
de objetos similares. Un cluster es una colección de registros que son similares entre
sí, y distintos a los registros de otro cluster. ¿Cuántos tipos de clientes vienen a mi
negocio? ¿Qué perfiles de necesidades se dan en un cierto grupo de pacientes?
• Generación de reglas: aquí se extraen o generan reglas de los datos. Estas reglas
hacen referencia al descubrimiento de relaciones de asociación y dependencias
funcionales entre los diferentes atributos. ¿Cuánto debe valer este indicador en
sangre para que un paciente se considere grave? ¿Si un cliente de un hipermercado
compra pañales también compra cerveza?
• Resumen o sumarización: estos modelos proporcionan una descripción compacta de
un subconjunto de datos. ¿Cuáles son las principales características de mis clientes?
Análisis de secuencias: se modelan patrones secuenciales, como análisis de series
temporales, secuencias de genes, etc. El objetivo es modelar los estados del proceso, o
extraer e informar de la desviación y tendencias en el tiempo. ¿El consumo de energía
eléctrica de este mes es similar al del año pasado? Dados los niveles de contaminación
atmosférica de la última semana cuál es la previsión para las próximas 24 horas. (José C.
Riquelme, 2006)
Los Sistemas de Gestión de Información
Parece un simple juego de palabras, pero en este caso se trata de gerenciar la
información en sí. Gerenciar aquella información generada dentro y fuera de la
organización que posibilita mejorar directamente la posición competitiva de la
organización, alterando inclusive la naturaleza, el comportamiento o la orientación de los
negocios. Es el Sistema de Información que forma parte de la estrategia de los negocios,
no se trata simplemente de apoyar la estrategia o tributar a ella, sino que el impacto
potencial de los SGI constituya un ingrediente fundamental en el proceso de desarrollo de
la estrategia en el momento mismo de formularla. Se pretende adoptar perspectivas más
creativas, a partir de las aportaciones del SGI, ver las nuevas oportunidades para los
negocios y mejorar la posición competitiva. Esta nueva orientación supone dos momentos
indisolubles. En primer lugar, una apertura de la organización hacia el entorno,
convirtiendo a los competidores, clientes, proveedores etc. en el elemento instigador para
utilizar de diferente manera los SGI, ya sean para obtener ventajas o para evitar incurrir
en desventajas. En segundo lugar, una orientación para que el primer nivel de dirección
se involucre más en el SGI antes, incluso, de proyectar las estrategias, porque la búsqueda
de oportunidades de forma inteligente y ordenadas brotan del SGI. Los SGI permiten:
➢ Comprender la marcha de las organizaciones desde un enfoque analítico (donde
queremos estar), evaluador (donde estamos) y creativo (donde podríamos estar),
➢ Develar oportunidades que merezcan ser explotadas y contrarrestar amenazas,
➢ Establecer los factores que resulten críticos y las necesidades asociadas al SGI,
➢ Estudiar el impacto de los SGI en la posición del negocio y buscar nuevas
oportunidades.
Este enfoque integral del proceso de negocio basadas en la información, requiere que la
organización sea vista como un sistema de flujos de información entre las diferentes áreas
o departamentos y sus subsistemas de información y parte de la premisa de que los
procesos y subprocesos de las organizaciones tienen que estar interrelacionados entre sí y
con su entorno, esta interrelación se plasma en los flujos de información tratados
sistémicamente.
El tratamiento sistémico y sistemático de la información interna que brota de los procesos
de las organizaciones es capaz de revelar el retrabajo, el desperdicio y las islas de
información, en resumen, la ineficacia de los procesos internos de las organizaciones.
(Lara, 1998)

Weitere ähnliche Inhalte

Was ist angesagt?

DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSEGrupo Dos
 
OLAP - Procesamiento Analítico en Línea.
OLAP - Procesamiento Analítico en Línea.OLAP - Procesamiento Analítico en Línea.
OLAP - Procesamiento Analítico en Línea.Lisbeth Ocaña Bueno
 
Datamart,victor mamani catachura,boreasH,Topicos
Datamart,victor mamani catachura,boreasH,TopicosDatamart,victor mamani catachura,boreasH,Topicos
Datamart,victor mamani catachura,boreasH,Topicosvictor mamani
 
38481889 lab-dwh-sql2005
38481889 lab-dwh-sql200538481889 lab-dwh-sql2005
38481889 lab-dwh-sql2005cristhian
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouseshady85
 
Fundamentos de DataWarehouse
Fundamentos de DataWarehouseFundamentos de DataWarehouse
Fundamentos de DataWarehouseHermes Romero
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningNintendo
 
Introducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosIntroducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosSebastian Rodriguez Robotham
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouseguest10616d
 
Datawarehouse y Datamining
Datawarehouse y DataminingDatawarehouse y Datamining
Datawarehouse y Dataminingdannoblack
 
Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2kdcsb
 
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Karina Lucio
 
Data warehouse
Data warehouseData warehouse
Data warehouseMarian C.
 

Was ist angesagt? (20)

DATA WAREHOUSE
DATA WAREHOUSEDATA WAREHOUSE
DATA WAREHOUSE
 
Almacén de datos
Almacén de datosAlmacén de datos
Almacén de datos
 
OLAP - Procesamiento Analítico en Línea.
OLAP - Procesamiento Analítico en Línea.OLAP - Procesamiento Analítico en Línea.
OLAP - Procesamiento Analítico en Línea.
 
Datamart,victor mamani catachura,boreasH,Topicos
Datamart,victor mamani catachura,boreasH,TopicosDatamart,victor mamani catachura,boreasH,Topicos
Datamart,victor mamani catachura,boreasH,Topicos
 
38481889 lab-dwh-sql2005
38481889 lab-dwh-sql200538481889 lab-dwh-sql2005
38481889 lab-dwh-sql2005
 
Creacion de data mart
Creacion de data martCreacion de data mart
Creacion de data mart
 
Data mart
Data martData mart
Data mart
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Datawarehouse
DatawarehouseDatawarehouse
Datawarehouse
 
Fundamentos de DataWarehouse
Fundamentos de DataWarehouseFundamentos de DataWarehouse
Fundamentos de DataWarehouse
 
Diseño de un Datamart
Diseño de un DatamartDiseño de un Datamart
Diseño de un Datamart
 
Almacen de datos
Almacen de datosAlmacen de datos
Almacen de datos
 
Data mart-data-warehouse-data-mining
Data mart-data-warehouse-data-miningData mart-data-warehouse-data-mining
Data mart-data-warehouse-data-mining
 
Inteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data WarehouseInteligencia de Negocios – Data Warehouse
Inteligencia de Negocios – Data Warehouse
 
Introducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de NegociosIntroducción a DataWarehouse e Inteligencia de Negocios
Introducción a DataWarehouse e Inteligencia de Negocios
 
Que Es Un Datawarehouse
Que Es Un DatawarehouseQue Es Un Datawarehouse
Que Es Un Datawarehouse
 
Datawarehouse y Datamining
Datawarehouse y DataminingDatawarehouse y Datamining
Datawarehouse y Datamining
 
Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2Componentes De Un Dss Presentacion 2
Componentes De Un Dss Presentacion 2
 
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
Fundamentos de Sistemas de Base de Datos (Capítulo 29 y 30)
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 

Ähnlich wie Arquitectura de datos empresariales actividad 2

Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de laDuende Hincha Amarillo
 
Gerencia Del Conocimiento Ss
Gerencia Del Conocimiento SsGerencia Del Conocimiento Ss
Gerencia Del Conocimiento SsIndiana19
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analyticsamdia
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negociosanghun
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negociosperezparga
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datosSergio Salimbeni
 
Gerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningGerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningNicoleaks
 
Unidad 2 sim karla itzayana robles
Unidad 2 sim karla itzayana roblesUnidad 2 sim karla itzayana robles
Unidad 2 sim karla itzayana robleskire robles
 
Presentación sobre Sistemas de Información
Presentación sobre Sistemas de InformaciónPresentación sobre Sistemas de Información
Presentación sobre Sistemas de InformaciónMoissAntonioPabnRive
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negociosmikefz16
 
Trabajo nucleo
Trabajo nucleo Trabajo nucleo
Trabajo nucleo kariflomar
 
Expo merca
Expo mercaExpo merca
Expo mercahommero1
 
Sistemas erp grupo n° 1
Sistemas erp grupo n° 1Sistemas erp grupo n° 1
Sistemas erp grupo n° 1yenifferym23
 
Sistemas erp grupo n° 1
Sistemas erp grupo n° 1Sistemas erp grupo n° 1
Sistemas erp grupo n° 1yenifferym23
 

Ähnlich wie Arquitectura de datos empresariales actividad 2 (20)

Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Gestión del conocimientos y tecnologías emergentes de la
Gestión del conocimientos y tecnologías  emergentes de laGestión del conocimientos y tecnologías  emergentes de la
Gestión del conocimientos y tecnologías emergentes de la
 
Gerencia Del Conocimiento Ss
Gerencia Del Conocimiento SsGerencia Del Conocimiento Ss
Gerencia Del Conocimiento Ss
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
 
Gerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningGerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data Mining
 
Unidad 2 sim karla itzayana robles
Unidad 2 sim karla itzayana roblesUnidad 2 sim karla itzayana robles
Unidad 2 sim karla itzayana robles
 
Presentación sobre Sistemas de Información
Presentación sobre Sistemas de InformaciónPresentación sobre Sistemas de Información
Presentación sobre Sistemas de Información
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Trabajo nucleo
Trabajo nucleo Trabajo nucleo
Trabajo nucleo
 
Adm de sistema
Adm de sistemaAdm de sistema
Adm de sistema
 
Expo merca
Expo mercaExpo merca
Expo merca
 
Sistemas erp grupo n° 1
Sistemas erp grupo n° 1Sistemas erp grupo n° 1
Sistemas erp grupo n° 1
 
Sistemas erp grupo n° 1
Sistemas erp grupo n° 1Sistemas erp grupo n° 1
Sistemas erp grupo n° 1
 

Kürzlich hochgeladen

KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxRogerPrieto3
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 

Kürzlich hochgeladen (15)

KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptx
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 

Arquitectura de datos empresariales actividad 2

  • 1. UNIVERSIDAD CATÓLICA DE CUENCA COMUNIDAD EDUCATIVA AL SERVICIO DEL PUEBLO EXTENSION CAÑAR CARRERA: TECNOLOGIAS DE LA INFORMACIÓN CÁTEDRA: ARQUITECTURA DE DATOS EMPRESARIALES CATEDRÁTICO: ING. ANONIO CAJAMARCA ESTUDIANTE: CARLOS TENELEMA CICLO: SEXTO CAÑAR – ECUADOR
  • 2. Data Warehouse El Data Warehouse normalmente se nutre de herramientas como OLAP (Online Analitical Processing), o DARTs (data access and repoding tools) y técnicas de Data Mining para obtener información útil para la toma de decisiones. Las bases de datos operativas de una empresa (facturación, compras, ventas, producción, personal, finanzas, márketing, etc) son alimentadas por los llamados sistemas OLTP (Online Transactional Processing), entendiendo como tales el concepto tradicional que manejamos de bases de datos relacionales con las que las distintas unidades empresariales van trabajando diariamente. Las bases de datos que conforman un Data Warehouse tienen que estar integradas, ser temáticas, de carácter histórico y no volátiles77 Cada vez más estos sistemas de almacenamiento y gestión de datos hacen la búsqueda y recuperación usando modelos de metainformación. Por esta razón gran parte del software comercial de metadatos está dirigido a este sector. Así, uno de los problemas con el que pueden encontrarse los usuarios de un Data Warehouse es saber lo que hay en él y cómo se puede acceder a la información. Otro componente elemental de un Data Warehouse son las herramientas de acceso (business infelligence tool), su misión consiste en transformar los datos capturados en información útil para el negocio. Cada usuario final debe seleccionar la más idónea para sus necesidades. A las técnicas que posibilitan la extracción coherente de información las conocemos como minería de datos o Data Mining. En todo caso, se pretende integrar la información para permitir a los usuarios localizar y recuperarla dentro de toda la información que una compañía posee. De esta forma se garantiza que la información adecuada llegue al usuario idóneo, en tiempo y con el formato exacto para favorecer la toma de decisiones en la organización. (González, 2005) Extracción de conocimiento en bases de datos y minería de datos El descubrimiento de conocimiento en bases de datos (KDD) se define como el proceso de identificar patrones significativos en los datos que sean válidos, novedosos, potencialmente útiles y comprensibles para un usuario [4,8,10,12]. El proceso global consiste en transformar información de bajo nivel en conocimiento de alto nivel. El proceso KDD es interactivo e iterativo conteniendo los siguientes pasos: 1. Comprender el dominio de aplicación: este paso incluye el conocimiento relevante previo y las metas de la aplicación. 2. Extraer la base de datos objetivo: recogida de los datos, evaluar la calidad de los datos y utilizar análisis exploratorio de los datos para familiarizarse con ellos. 3. Preparar los datos: incluye limpieza, transformación, integración y reducción de datos. Se intenta mejorar la calidad de los datos a la vez que disminuir el tiempo requerido por el algoritmo de aprendizaje aplicado posteriormente. 4. Minería de datos: como se ha señalado anteriormente, este es la fase fundamental del proceso. Está constituido por una o más de las siguientes funciones, clasificación, regresión, clustering, resumen, recuperación de imágenes, extracción de reglas, etc.
  • 3. 5. Interpretación: explicar los patrones descubiertos, así como la posibilidad de visualizarlos. 6. Utilizar el conocimiento descubierto: hacer uso del modelo creado. El paso fundamental del proceso es el señalado con el número 4. A continuación se comentan brevemente las tareas más comunes de la minería de datos, con un ejemplo de uso. • Clasificación: clasifica un dato dentro de una de las clases categóricas predefinidas. Responde a preguntas tales como, ¿Cuál es el riesgo de conceder un crédito a este cliente? ¿Dado este nuevo paciente qué estado de la enfermedad indican sus análisis? • Regresión: el propósito de este modelo es hacer corresponder un dato con un valor real de una variable. Responde a cuestiones como ¿Cuál es la previsión de ventas para el mes que viene? ¿De qué depende? • Clustering: se refiere a la agrupación de registros, observaciones, o casos en clases de objetos similares. Un cluster es una colección de registros que son similares entre sí, y distintos a los registros de otro cluster. ¿Cuántos tipos de clientes vienen a mi negocio? ¿Qué perfiles de necesidades se dan en un cierto grupo de pacientes? • Generación de reglas: aquí se extraen o generan reglas de los datos. Estas reglas hacen referencia al descubrimiento de relaciones de asociación y dependencias funcionales entre los diferentes atributos. ¿Cuánto debe valer este indicador en sangre para que un paciente se considere grave? ¿Si un cliente de un hipermercado compra pañales también compra cerveza? • Resumen o sumarización: estos modelos proporcionan una descripción compacta de un subconjunto de datos. ¿Cuáles son las principales características de mis clientes? Análisis de secuencias: se modelan patrones secuenciales, como análisis de series temporales, secuencias de genes, etc. El objetivo es modelar los estados del proceso, o extraer e informar de la desviación y tendencias en el tiempo. ¿El consumo de energía eléctrica de este mes es similar al del año pasado? Dados los niveles de contaminación atmosférica de la última semana cuál es la previsión para las próximas 24 horas. (José C. Riquelme, 2006) Los Sistemas de Gestión de Información Parece un simple juego de palabras, pero en este caso se trata de gerenciar la información en sí. Gerenciar aquella información generada dentro y fuera de la organización que posibilita mejorar directamente la posición competitiva de la organización, alterando inclusive la naturaleza, el comportamiento o la orientación de los negocios. Es el Sistema de Información que forma parte de la estrategia de los negocios, no se trata simplemente de apoyar la estrategia o tributar a ella, sino que el impacto potencial de los SGI constituya un ingrediente fundamental en el proceso de desarrollo de la estrategia en el momento mismo de formularla. Se pretende adoptar perspectivas más creativas, a partir de las aportaciones del SGI, ver las nuevas oportunidades para los negocios y mejorar la posición competitiva. Esta nueva orientación supone dos momentos indisolubles. En primer lugar, una apertura de la organización hacia el entorno,
  • 4. convirtiendo a los competidores, clientes, proveedores etc. en el elemento instigador para utilizar de diferente manera los SGI, ya sean para obtener ventajas o para evitar incurrir en desventajas. En segundo lugar, una orientación para que el primer nivel de dirección se involucre más en el SGI antes, incluso, de proyectar las estrategias, porque la búsqueda de oportunidades de forma inteligente y ordenadas brotan del SGI. Los SGI permiten: ➢ Comprender la marcha de las organizaciones desde un enfoque analítico (donde queremos estar), evaluador (donde estamos) y creativo (donde podríamos estar), ➢ Develar oportunidades que merezcan ser explotadas y contrarrestar amenazas, ➢ Establecer los factores que resulten críticos y las necesidades asociadas al SGI, ➢ Estudiar el impacto de los SGI en la posición del negocio y buscar nuevas oportunidades. Este enfoque integral del proceso de negocio basadas en la información, requiere que la organización sea vista como un sistema de flujos de información entre las diferentes áreas o departamentos y sus subsistemas de información y parte de la premisa de que los procesos y subprocesos de las organizaciones tienen que estar interrelacionados entre sí y con su entorno, esta interrelación se plasma en los flujos de información tratados sistémicamente. El tratamiento sistémico y sistemático de la información interna que brota de los procesos de las organizaciones es capaz de revelar el retrabajo, el desperdicio y las islas de información, en resumen, la ineficacia de los procesos internos de las organizaciones. (Lara, 1998)