1. UNIVERSIDAD GALILEOUNIVERSIDAD GALILEO
HERBERT PATZAN CARRILLOHERBERT PATZAN CARRILLO
TECNOLOGIA DE NEGOCIOS ELECTRONICOSTECNOLOGIA DE NEGOCIOS ELECTRONICOS
BASES DE DATOSBASES DE DATOS
2. CONCEPTOCONCEPTO
Es un conjunto de información no redundante enEs un conjunto de información no redundante en
datos estructurados y organizadosdatos estructurados y organizados
independientemente de su utilización y suindependientemente de su utilización y su
implementación, accesibles en tiempo real yimplementación, accesibles en tiempo real y
compatibles con usuarios concurrentes concompatibles con usuarios concurrentes con
necesidad de información de diferente tipo y ennecesidad de información de diferente tipo y en
diferente momentodiferente momento
3. CONCEPTOCONCEPTO
En este sentido, una biblioteca puedeEn este sentido, una biblioteca puede
considerarse una base de datos compuesta enconsiderarse una base de datos compuesta en
su mayoría por documentos y textos impresos ensu mayoría por documentos y textos impresos en
papel e indexados para su consulta. En lapapel e indexados para su consulta. En la
actualidad, y debido al desarrollo tecnológico deactualidad, y debido al desarrollo tecnológico de
campos como la informática y la electrónica, lacampos como la informática y la electrónica, la
mayoría de las bases de datos tienen formatomayoría de las bases de datos tienen formato
electrónico, que ofrece un amplio rango deelectrónico, que ofrece un amplio rango de
soluciones al problema de almacenar datos.soluciones al problema de almacenar datos.
4. COMPONENTESCOMPONENTES
En informática existen los sistemas gestores deEn informática existen los sistemas gestores de
bases de datos (SGBD), que permiten almacenarbases de datos (SGBD), que permiten almacenar
y posteriormente acceder a los datos de formay posteriormente acceder a los datos de forma
rápida y estructurada.rápida y estructurada.
son un tipo de software muy específico, dedicadoson un tipo de software muy específico, dedicado
a servir de interfaz entre la base de datos, ela servir de interfaz entre la base de datos, el
usuario y las aplicaciones que la utilizan. Seusuario y las aplicaciones que la utilizan. Se
compone de un lenguaje de definición de datos,compone de un lenguaje de definición de datos,
de un lenguaje de manipulación de datos y de unde un lenguaje de manipulación de datos y de un
lenguaje de consultalenguaje de consulta
5. COMPONENTESCOMPONENTES
Entre los SGBD mas conocidosEntre los SGBD mas conocidos
están:están:
LibresLibres
MySQLMySQL
PostgreSQLPostgreSQL
FirebirdFirebird
Apache DerbyApache Derby
GratuitosGratuitos
Microsoft SQL Server Compact EditionMicrosoft SQL Server Compact Edition
Sybase Express Edition para LinuxSybase Express Edition para Linux
7. VENTAJAS DE LAS BD´sVENTAJAS DE LAS BD´s
Independencia de datos y tratamientoIndependencia de datos y tratamiento
Coherencia de resultadosCoherencia de resultados
Mayor disponibilidad de datosMayor disponibilidad de datos
Cumplimiento de normasCumplimiento de normas
Facilidad de manejoFacilidad de manejo
Seguridad de la informaciónSeguridad de la información
No hay duplicidad de datosNo hay duplicidad de datos
Integridad referencialIntegridad referencial
8. DESVENTAJAS DE LAS BD´sDESVENTAJAS DE LAS BD´s
Los costos de actualización de hardware yLos costos de actualización de hardware y
software pueden ser elevados.software pueden ser elevados.
El costo o remuneración para unEl costo o remuneración para un
administrador de base de datos puede seradministrador de base de datos puede ser
muy grande.muy grande.
Los registros muy grandes pueden serLos registros muy grandes pueden ser
difíciles de leer en pantalla.difíciles de leer en pantalla.
9. JERARQUIA DE DATOSJERARQUIA DE DATOS
CarácterCarácter
Unidad de construcción básica de informaciónUnidad de construcción básica de información
representada por un byterepresentada por un byte
CampoCampo
Grupo de caracteresGrupo de caracteres
RegistroRegistro
Conjunto de campos relacionadosConjunto de campos relacionados
ArchivoArchivo
Grupo de registros relacionadosGrupo de registros relacionados
10. JERARQUIA DE DATOSJERARQUIA DE DATOS
Base de DatosBase de Datos
Conjunto de archivos integrado yConjunto de archivos integrado y
relacionados.relacionados.
EntidadEntidad
Tipos generalizados de personas, lugares oTipos generalizados de personas, lugares o
cosas (objetos), para los cuales se recopilan,cosas (objetos), para los cuales se recopilan,
almacenan y mantienen datos.almacenan y mantienen datos.
AtributoAtributo
Los atributos, tanto de entidades como deLos atributos, tanto de entidades como de
relaciones, toman sus valores posibles de unrelaciones, toman sus valores posibles de un
conjunto llamado dominio. El dominio es,conjunto llamado dominio. El dominio es,
entonces, el conjunto de valores posibles queentonces, el conjunto de valores posibles que
puede tomar un atributo dado de un conjuntopuede tomar un atributo dado de un conjunto
de entidades.de entidades.
11. JERARQUIA DE DATOSJERARQUIA DE DATOS
ALMACENAMIENTO DE DATOALMACENAMIENTO DE DATO
Valor especifico de un atributo.Valor especifico de un atributo.
CLAVECLAVE
Campo o grupo de campos en un registro queCampo o grupo de campos en un registro que
se usa para identificar a este ultimo.se usa para identificar a este ultimo.
CLAVE PRIMARIACLAVE PRIMARIA
Campo o grupo de campos que identificaCampo o grupo de campos que identifica
exclusivamente el registro.exclusivamente el registro.
12. MODELO RELACIONALMODELO RELACIONAL
Éste es el modelo más utilizado en la actualidadÉste es el modelo más utilizado en la actualidad
para modelar problemas reales y administrarpara modelar problemas reales y administrar
datos dinámicamente. Tras ser postulados susdatos dinámicamente. Tras ser postulados sus
fundamentos en 1970 por Edgar Frank Codd, defundamentos en 1970 por Edgar Frank Codd, de
los laboratorios IBM en San José (California), nolos laboratorios IBM en San José (California), no
tardó en consolidarse como un nuevo paradigmatardó en consolidarse como un nuevo paradigma
en los modelos de base de datos. Su ideaen los modelos de base de datos. Su idea
fundamental es el uso de "relaciones". Estasfundamental es el uso de "relaciones". Estas
relaciones podrían considerarse en forma lógicarelaciones podrían considerarse en forma lógica
como conjuntos de datos llamados "tuplas".como conjuntos de datos llamados "tuplas".
Esto es pensando en cada relación como siEsto es pensando en cada relación como si
fuese una tabla que está compuesta porfuese una tabla que está compuesta por registrosregistros
(las filas de una tabla), que representarían las(las filas de una tabla), que representarían las
tuplas, ytuplas, y camposcampos (las columnas de una tabla).(las columnas de una tabla).
13. MODELO RELACIONALMODELO RELACIONAL
El lenguaje más habitual para construir lasEl lenguaje más habitual para construir las
consultas a bases de datos relacionales es SQL,consultas a bases de datos relacionales es SQL,
Structured Query Language o LenguajeStructured Query Language o Lenguaje
Estructurado de Consultas, un estándarEstructurado de Consultas, un estándar
implementado por los principales motores oimplementado por los principales motores o
sistemas de gestión de bases de datossistemas de gestión de bases de datos
relacionales. Durante la elaboración de una baserelacionales. Durante la elaboración de una base
de datos relacional pasa por un proceso dede datos relacional pasa por un proceso de
normalizaciónnormalización
14. MODELO RELACIONALMODELO RELACIONAL
Ente las ventajas del modelo relacional están:Ente las ventajas del modelo relacional están:
Garantizar herramientas para evitar laGarantizar herramientas para evitar la
duplicidad de registros, a través de camposduplicidad de registros, a través de campos
claves o llaves.claves o llaves.
Garantiza la integridad referencial: Así alGarantiza la integridad referencial: Así al
eliminar un registro elimina todos loseliminar un registro elimina todos los
registros relacionados dependientes.registros relacionados dependientes.
Favorece la normalización por ser másFavorece la normalización por ser más
comprensible y aplicable.comprensible y aplicable.
15. MODELO RELACIONALMODELO RELACIONAL
El proceso deEl proceso de normalización de bases denormalización de bases de
datosdatos consiste en aplicar una serie de reglas aconsiste en aplicar una serie de reglas a
las relaciones obtenidas tras el paso del modelolas relaciones obtenidas tras el paso del modelo
entidad-relación al modelo relacional. Las basesentidad-relación al modelo relacional. Las bases
de datos relacionales se normalizan para:de datos relacionales se normalizan para:
Evitar la redundancia de los datos.Evitar la redundancia de los datos.
Evitar problemas de actualización de los datosEvitar problemas de actualización de los datos
en las tablas.en las tablas.
Proteger la integridad de los datos.Proteger la integridad de los datos.
16. MODELO RELACIONALMODELO RELACIONAL
Las relaciones que describe Codd al definir suLas relaciones que describe Codd al definir su
modelo relacional, son transformadas en tablasmodelo relacional, son transformadas en tablas
al momento de trabajar con una base de datos.al momento de trabajar con una base de datos.
Las Formas Normales buscan optimizar estasLas Formas Normales buscan optimizar estas
estructuras eliminando básicamente laestructuras eliminando básicamente la
redundancia utilizando como medio principal lasredundancia utilizando como medio principal las
dependencias funcionales. Las Formas Normalesdependencias funcionales. Las Formas Normales
son un pequeño numero de reglas que deson un pequeño numero de reglas que de
cumplirse hacen que las estructuras posean lacumplirse hacen que las estructuras posean la
menor cantidad de redundancia posible.menor cantidad de redundancia posible.
Primera Forma Normal (1NF): No hayPrimera Forma Normal (1NF): No hay
campos múltiples (todo los campos soncampos múltiples (todo los campos son
atómicos). Todas las filas deben tener elatómicos). Todas las filas deben tener el
mismo numero de columnas.mismo numero de columnas.
17. MODELO RELACIONALMODELO RELACIONAL
Segunda Forma Normal (2NF): Todo campoSegunda Forma Normal (2NF): Todo campo
que no sea clave debe depender por completoque no sea clave debe depender por completo
de toda la clave.de toda la clave.
Tercera Forma Normal (3NF): No hayTercera Forma Normal (3NF): No hay
dependencias transitivas. Un campo debedependencias transitivas. Un campo debe
depender de la clave y no de otro campo.depender de la clave y no de otro campo.
Forma Normal de Boyce-Codd (BCNF): TodosForma Normal de Boyce-Codd (BCNF): Todos
los determinantes de la tabla son clavelos determinantes de la tabla son clave
candidata.candidata.
Cuarta Forma Normal (4NF): Una fila no debeCuarta Forma Normal (4NF): Una fila no debe
contener dos o más campos multi-valoradoscontener dos o más campos multi-valorados
(aquellos que pueden contener más de un(aquellos que pueden contener más de un
valor simultáneamente) sobre una entidad.valor simultáneamente) sobre una entidad.
18. MODELO RELACIONALMODELO RELACIONAL
Quinta Forma Normal (5NF): Una tabla puedeQuinta Forma Normal (5NF): Una tabla puede
almacenar atributos dependientes a la clavealmacenar atributos dependientes a la clave
sólosólo por unión.por unión.
19. ORIENTADAS A OBJETOSORIENTADAS A OBJETOS
En una base de datos orientada a objetos, laEn una base de datos orientada a objetos, la
información se representa mediante objetosinformación se representa mediante objetos
como los presentes en la programación orientadacomo los presentes en la programación orientada
a objetos. Cuando se integra las característicasa objetos. Cuando se integra las características
de una base de datos con las de un lenguaje dede una base de datos con las de un lenguaje de
programación orientado a objetos, el resultado esprogramación orientado a objetos, el resultado es
un sistema gestor de base de datos orientada aun sistema gestor de base de datos orientada a
objetos (ODBMS,objetos (ODBMS, Object Database ManagementObject Database Management
SystemSystem). Un ODBMS hace que los objetos de la). Un ODBMS hace que los objetos de la
base de datos aparezcan como objetos de unbase de datos aparezcan como objetos de un
lenguaje de programación en uno o máslenguaje de programación en uno o más
lenguajes de programación a los que dé soporte.lenguajes de programación a los que dé soporte.
20. ORIENTADAS A OBJETOSORIENTADAS A OBJETOS
Un ODBMS extiende los lenguajes con datosUn ODBMS extiende los lenguajes con datos
persistentes de forma transparente, control depersistentes de forma transparente, control de
concurrencia, recuperación de datos, consultasconcurrencia, recuperación de datos, consultas
asociativas y otras capacidades.asociativas y otras capacidades.
Las bases de datos orientadas a objetos seLas bases de datos orientadas a objetos se
diseñan para trabajar bien en conjunción condiseñan para trabajar bien en conjunción con
lenguajes de programación orientados a objetoslenguajes de programación orientados a objetos
como Java, C#, Visual Basic.NET y C++. Loscomo Java, C#, Visual Basic.NET y C++. Los
ODBMS usan exactamente el mismo modelo queODBMS usan exactamente el mismo modelo que
estos lenguajes de programación.estos lenguajes de programación.
21. ORIENTADAS A OBJETOSORIENTADAS A OBJETOS
HerenciaHerencia
Las clases en un sistema orientado a objetosLas clases en un sistema orientado a objetos
se representan en forma jerárquica, así quese representan en forma jerárquica, así que
las propiedades o características del elementolas propiedades o características del elemento
persona las contendrán (heredaran) lospersona las contendrán (heredaran) los
elementos alumno y maestro. Se puede decirelementos alumno y maestro. Se puede decir
que tanto la entidad Alumno y maestro sonque tanto la entidad Alumno y maestro son
subclases de la clase personasubclases de la clase persona
22. ORIENTADAS A OBJETOSORIENTADAS A OBJETOS
En base de datos orientados a objetos puedenEn base de datos orientados a objetos pueden
existir los siguientes cambios:existir los siguientes cambios:
Adición de una nueva clase: Para realizar esteAdición de una nueva clase: Para realizar este
proceso, la nueva clase debe colocarse en laproceso, la nueva clase debe colocarse en la
jerarquía de clase o subclase cuidando lasjerarquía de clase o subclase cuidando las
variables o métodos de herenciavariables o métodos de herencia
correspondientes.correspondientes.
Eliminación de una clase: Se requiere laEliminación de una clase: Se requiere la
realización de varias operaciones, se debe derealización de varias operaciones, se debe de
cuidar los elementos que se han heredado decuidar los elementos que se han heredado de
esa clase a otras y reestructurar la jerarquía.esa clase a otras y reestructurar la jerarquía.
23. MULTIDIMENCIONALESMULTIDIMENCIONALES
Las bases de datos multidimensionales seLas bases de datos multidimensionales se
utilizan principalmente para crearutilizan principalmente para crear
aplicaciones OLAP y se puede decir que sonaplicaciones OLAP y se puede decir que son
bases de datos de una sola tabla, subases de datos de una sola tabla, su
peculiaridad es que por cada dimensiónpeculiaridad es que por cada dimensión
tienen un campo y otro campo por cadatienen un campo y otro campo por cada
métrica o hecho es decir tienen n-tuplas demétrica o hecho es decir tienen n-tuplas de
campos.campos.
24. MULTIDIMENCIONALESMULTIDIMENCIONALES
EJEMPLO:EJEMPLO:
Dimensión (Tiempo,Productos)Dimensión (Tiempo,Productos)
Jerarquía (Año->Semestre->Mes->Semana),(Categoría->Línea-Jerarquía (Año->Semestre->Mes->Semana),(Categoría->Línea-
>Marca)>Marca)
Elementos(2006,2007 Ó Máquinas caras, Máquinas Baratas)Elementos(2006,2007 Ó Máquinas caras, Máquinas Baratas)
HechoHecho FactFact (Ventas, Inventario, Defectos, Devoluciones)(Ventas, Inventario, Defectos, Devoluciones)
Métrica (PD:=Devoluciones/Ventas, Ventas, Cantidad deMétrica (PD:=Devoluciones/Ventas, Ventas, Cantidad de
Defectos)Defectos)
tabla
tiempo productos ventas inventario defectos devoluciones
devolucion
es ventas
2006 todos 1000 200 10 1--100 5%
25. MULTIDIMENCIONALESMULTIDIMENCIONALES
Las estructuras multidimensionales permiten queLas estructuras multidimensionales permiten que
el usuario analice los datos de acuerdo a comoel usuario analice los datos de acuerdo a como
quiera mirar el negocio, resumido por línea dequiera mirar el negocio, resumido por línea de
producto, u otras perspectivas claves para suproducto, u otras perspectivas claves para su
negocio. El server de Data Mining debe estarnegocio. El server de Data Mining debe estar
integrado con el data warehouse y el serverintegrado con el data warehouse y el server
OLAP para insertar el análisis de negociosOLAP para insertar el análisis de negocios
directamente en esta infraestructura.directamente en esta infraestructura.
26. DATA WAREHOUSINGDATA WAREHOUSING
En el contexto de la informática, unEn el contexto de la informática, un almacén dealmacén de
datosdatos ((data warehousedata warehouse) es una colección de) es una colección de
datos orientados a un dominio, integrado ydatos orientados a un dominio, integrado y
variable que ayuda a la toma de decisiones de lavariable que ayuda a la toma de decisiones de la
empresa u organización.empresa u organización.
Se trata, sobre todo, de un expediente de unaSe trata, sobre todo, de un expediente de una
empresa más allá de la información transaccionalempresa más allá de la información transaccional
y operacional, almacenado en una base de datosy operacional, almacenado en una base de datos
diseñada para favorecer el análisis y ladiseñada para favorecer el análisis y la
divulgación eficientes de datos (especialmentedivulgación eficientes de datos (especialmente
OLAP, procesamiento analítico en línea).OLAP, procesamiento analítico en línea).
27. DATA WAREHOUSINGDATA WAREHOUSING
Data warehousing es el centro de la arquitecturaData warehousing es el centro de la arquitectura
para los sistemas de información en la década depara los sistemas de información en la década de
los '90. Soporta el procesamiento informático allos '90. Soporta el procesamiento informático al
proveer, una plataforma sólida, a partir de losproveer, una plataforma sólida, a partir de los
datos históricos para hacer el análisis. Facilita ladatos históricos para hacer el análisis. Facilita la
integración de sistemas de aplicación nointegración de sistemas de aplicación no
integrados. Organiza y almacena los datos queintegrados. Organiza y almacena los datos que
se necesitan para el procesamiento analítico,se necesitan para el procesamiento analítico,
informático sobre una amplia perspectiva deinformático sobre una amplia perspectiva de
tiempo.tiempo.
28. DATA WAREHOUSINGDATA WAREHOUSING
Base de Datos
Operacional
Data Warehouse
Datos Operacionales
Datos del negocio para
Información
Orientado a la
aplicación
Orientado al sujeto
Actual Actual + histórico
Detallada
Detallada + más
resumida
Cambia
continuamente
Estable
29. DATA WAREHOUSINGDATA WAREHOUSING
Sistemas EstratégicosSistemas Estratégicos, orientados a soportar la toma de, orientados a soportar la toma de
decisiones.decisiones.
Sistemas TácticosSistemas Tácticos, diseñados para soportar las actividades de, diseñados para soportar las actividades de
coordinación y manejo de documentación y definidos para facilitarcoordinación y manejo de documentación y definidos para facilitar
consultas sobre información almacenada en el sistema y asiconsultas sobre información almacenada en el sistema y asi
proporcionar informes.proporcionar informes.
Sistemas Técnico-Operativos,Sistemas Técnico-Operativos, que cubren el núcleo deque cubren el núcleo de
operaciones tradicionales de captura masiva de datos y serviciosoperaciones tradicionales de captura masiva de datos y servicios
básicos de tratamiento de datosbásicos de tratamiento de datos
30. DATA WAREHOUSINGDATA WAREHOUSING
Sistemas InterinstitucionalesSistemas Interinstitucionales, este último nivel, este último nivel
de sistemas de información recién estáde sistemas de información recién está
surgiendo, es consecuencia del desarrollosurgiendo, es consecuencia del desarrollo
organizacional orientado a un mercado deorganizacional orientado a un mercado de
carácter global, el cual obliga a pensar ecarácter global, el cual obliga a pensar e
implementar estructuras de comunicación másimplementar estructuras de comunicación más
estrechas entre la organización y el mercadoestrechas entre la organización y el mercado
31. DATA WAREHOUSEDATA WAREHOUSE
En un almacén de datos lo que se quiere esEn un almacén de datos lo que se quiere es
contener datos que son necesarios o útiles paracontener datos que son necesarios o útiles para
las empresas.las empresas.
Un almacén de datos debe entregar laUn almacén de datos debe entregar la
información correcta a la gente indicada en elinformación correcta a la gente indicada en el
momento adecuado en el formato correcto. Elmomento adecuado en el formato correcto. El
almacén de datos da respuesta a lasalmacén de datos da respuesta a las
necesidades de usuarios conocedores, utilizandonecesidades de usuarios conocedores, utilizando
Sistemas de Soporte de Decisiones (DSS)Sistemas de Soporte de Decisiones (DSS)
El ambiente de un Data Warehouse quedaEl ambiente de un Data Warehouse queda
definido por la suma de los diferentes DataMartsdefinido por la suma de los diferentes DataMarts
integrados, no sólo a nivel físico sino también aintegrados, no sólo a nivel físico sino también a
nivel lógico.nivel lógico.
32. DATA WAREHOUSEDATA WAREHOUSE
CARACTERISTICAS:CARACTERISTICAS:
Orientado al temaOrientado al tema
IntegradoIntegrado
De tiempo varianteDe tiempo variante
No volátilNo volátil
34. DATA MININGDATA MINING
Bajo el nombre deBajo el nombre de minería de datosminería de datos sese
engloban un conjunto de técnicas encaminadas aengloban un conjunto de técnicas encaminadas a
la extracción de "conocimiento" procesablela extracción de "conocimiento" procesable
implícito en las bases de datos. Las bases de laimplícito en las bases de datos. Las bases de la
minería de datos se encuentran en la inteligenciaminería de datos se encuentran en la inteligencia
artificial y en el análisis estadístico. Mediante losartificial y en el análisis estadístico. Mediante los
modelos extraídos utilizando técnicas de mineríamodelos extraídos utilizando técnicas de minería
de datos se aborda la solución a problemas dede datos se aborda la solución a problemas de
predicción, clasificación y segmentaciónpredicción, clasificación y segmentación
35. DATA MININGDATA MINING
Un proceso típico de minería de datos parte de laUn proceso típico de minería de datos parte de la
selección del conjunto de datos, tanto en lo queselección del conjunto de datos, tanto en lo que
se refiere a las variables dependientes, como ase refiere a las variables dependientes, como a
las variables objetivo, como posiblemente allas variables objetivo, como posiblemente al
muestreo de los registros disponibles.muestreo de los registros disponibles.
El ejemplo clásico de la minería de datos tieneEl ejemplo clásico de la minería de datos tiene
que ver con la detección deque ver con la detección de hábitos de comprahábitos de compra
en supermercadosen supermercados. Un estudio muy citado. Un estudio muy citado
detectó que los viernes había una cantidaddetectó que los viernes había una cantidad
inusualmente elevada de clientes que adquirían ainusualmente elevada de clientes que adquirían a
la vez pañales y cerveza.la vez pañales y cerveza.
36. DATA MININGDATA MINING
Se detectó que se debía a que dicho díaSe detectó que se debía a que dicho día
solían acudir al supermercado padressolían acudir al supermercado padres
jóvenes cuya perspectiva para el fin dejóvenes cuya perspectiva para el fin de
semana consistía en quedarse en casasemana consistía en quedarse en casa
cuidando de su hijo y viendo la televisióncuidando de su hijo y viendo la televisión
con una cerveza en la mano. Elcon una cerveza en la mano. El
supermercado pudo incrementar sussupermercado pudo incrementar sus
ventas de cerveza colocándolas próximas aventas de cerveza colocándolas próximas a
los pañales para fomentar las ventaslos pañales para fomentar las ventas
compulsivascompulsivas..
37. DATA MININGDATA MINING
LA MINERIA DE DATOS SE BASA EN LALA MINERIA DE DATOS SE BASA EN LA
ESTADISTICA Y TOMA LA SIGUIENTEESTADISTICA Y TOMA LA SIGUIENTE
INFORMACION:INFORMACION:
Análisis de la VarianzaAnálisis de la Varianza: mediante el cual: mediante el cual
se contrasta la existencia de diferenciasse contrasta la existencia de diferencias
significativas entre las medidas de una osignificativas entre las medidas de una o
más variables continuas en grupo demás variables continuas en grupo de
población distintos.población distintos.
RegresiónRegresión: define la relación entre una o: define la relación entre una o
más variables.más variables.
38. DATA MININGDATA MINING
Análisis clusterAnálisis cluster: permite la clasificación de: permite la clasificación de
una población en un número determinadouna población en un número determinado
de grupos, en base a semejanzas yde grupos, en base a semejanzas y
desemejanzas de perfiles existentes.desemejanzas de perfiles existentes.
Análisis discriminanteAnálisis discriminante: permite la: permite la
clasificación de individuos en grupos queclasificación de individuos en grupos que
previamente se han establecido, permitepreviamente se han establecido, permite
encontrar la regla de clasificación de losencontrar la regla de clasificación de los
elementos de estos grupos, y por tanto unaelementos de estos grupos, y por tanto una
mejor identificación.mejor identificación.
39. DATA MININGDATA MINING
TENDENCIASTENDENCIAS
La Minería de Datos ha sufridoLa Minería de Datos ha sufrido
transformaciones en los últimos años detransformaciones en los últimos años de
acuerdo con cambios tecnológicos, deacuerdo con cambios tecnológicos, de
estrategias de marketing, la extensión de losestrategias de marketing, la extensión de los
modelos de compra en línea, etc. Los másmodelos de compra en línea, etc. Los más
importantes de ellos son:importantes de ellos son:
La importancia que han cobrado losLa importancia que han cobrado los datosdatos
no estructuradosno estructurados (texto, páginas de(texto, páginas de
Internet, etc.)Internet, etc.)
LaLa necesidad de integrarnecesidad de integrar los algoritmos ylos algoritmos y
resultados obtenidos en sistemasresultados obtenidos en sistemas
operacionales, portales de Internet, etc.operacionales, portales de Internet, etc.
40. BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
Business Intelligence suele definirse como laBusiness Intelligence suele definirse como la
transformación de los datos de la compañía entransformación de los datos de la compañía en
conocimiento para obtener una ventajaconocimiento para obtener una ventaja
competitiva.competitiva.
Business Intelligence puede ser el conjunto deBusiness Intelligence puede ser el conjunto de
metodologías, aplicaciones y tecnologías quemetodologías, aplicaciones y tecnologías que
permiten reunir, depurar y transformar datos depermiten reunir, depurar y transformar datos de
los sistemas transaccionales e informaciónlos sistemas transaccionales e información
desestructurada (interna y externa a ladesestructurada (interna y externa a la
compañía) en información estructurada, para sucompañía) en información estructurada, para su
explotación directa (análisis OLAP.) o para suexplotación directa (análisis OLAP.) o para su
análisis y conversión en conocimiento soporte aanálisis y conversión en conocimiento soporte a
la toma de decisiones sobre el negocio.la toma de decisiones sobre el negocio.
41. BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
COMPONENTES DE BICOMPONENTES DE BI
Diseño conceptual de los sistemasDiseño conceptual de los sistemas. Para. Para
resolver el diseño de un modelo BI, se debenresolver el diseño de un modelo BI, se deben
contestar a tres preguntas básicas:contestar a tres preguntas básicas: cuál es lacuál es la
información requerida para gestionar y tomarinformación requerida para gestionar y tomar
decisiones; cuál debe ser el formato ydecisiones; cuál debe ser el formato y
composición de los datos a utilizar; y decomposición de los datos a utilizar; y de
dónde proceden esos datos y cuál es ladónde proceden esos datos y cuál es la
disponibilidad y periodicidad requeridadisponibilidad y periodicidad requerida..
42. BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
Herramientas de explotación de laHerramientas de explotación de la
informacióninformación::
es el área donde más avances se han producido en loses el área donde más avances se han producido en los
últimos años. Sin embargo, la proliferación deúltimos años. Sin embargo, la proliferación de
solucionessoluciones y su aplicación coyuntural para solucionary su aplicación coyuntural para solucionar
aspectos puntuales ha llevado, en ocasiones, a unaaspectos puntuales ha llevado, en ocasiones, a una
situación de desánimo en la organización respecto asituación de desánimo en la organización respecto a
los beneficios de una solución BI.los beneficios de una solución BI.
Query & reportingQuery & reporting::
herramientas para la elaboración de informes yherramientas para la elaboración de informes y
listados, tanto en detalle sobre información agregada, alistados, tanto en detalle sobre información agregada, a
partir de la información de los datawarehousespartir de la información de los datawarehouses
43. BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
OLAPOLAP ((on-line analytical processingon-line analytical processing):):
herramientas que manejan interrogacionesherramientas que manejan interrogaciones
complejas de bases de datos relacionales,complejas de bases de datos relacionales,
proporcionando un acceso multidimensional aproporcionando un acceso multidimensional a
los datos, capacidades intensivas de cálculo ylos datos, capacidades intensivas de cálculo y
técnicas de indexación especializadas.técnicas de indexación especializadas.
Permiten a los usuarios trocear sus datosPermiten a los usuarios trocear sus datos
planteando queries sobre diferentes atributosplanteando queries sobre diferentes atributos
o ejes.o ejes.
44. BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
BENEFICIOS:BENEFICIOS:
Cualitativamente, los beneficios se derivan,Cualitativamente, los beneficios se derivan,
obviamente, del incremento de la eficiencia enobviamente, del incremento de la eficiencia en
el proceso de toma de decisiones: mayorel proceso de toma de decisiones: mayor
información, de mejor calidad, más fiable,información, de mejor calidad, más fiable,
compartida por toda la organización, menorescompartida por toda la organización, menores
tiempos de respuesta en su obtención, mejoratiempos de respuesta en su obtención, mejora
de la comunicación en la empresa y creaciónde la comunicación en la empresa y creación
de un lenguaje homogéneo.de un lenguaje homogéneo.