SlideShare ist ein Scribd-Unternehmen logo
1 von 55
Downloaden Sie, um offline zu lesen
MAESTRIA EN TECNOLOGIAS DE INFORMACIÓN
                    TECNOLOGÍAS DE LA INFORMACIÓN EN LAS ORGANIZACIONES
                                   MTI. ROSA IMELDA GARCÍA CHI




UNIDAD 4. TECNOLOGÍA DE BASE DE DATOS
MTI. ROSY CHI




Temas de la Unidad 4
MTI. ROSY CHI




                  UNIDAD 4. TECNOLOGIA DE BASE DE DATOS




Concepto de BASE DE DATOS
MTI. ROSY CHI


BASE DE DATOS - Concepto


Una base de datos o banco de datos es un
conjunto de datos pertenecientes a un mismo
contexto y almacenados sistemáticamente
para su posterior uso.

En este sentido, una biblioteca puede
considerarse una base de datos compuesta en
su mayoría por documentos y textos impresos
en papel e indexados para su consulta.
MTI. ROSY CHI


BASE DE DATOS - Concepto




Actualmente, y debido al desarrollo tecnológico de campos como la
informática y la electrónica,

la mayoría de las bases de datos están en formato digital
(electrónico), y por ende se ha desarrollado y se ofrece un amplio rango
de soluciones al problema del almacenamiento de datos.
MTI. ROSY CHI


Sistemas Gestores de Bases de Datos


              Existen programas denominados sistemas
                gestores de bases de datos, abreviado
                   SGBD, que permiten almacenar y
               posteriormente acceder a los datos de
                     forma rápida y estructurada.


               Las propiedades de estos SGBD, así como
              su utilización y administración, se estudian
                 dentro del ámbito de la informática.
MTI. ROSY CHI




Tipos de base de datos
MTI. ROSY CHI


Tipos de base de datos




  Las bases • de acuerdo al contexto
  de datos    que se esté manejando,
   pueden • la utilidad de las mismas
 clasificarse o
  de varias • las necesidades que
  maneras,    satisfagan.
MTI. ROSY CHI



Tipos de Base de Datos




      Según la
     variabilidad         Según el
     de los datos        contenido
    almacenados
MTI. ROSY CHI


Según la variabilidad de los datos almacenados


                     Bases de datos estáticas
  Son bases de datos de sólo lectura, utilizadas primordialmente para almacenar datos históricos que
 posteriormente se pueden utilizar para estudiar el comportamiento de un conjunto de datos a través
    del tiempo, realizar proyecciones, tomar decisiones y realizar análisis de datos para inteligencia
                                              empresarial.




                   Bases de datos dinámicas
  Éstas son bases de datos donde la información almacenada se modifica con el tiempo, permitiendo
operaciones como actualización, borrado y adición de datos, además de las operaciones fundamentales
 de consulta. Un ejemplo de esto puede ser la base de datos utilizada en un sistema de información de
                    un supermercado, una farmacia, un videoclub o una empresa.
MTI. ROSY CHI


Según el contenido


                   Bases de datos bibliográficas
 Sólo contienen un subrogante (representante) de la fuente primaria, que permite localizarla. Un registro típico de una base de
    datos bibliográfica contiene información sobre el autor, fecha de publicación, editorial, título, edición, de una determinada
    publicación, etc. Puede contener un resumen o extracto de la publicación original, pero nunca el texto completo, porque si
no, estaríamos en presencia de una base de datos a texto completo (o de fuentes primarias —ver más abajo). Como su nombre lo
    indica, el contenido son cifras o números. Por ejemplo, una colección de resultados de análisis de laboratorio, entre otras.




           Bases de datos de texto completo
   Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas las ediciones de una colección de revistas
                                                        científicas.
MTI. ROSY CHI


Según el contenido


                                Directorios

           Un ejemplo son las guías telefónicas en formato electrónico.




     Bases de datos o "bibliotecas" de información
                  química o biológica
Son bases de datos que almacenan diferentes tipos de información proveniente de la
                     química, las ciencias de la vida o médicas
MTI. ROSY CHI


Según el contenido


            Se pueden considerar en varios subtipos:

            Las que almacenan secuencias de nucleótidos o proteínas.


            Las bases de datos de rutas metabólicas.


            Bases de datos de estructura, comprende los registros de datos
            experimentales sobre estructuras 3D de biomoléculas


            Bases de datos clínicas.


            Bases de datos bibliográficas (biológicas, químicas, médicas y de
            otros campos)
MTI. ROSY CHI




Modelos de bases de datos
MTI. ROSY CHI


Modelos de bases de datos




  Además de la clasificación por la función de las
 bases de datos, éstas también se pueden clasificar
de acuerdo a su modelo de administración de datos.
MTI. ROSY CHI


….Modelo de Base de Datos

 Un modelo de datos es básicamente
 una "descripción" de algo conocido
 como contenedor de datos (algo en
 donde se guarda la información), así
como de los métodos para almacenar
   y recuperar información de esos
           contenedores.




                                          Los modelos de datos no son cosas
                                            físicas: son abstracciones que
                                          permiten la implementación de un
                                         sistema eficiente de base de datos;
                                              por lo general se refieren a
                                        algoritmos, y conceptos matemáticos.
MTI. ROSY CHI
Algunos modelos con frecuencia utilizados en las
bases de datos:



           Bases de datos jerárquicas                               Base de datos de red

• En este modelo los datos se organizan en forma      • Éste es un modelo ligeramente distinto del
  de árbol invertido (algunos dicen raíz), en donde     jerárquico; su diferencia fundamental es la
  un nodo padre de información puede tener              modificación del concepto de nodo: se permite
  varios hijos. El nodo que no tiene padres es          que un mismo nodo tenga varios padres
  llamado raíz, y a los nodos que no tienen hijos       (posibilidad no permitida en el modelo
  se los conoce como hojas.                             jerárquico).
• Las bases de datos jerárquicas son                  • Fue una gran mejora con respecto al modelo
  especialmente útiles en el caso de aplicaciones       jerárquico, ya que ofrecía una solución eficiente
  que manejan un gran volumen de información y          al problema de redundancia de datos; pero, aún
  datos muy compartidos permitiendo crear               así, la dificultad que significa administrar la
  estructuras estables y de gran rendimiento.           información en una base de datos de red ha
• Una de las principales limitaciones de este           significado que sea un modelo utilizado en su
  modelo es su incapacidad de representar               mayoría por programadores más que por
  eficientemente la redundancia de datos.               usuarios finales.
MTI. ROSY CHI
Algunos modelos con frecuencia utilizados en las
bases de datos:
                                                                               Bases de datos relacionales
             Bases de datos transaccionales
                                                              • Éste es el modelo utilizado en la actualidad para modelar
• Son bases de datos cuyo único fin es el envío y               problemas reales y administrar datos dinámicamente. Tras
  recepción de datos a grandes velocidades, estas bases         ser postulados sus fundamentos en 1970 por Edgar Frank
  son muy poco comunes y están dirigidas por lo general         Codd, de los laboratorios IBM en San José (California), no
                                                                tardó en consolidarse como un nuevo paradigma en los
  al entorno de análisis de calidad, datos de producción e      modelos de base de datos. Su idea fundamental es el uso de
  industrial, es importante entender que su fin único es        "relaciones".
  recolectar y recuperar los datos a la mayor velocidad       • Estas relaciones podrían considerarse en forma lógica como
  posible, por lo tanto la redundancia y duplicación de         conjuntos de datos llamados "tuplas". Pese a que ésta es la
  información no es un problema como con las demás              teoría de las bases de datos relacionales creadas por
  bases de datos, por lo general para poderlas aprovechar       Codd, la mayoría de las veces se conceptualiza de una
  al máximo permiten algún tipo de conectividad a bases         manera más fácil de imaginar. Esto es pensando en cada
  de datos relacionales.                                        relación como si fuese una tabla que está compuesta por
• Un ejemplo habitual de transacción es el traspaso de          registros (las filas de una tabla), que representarían las
  una cantidad de dinero entre cuentas bancarias.               tuplas, y campos (las columnas de una tabla).
  Normalmente se realiza mediante dos operaciones             • En este modelo, el lugar y la forma en que se almacenen los
  distintas, una en la que se decrementa el saldo de la         datos no tienen relevancia (a diferencia de otros modelos
  cuenta origen y otra en la que incrementamos el saldo         como el jerárquico y el de red). Esto tiene la considerable
                                                                ventaja de que es más fácil de entender y de utilizar para un
  de la cuenta destino.
                                                                usuario esporádico de la base de datos. La información
• Para garantizar la atomicidad del sistema (es decir, para     puede ser recuperada o almacenada mediante "consultas"
  que no aparezca o desaparezca dinero), las dos                que ofrecen una amplia flexibilidad y poder para administrar
  operaciones deben ser atómicas, es decir, el sistema          la información.
  debe garantizar que, bajo cualquier circunstancia           • El lenguaje más habitual para construir las consultas a bases
  (incluso una caída del sistema), el resultado final es        de datos relacionales es SQL, Structured Query Language o
  que, o bien se han realizado las dos operaciones, o bien      Lenguaje Estructurado de Consultas, un estándar
  no se ha realizado ninguna.                                   implementado por los principales motores o sistemas de
                                                                gestión de bases de datos relacionales.
MTI. ROSY CHI
Algunos modelos con frecuencia utilizados en las
bases de datos:

                                                            Bases de datos orientadas a objetos
    Bases de datos multidimensionales         • Este modelo, bastante reciente, y propio de los modelos
                                                informáticos orientados a objetos, trata de almacenar en la
                                                base de datos los objetos completos (estado y
• Son bases de datos ideadas para               comportamiento).
  desarrollar aplicaciones muy                • Una base de datos orientada a objetos es una base de datos
  concretas, como creación de Cubos             que incorpora todos los conceptos importantes del
                                                paradigma de objetos:
  OLAP.                                       • Encapsulación - Propiedad que permite ocultar la
• Básicamente no se diferencian                 información al resto de los objetos, impidiendo así accesos
                                                incorrectos o conflictos.
  demasiado de las bases de datos             • Herencia - Propiedad a través de la cual los objetos heredan
  relacionales (una tabla en una base de        comportamiento dentro de una jerarquía de clases.
  datos relacional podría serlo también en    • Polimorfismo - Propiedad de una operación mediante la cual
                                                puede ser aplicada a distintos tipos de objetos.
  una base de datos multidimensional), la
                                              • En bases de datos orientadas a objetos, los usuarios pueden
  diferencia está más bien a nivel              definir operaciones sobre los datos como parte de la
  conceptual; en las bases de datos             definición de la base de datos. Una operación (llamada
                                                función) se especifica en dos partes. La interfaz (o signatura)
  multidimensionales los campos o               de una operación incluye el nombre de la operación y los
  atributos de una tabla pueden ser de dos      tipos de datos de sus argumentos (o parámetros). La
  tipos, o bien representan dimensiones de      implementación (o método) de la operación se especifica
                                                separadamente y puede modificarse sin afectar la interfaz.
  la tabla, o bien representan métricas que     Los programas de aplicación de los usuarios pueden operar
  se desean estudiar.                           sobre los datos invocando a dichas operaciones a través de
                                                sus nombres y argumentos, sea cual sea la forma en la que
                                                se han implementado. Esto podría denominarse
                                                independencia entre programas y operaciones.
MTI. ROSY CHI
Algunos modelos con frecuencia utilizados en las
bases de datos:


                                          Bases de datos deductivas
       Bases de datos
       documentales             • Un sistema de base de datos deductiva, es
                                  un sistema de base de datos pero con la
                                  diferencia de que permite hacer
• Permiten la indexación a        deducciones a través de inferencias.
                                • Se basa principalmente en reglas y hechos
  texto completo, y en            que son almacenados en la base de datos.
  líneas generales realizar     • Las bases de datos deductivas son también
                                  llamadas bases de datos lógicas, a raíz de
  búsquedas más potentes.         que se basa en lógica matemática.
  Tesaurus es un sistema de     • Este tipo de base de datos surge debido a
                                  las limitaciones de la Base de Datos
  índices optimizado para         Relacional de responder a consultas
  este tipo de bases de           recursivas y de deducir relaciones indirectas
                                  de los datos almacenados en la base de
  datos.                          datos.
MTI. ROSY CHI




BASE DE DATOS PERSONALES




            TECNOLOGIA DE BASE DE DATOS
MTI. ROSY CHI


BASE DE DATOS PERSONALES



                    Son colecciones de datos que
                       integran información de
                 personas, tales como su nombre, su
                   RFC, su dirección, su teléfono, su
                  estado civil, su correo, entre otras.




                 Estas Bases de Datos se encuentran
                 y deben estar protegidas por la Ley
                 de Datos Personales para que no se
                        haga mal uso de ellas
MTI. ROSY CHI




BASE DE DATOS CORPORATIVAS




            TECNOLOGIA DE BASE DE DATOS
MTI. ROSY CHI


BASE DE DATOS CORPORATIVAS




                                                                                          Con estas bases de datos, las
  Son colecciones de datos que la             Estas colecciones involucran a
                                                                                        organizaciones pueden construir
empresa integra en diferentes bases de   clientes, proveedores, productos, entre
                                                                                   sistemas de información para la toma de
                datos.                                    otros.
                                                                                                decisiones o ERP
MTI. ROSY CHI
MTI. ROSY CHI




DATAWAREHOUSE




           TECNOLOGIA DE BASE DE DATOS
MTI. ROSY CHI




   Datawarehouse o Almacén de Datos
En el contexto de la informática, un almacén de datos (del inglés data warehouse) es una
colección de datos orientada a un determinado ámbito
(empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma
de decisiones en la entidad en la que se utiliza.

Se trata, sobre todo, de un expediente completo de una organización, más allá de la información
transaccional y operacional, almacenado en una base de datos diseñada para favorecer el
análisis y la divulgación eficiente de datos (especialmente OLAP, procesamiento analítico en
línea).



El almacenamiento de los datos no debe usarse con datos de uso actual.



Los almacenes de datos contienen a menudo grandes cantidades de información que se
subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de la entidad
del que procedan o para el que sean necesario.
MTI. ROSY CHI


Características de un Data Warehouse


1. Orientado a temas
 • Orientado a los temas principales de la organización. La información se clasifica en
   función de los aspectos que son de interés para la organización.
 • Se organizan por temas para facilitar el acceso y el entendimiento por parte de los
   usuarios finales.
 • Por ejemplo, tenemos información que proviene de los datos operacionales de
   distintas áreas como son: prestamos, ahorros, nóminas y créditos. Pues los temas
   que nos pueden interesar son: clientes, productos, vendedores y actividad.

2. Integrado
 • En un sistema operacional no hay integración, pero en un Data Warehouse todos
   los datos se encuentran integrados.
 • Esta integración se muestra de diferentes maneras: consistencia en codificación
   de estructuras, en unidades de medida de las variables, en múltiples fuentes, en
   convenciones de nombres, en atributos físicos de los datos etc…
MTI. ROSY CHI


…Características de un Data Warehouse


3. Variante en el tiempo
 • En los sistemas operacionales, los datos siempre reflejan el estado de la actividad
   del negocio en el momento presente, por el contrario, la información almacenada
   en el Data Warehouse refleja un histórico de los datos en un horizonte de tiempo
   mucho más amplio (del orden de años). De esta forma podemos detectar
   tendencias en el tiempo.

4. No volátil
 • El Data Warehouse existe para ser leído y no para ser modificado, la información
   es por tanto permanente, la actualización del Data Warehouse significa la
   incorporación de los últimos valores que tomaron las distintas variables
   contenidas en él, sin ningún tipo de acción sobre lo que ya existía.
 • Los datos más recientes no sustituyen a los precedentes, sino que suelen
   mantenerse con un mayor nivel de detalle. Por ejemplo: en el año actual se
   guardarían las ventas diarias de los diferentes artículos, mientras que los datos
   anteriores se mantendrían accesibles de manera agregada.
MTI. ROSY CHI
MTI. ROSY CHI




DATAMART




           TECNOLOGIA DE BASE DE DATOS
MTI. ROSY CHI


Data marts




       Los Data marts son subconjuntos
        de datos de un data warehouse
            para áreas específicas.
MTI. ROSY CHI


Data marts




                                          Tiene una
                            Tiene un      función de
                            propósito     apoyo.
              Área
              específica.   específico.
 Usuarios
 limitados.
MTI. ROSY CHI




CUBOS DE INFORMACIÓN




                       UNIDAD 4.
MTI. ROSY CHI


Cubos de información


Los cubos de información o cubos OLAP funcionan como los cubos de rompecabezas en los
juegos, en el juego se trata de armar los colores y en el data warehouse se trata de
organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3
dimensiones, los cubos OLAP tienen un número indefinido de dimensiones, razón por la
cual también reciben el nombre de hipercubos.


Un cubo OLAP contendrá datos de una determinada variable que se desea
analizar, proporcionando una vista lógica de los datos provistos por el sistema de
información hacia el data warehouse, esta vista estará dispuesta según unas dimensiones y
podrá contener información calculada.



El análisis de los datos está basado en las dimensiones del hipercubo, por lo tanto, se trata
de un análisis multidimensional.
MTI. ROSY CHI

Cubos de información
MTI. ROSY CHI


VARIABLES Y DIMENSIONES



A la información de un cubo puede acceder el ejecutivo mediante "tablas dinámicas" en
una hoja de cálculo o a través de programas personalizados.


Las tablas dinámicas le permiten manipular las vistas
(cruces, filtrados, organización, totales) de la información con mucha facilidad.


Las diferentes operaciones que se pueden realizar con cubos de información se producen
con mucha rapidez.

Llevando estos conceptos a un data warehouse, éste es una colección de datos que está
formada por «dimensiones» y «variables», entendiendo como dimensiones a aquellos
elementos que participan en el análisis y variables a los valores que se desean analizar.
MTI. ROSY CHI


Dimensiones




                                                    Son catálogos de información
Las dimensiones de un cubo son atributos         complementaria necesaria para la
                                                                                          Es decir, la información general
      relativos a las variables, son las           presentación de los datos a los
                                                                                         complementaria a cada uno de los
  perspectivas de análisis de las variables         usuarios, como por ejemplo:
                                                                                          registros de la tabla de hechos.
(forman parte de la tabla de dimensiones).    descripciones, nombres, zonas, rangos de
                                                             tiempo, etc.
MTI. ROSY CHI


Variables

También llamadas “indicadores de gestión”, son los datos que están siendo analizados.



Forman parte de la tabla de hechos.



Más formalmente, las variables representan algún aspecto cuantificable o medible de los objetos o eventos a
analizar.


Normalmente, las variables son representadas por valores detallados y numéricos para cada instancia del
objeto o evento medido.


En forma contraria, las dimensiones son atributos relativos a las variables, y son utilizadas para
indexar, ordenar, agrupar o abreviar los valores de las mismas.

Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que
el de las variables; ejemplos de dimensiones podrían ser: “productos”, “localidades” (o zonas), “el tiempo”
(medido en días, horas, semanas, etc.), ...
MTI. ROSY CHI
Ejemplos


Ejemplos de variables podrían ser:
 •   Beneficios
 •   Gastos
 •   Ventas
 •   etc.
Ejemplos de dimensiones podrían ser:
 • producto (diferentes tipos o denominaciones de productos)
 • localidades (o provincia, o regiones, o zonas geográficas)
 • tiempo (medido de diferentes maneras, por horas, por días, por
   meses, por años, ...)
 • tipo de cliente (casado/soltero, joven/adulto/anciano, ...)
 • etc.
MTI. ROSY CHI




DATAMINING




             TECNOLOGIA DE BASE DE DATOS
MTI. ROSY CHI


Data Mining o Minería de Datos


 es un campo de las ciencias de la
 computación referido al proceso que intenta
 descubrir patrones en grandes volúmenes de
 conjuntos de datos.


 Utiliza los métodos de la inteligencia
 artificial, aprendizaje automático, estadística
 y sistemas de bases de datos.
MTI. ROSY CHI


Data Mining o Minería de Datos



El objetivo general del proceso de minería de datos consiste en
extraer información de un conjunto de datos y transformarla en
una estructura comprensible para su uso posterior.



Además de la etapa de análisis en bruto, que involucra aspectos
de bases de datos y gestión de datos, procesamiento de datos, el
modelo y las consideraciones de inferencia, métricas de
Intereses, consideraciones de la Teoría de la complejidad
computacional, post-procesamiento de las estructuras
descubiertas, la visualización y actualización en línea.
MTI. ROSY CHI


…Data Mining




       El término es una palabra de moda, y es
                                                      pero también se ha generalizado a cualquier tipo
    frecuentemente mal utilizado para referirse a
                                                               de sistema de apoyo informático
       cualquier forma de datos a gran escala o
                                                        decisión, incluyendo la inteligencia artificial
           procesamiento de la información
                                                          , aprendizaje automático y la inteligencia
 (recolección, extracción, almacenamiento, análisis
                                                                         empresarial.
                    y estadísticas),
MTI. ROSY CHI




Un proceso típico de minería de datos consta de
        los siguientes pasos generales:

1.Selección del conjunto de datos, tanto en lo que se refiere a las variables
objetivo (aquellas que se quiere predecir, calcular o inferir), como a las variables
independientes (las que sirven para hacer el cálculo o proceso), como
posiblemente al muestreo de los registros disponibles.


2.Análisis de las propiedades de los datos, en especial los histogramas, diagramas
de dispersión, presencia de valores atípicos y ausencia de datos (valores nulos).


3.Transformación del conjunto de datos de entrada, se realizará de diversas
formas en función del análisis previo, con el objetivo de prepararlo para aplicar la
técnica de minería de datos que mejor se adapte a los datos y al problema, a este
paso también se le conoce como preprocesamiento de los datos.
MTI. ROSY CHI




        …proceso típico de minería de datos


4.Seleccionar y aplicar la técnica de minería de datos, se construye el modelo predictivo, de
clasificación o segmentación.



5.Extracción de conocimiento, mediante una técnica de minería de datos, se obtiene un modelo de
conocimiento, que representa patrones de comportamiento observados en los valores de las variables
del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas
a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un preprocesado
diferente de los datos.

6.Interpretación y evaluación de datos, una vez obtenido el modelo, se debe proceder a su validación
comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. En el caso
de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los
modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los
resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos.
MTI. ROSY CHI




PROTOCOLO DE UN
PROYECTO DE
MINERÍA DE DATOS



         Unidad 4. Tecnología de Base de Datos
MTI. ROSY CHI
Un proyecto de minería de datos tiene varias fases
necesarias que son, esencialmente:



 Comprensión del negocio y del
 problema que se quiere
 resolver.                       Validación, comunicación, etc.
                                 de los resultados obtenidos.
 Determinación, obtención y
 limpieza de los datos
 necesarios.                     Integración, si procede, de los
                                 resultados en un sistema
 Creación de modelos             transaccional o similar.
 matemáticos.
MTI. ROSY CHI




Técnicas de minería de datos
MTI. ROSY CHI


Las técnicas más representativas son:


Redes neuronales

Regresión lineal

Árboles de decisión

Modelos estadísticos

Agrupamiento o Clustering

Reglas de asociación
MTI. ROSY CHI


Las técnicas más representativas son:


Redes neuronales.- Son un paradigma de aprendizaje y
procesamiento automático inspirado en la forma en que funciona el
sistema nervioso de los animales. Se trata de un sistema de
interconexión de neuronas en una red que colabora para producir un
estímulo de salida. Algunos ejemplos de red neuronal son:
 • El Perceptrón
 • El Perceptrón multicapa
 • Los Mapas Autoorganizados, también conocidos como redes de Kohonen.


Regresión lineal.- Es la más utilizada para formar relaciones entre
datos. Rápida y eficaz pero insuficiente en espacios
multidimensionales donde puedan relacionarse más de 2 variables.
MTI. ROSY CHI


Las técnicas más representativas son:


Árboles de decisión.- Un árbol de decisión es un modelo de predicción
utilizado en el ámbito de la inteligencia artificial, dada una base de datos se
construyen estos diagramas de construcciones lógicas, muy similares a los
sistemas de predicción basados en reglas, que sirven para representar y
categorizar una serie de condiciones que suceden de forma sucesiva, para la
resolución de un problema. Ejemplos:
 • Algoritmo ID3
 • Algoritmo C4.5


Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o
ecuación que se emplea en todos los diseños experimentales y en la
regresión para indicar los diferentes factores que modifican la variable de
respuesta.
MTI. ROSY CHI


Las técnicas más representativas son:


Agrupamiento o Clustering.- Es un procedimiento de
agrupación de una serie de vectores según criterios
habitualmente de distancia; se tratará de disponer los vectores
de entrada de forma que estén más cercanos aquellos que
tengan características comunes. Ejemplos:
 • Algoritmo K-means
 • Algoritmo K-medoids


Reglas de asociación.- Se utilizan para descubrir hechos que
ocurren en común dentro de un determinado conjunto de
datos.
MTI. ROSY CHI




EJEMPLOS DE USO DE LA MINERÍA
DE DATOS
MTI. ROSY CHI


Ejemplos de uso de la minería de datos

                                      Negocios
                        Análisis de                  Hábitos de
                          gases                      compra en
                                                   supermercados

           Ingeniería                                       Patrones de
            eléctrica                                           fuga




        Genética                                                   Fraudes




            Ciencia e                                        Recursos
           Ingeniería                                        humanos


                                                   Comportamiento
                          Juegos
                                                     en Internet
                                      Terrorismo

Weitere ähnliche Inhalte

Was ist angesagt?

Diseño logico de una base de datos
Diseño logico de  una base de datosDiseño logico de  una base de datos
Diseño logico de una base de datosRobert Rodriguez
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSEnestor
 
Diapositivas base de datos
Diapositivas base de datosDiapositivas base de datos
Diapositivas base de datoscatherine4ad
 
diapositivas de informática BASE DE DATOS
diapositivas de informática BASE DE DATOSdiapositivas de informática BASE DE DATOS
diapositivas de informática BASE DE DATOSDayanaperezflorez
 
Acceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidorAcceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidorJomicast
 
Pertemuan 10 (database client-server)
Pertemuan 10 (database client-server)Pertemuan 10 (database client-server)
Pertemuan 10 (database client-server)Rifky A Ayub
 
Diapositivas de base de datos
Diapositivas de base de datosDiapositivas de base de datos
Diapositivas de base de datosestibenzon
 
SO - Administración de Memoria
SO - Administración de MemoriaSO - Administración de Memoria
SO - Administración de MemoriaLuis Eraso
 
Usuarios y administrador de bases de datos
Usuarios y administrador de bases de datosUsuarios y administrador de bases de datos
Usuarios y administrador de bases de datosMaria Garcia
 
Unidad 1. Fundamentos de Base de Datos
Unidad 1. Fundamentos de Base de DatosUnidad 1. Fundamentos de Base de Datos
Unidad 1. Fundamentos de Base de Datoshugodanielgd
 
Base de datos
Base de datosBase de datos
Base de datosDavid
 
Diapositivas sobre BD (Base de Datos)
Diapositivas sobre BD (Base de Datos)Diapositivas sobre BD (Base de Datos)
Diapositivas sobre BD (Base de Datos)angeljlp08
 
Sistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datosSistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datosJesús Tramullas
 
Clasificación y modelos de bases de datos
Clasificación y modelos de bases de datosClasificación y modelos de bases de datos
Clasificación y modelos de bases de datosastrid2014
 

Was ist angesagt? (20)

Diseño logico de una base de datos
Diseño logico de  una base de datosDiseño logico de  una base de datos
Diseño logico de una base de datos
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSE
 
SQLite
SQLiteSQLite
SQLite
 
Diapositivas base de datos
Diapositivas base de datosDiapositivas base de datos
Diapositivas base de datos
 
diapositivas de informática BASE DE DATOS
diapositivas de informática BASE DE DATOSdiapositivas de informática BASE DE DATOS
diapositivas de informática BASE DE DATOS
 
Acceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidorAcceso a datos en aplicaciones web del entorno servidor
Acceso a datos en aplicaciones web del entorno servidor
 
Pertemuan 10 (database client-server)
Pertemuan 10 (database client-server)Pertemuan 10 (database client-server)
Pertemuan 10 (database client-server)
 
Diapositivas de base de datos
Diapositivas de base de datosDiapositivas de base de datos
Diapositivas de base de datos
 
Diseño de bases de datos
Diseño de bases de datosDiseño de bases de datos
Diseño de bases de datos
 
Bd nosql clave valor
Bd nosql clave valorBd nosql clave valor
Bd nosql clave valor
 
Hypertable ld
Hypertable ldHypertable ld
Hypertable ld
 
SO - Administración de Memoria
SO - Administración de MemoriaSO - Administración de Memoria
SO - Administración de Memoria
 
Usuarios y administrador de bases de datos
Usuarios y administrador de bases de datosUsuarios y administrador de bases de datos
Usuarios y administrador de bases de datos
 
Unidad 1. Fundamentos de Base de Datos
Unidad 1. Fundamentos de Base de DatosUnidad 1. Fundamentos de Base de Datos
Unidad 1. Fundamentos de Base de Datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Diapositivas sobre BD (Base de Datos)
Diapositivas sobre BD (Base de Datos)Diapositivas sobre BD (Base de Datos)
Diapositivas sobre BD (Base de Datos)
 
Jawaban Struktur data soal-latihan
Jawaban Struktur data soal-latihanJawaban Struktur data soal-latihan
Jawaban Struktur data soal-latihan
 
Sistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datosSistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datos
 
Base de datos ppt
Base de datos pptBase de datos ppt
Base de datos ppt
 
Clasificación y modelos de bases de datos
Clasificación y modelos de bases de datosClasificación y modelos de bases de datos
Clasificación y modelos de bases de datos
 

Andere mochten auch

Lineamientos para la búsqueda de información tecnológica en bases de datos de...
Lineamientos para la búsqueda de información tecnológica en bases de datos de...Lineamientos para la búsqueda de información tecnológica en bases de datos de...
Lineamientos para la búsqueda de información tecnológica en bases de datos de...Pablo Paz
 
aparatos electronicos
aparatos electronicosaparatos electronicos
aparatos electronicosagarridosd
 
Historia de la tecnologia de base de datos
Historia de la tecnologia de base de datosHistoria de la tecnologia de base de datos
Historia de la tecnologia de base de datosralbarracin
 
Modulo 11 evaluacion curricular i
Modulo 11   evaluacion curricular iModulo 11   evaluacion curricular i
Modulo 11 evaluacion curricular iSaúl Qc
 
Dcbn ingles 2010
Dcbn ingles 2010Dcbn ingles 2010
Dcbn ingles 2010Angel Duran
 
Fase 2 modelado del análisis de i web
Fase 2 modelado del análisis de i webFase 2 modelado del análisis de i web
Fase 2 modelado del análisis de i webROSA IMELDA GARCIA CHI
 
Normalizacion presentacion 1
Normalizacion presentacion 1Normalizacion presentacion 1
Normalizacion presentacion 1COLMILLO31
 
Unidad 3. tecnología de software metodologias de desarrollo de software
Unidad 3. tecnología de software metodologias de desarrollo de softwareUnidad 3. tecnología de software metodologias de desarrollo de software
Unidad 3. tecnología de software metodologias de desarrollo de softwareROSA IMELDA GARCIA CHI
 
Busquedas en bases de datos de patentes taller ompi inpi nov 2011
Busquedas en bases de datos de patentes taller ompi inpi nov 2011Busquedas en bases de datos de patentes taller ompi inpi nov 2011
Busquedas en bases de datos de patentes taller ompi inpi nov 2011Pablo Paz
 

Andere mochten auch (20)

Base de datos
Base de datosBase de datos
Base de datos
 
Caso de estudio 1 tio
Caso de estudio 1 tioCaso de estudio 1 tio
Caso de estudio 1 tio
 
Unidad 5. tecnología de redes
Unidad 5. tecnología de redesUnidad 5. tecnología de redes
Unidad 5. tecnología de redes
 
Lineamientos para la búsqueda de información tecnológica en bases de datos de...
Lineamientos para la búsqueda de información tecnológica en bases de datos de...Lineamientos para la búsqueda de información tecnológica en bases de datos de...
Lineamientos para la búsqueda de información tecnológica en bases de datos de...
 
aparatos electronicos
aparatos electronicosaparatos electronicos
aparatos electronicos
 
bombillo
bombillo bombillo
bombillo
 
Historia de la tecnologia de base de datos
Historia de la tecnologia de base de datosHistoria de la tecnologia de base de datos
Historia de la tecnologia de base de datos
 
Formato proyecto i web fase 2
Formato proyecto i web fase 2Formato proyecto i web fase 2
Formato proyecto i web fase 2
 
Formato proyecto i web fase 1
Formato proyecto i web fase 1Formato proyecto i web fase 1
Formato proyecto i web fase 1
 
Formato proyecto i web fase 3
Formato proyecto i web fase 3Formato proyecto i web fase 3
Formato proyecto i web fase 3
 
Fase 3 modelado del diseño de iweb
Fase 3 modelado del diseño de iwebFase 3 modelado del diseño de iweb
Fase 3 modelado del diseño de iweb
 
Modulo 11 evaluacion curricular i
Modulo 11   evaluacion curricular iModulo 11   evaluacion curricular i
Modulo 11 evaluacion curricular i
 
Dcbn ingles 2010
Dcbn ingles 2010Dcbn ingles 2010
Dcbn ingles 2010
 
Fase 2 modelado del análisis de i web
Fase 2 modelado del análisis de i webFase 2 modelado del análisis de i web
Fase 2 modelado del análisis de i web
 
NORMALIZACION
NORMALIZACIONNORMALIZACION
NORMALIZACION
 
Normalizacion presentacion 1
Normalizacion presentacion 1Normalizacion presentacion 1
Normalizacion presentacion 1
 
Normalización
NormalizaciónNormalización
Normalización
 
Introduccion de un producto
Introduccion de un productoIntroduccion de un producto
Introduccion de un producto
 
Unidad 3. tecnología de software metodologias de desarrollo de software
Unidad 3. tecnología de software metodologias de desarrollo de softwareUnidad 3. tecnología de software metodologias de desarrollo de software
Unidad 3. tecnología de software metodologias de desarrollo de software
 
Busquedas en bases de datos de patentes taller ompi inpi nov 2011
Busquedas en bases de datos de patentes taller ompi inpi nov 2011Busquedas en bases de datos de patentes taller ompi inpi nov 2011
Busquedas en bases de datos de patentes taller ompi inpi nov 2011
 

Ähnlich wie Unidad 4. tecnología de base de datos

Ähnlich wie Unidad 4. tecnología de base de datos (20)

Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Pris
PrisPris
Pris
 
Pris
PrisPris
Pris
 
Pris
PrisPris
Pris
 
Base de datos
Base de datosBase de datos
Base de datos
 
Base de Datos - Wikilibro
Base de Datos - WikilibroBase de Datos - Wikilibro
Base de Datos - Wikilibro
 
Las bases de datos
Las bases de datosLas bases de datos
Las bases de datos
 
Base de datos 5
Base de datos 5Base de datos 5
Base de datos 5
 
Generalidades bases de datos
Generalidades bases de datosGeneralidades bases de datos
Generalidades bases de datos
 
Base de datos(quinteros)
Base de datos(quinteros)Base de datos(quinteros)
Base de datos(quinteros)
 
Base de datos
Base de datosBase de datos
Base de datos
 
Presentación
PresentaciónPresentación
Presentación
 
Base de datos
Base de datosBase de datos
Base de datos
 
Generalidades bases de datos
Generalidades bases de datosGeneralidades bases de datos
Generalidades bases de datos
 
Una base de datos o banco de datos
Una base de datos o banco de datosUna base de datos o banco de datos
Una base de datos o banco de datos
 

Mehr von ROSA IMELDA GARCIA CHI

Tema 1 que es moodle y como ingresar parte 4a
Tema 1 que es moodle y como ingresar parte 4aTema 1 que es moodle y como ingresar parte 4a
Tema 1 que es moodle y como ingresar parte 4aROSA IMELDA GARCIA CHI
 
Tema 1 que es moodle y como ingresar parte 4 b
Tema 1 que es moodle y como ingresar parte 4 bTema 1 que es moodle y como ingresar parte 4 b
Tema 1 que es moodle y como ingresar parte 4 bROSA IMELDA GARCIA CHI
 
Tema 1 que es moodle y como ingresar parte 3b
Tema 1 que es moodle y como ingresar parte 3bTema 1 que es moodle y como ingresar parte 3b
Tema 1 que es moodle y como ingresar parte 3bROSA IMELDA GARCIA CHI
 
Tema 1 que es moodle y como ingresar parte 3a
Tema 1 que es moodle y como ingresar parte 3aTema 1 que es moodle y como ingresar parte 3a
Tema 1 que es moodle y como ingresar parte 3aROSA IMELDA GARCIA CHI
 
Tema 1 que es moodle y como ingresar parte 2b
Tema 1 que es moodle y como ingresar parte 2bTema 1 que es moodle y como ingresar parte 2b
Tema 1 que es moodle y como ingresar parte 2bROSA IMELDA GARCIA CHI
 
Tema 1 que es moodle y como ingresar parte 2a
Tema 1 que es moodle y como ingresar parte 2aTema 1 que es moodle y como ingresar parte 2a
Tema 1 que es moodle y como ingresar parte 2aROSA IMELDA GARCIA CHI
 
Tema 1 que es moodle y como ingresar parte 1b
Tema 1 que es moodle y como ingresar parte 1bTema 1 que es moodle y como ingresar parte 1b
Tema 1 que es moodle y como ingresar parte 1bROSA IMELDA GARCIA CHI
 
Tema 1 que es moodle y como ingresar parte 1a
Tema 1 que es moodle y como ingresar parte 1aTema 1 que es moodle y como ingresar parte 1a
Tema 1 que es moodle y como ingresar parte 1aROSA IMELDA GARCIA CHI
 
Unidad 2. metodologias de desarrollo de software tema1
Unidad 2. metodologias de desarrollo de software tema1Unidad 2. metodologias de desarrollo de software tema1
Unidad 2. metodologias de desarrollo de software tema1ROSA IMELDA GARCIA CHI
 
Sesion 1 3 categorias de investigación
Sesion 1 3 categorias de investigaciónSesion 1 3 categorias de investigación
Sesion 1 3 categorias de investigaciónROSA IMELDA GARCIA CHI
 
Unidad 6 comercialización de la educación
Unidad 6 comercialización de la educaciónUnidad 6 comercialización de la educación
Unidad 6 comercialización de la educaciónROSA IMELDA GARCIA CHI
 
Unidad 5 aspectos eticos de las nuevas tecnologias
Unidad 5 aspectos eticos de las nuevas tecnologiasUnidad 5 aspectos eticos de las nuevas tecnologias
Unidad 5 aspectos eticos de las nuevas tecnologiasROSA IMELDA GARCIA CHI
 

Mehr von ROSA IMELDA GARCIA CHI (20)

El abeto cuento
El abeto cuentoEl abeto cuento
El abeto cuento
 
Tema 1 que es moodle y como ingresar parte 4a
Tema 1 que es moodle y como ingresar parte 4aTema 1 que es moodle y como ingresar parte 4a
Tema 1 que es moodle y como ingresar parte 4a
 
Tema 1 que es moodle y como ingresar parte 4 b
Tema 1 que es moodle y como ingresar parte 4 bTema 1 que es moodle y como ingresar parte 4 b
Tema 1 que es moodle y como ingresar parte 4 b
 
Tema 1 que es moodle y como ingresar parte 3b
Tema 1 que es moodle y como ingresar parte 3bTema 1 que es moodle y como ingresar parte 3b
Tema 1 que es moodle y como ingresar parte 3b
 
Tema 1 que es moodle y como ingresar parte 3a
Tema 1 que es moodle y como ingresar parte 3aTema 1 que es moodle y como ingresar parte 3a
Tema 1 que es moodle y como ingresar parte 3a
 
Tema 1 que es moodle y como ingresar parte 2b
Tema 1 que es moodle y como ingresar parte 2bTema 1 que es moodle y como ingresar parte 2b
Tema 1 que es moodle y como ingresar parte 2b
 
Tema 1 que es moodle y como ingresar parte 2a
Tema 1 que es moodle y como ingresar parte 2aTema 1 que es moodle y como ingresar parte 2a
Tema 1 que es moodle y como ingresar parte 2a
 
Tema 1 que es moodle y como ingresar parte 1b
Tema 1 que es moodle y como ingresar parte 1bTema 1 que es moodle y como ingresar parte 1b
Tema 1 que es moodle y como ingresar parte 1b
 
Tema 1 que es moodle y como ingresar parte 1a
Tema 1 que es moodle y como ingresar parte 1aTema 1 que es moodle y como ingresar parte 1a
Tema 1 que es moodle y como ingresar parte 1a
 
Unidad 2. metodologias de desarrollo de software tema1
Unidad 2. metodologias de desarrollo de software tema1Unidad 2. metodologias de desarrollo de software tema1
Unidad 2. metodologias de desarrollo de software tema1
 
Unidad 2 expresiones regulares
Unidad 2 expresiones regularesUnidad 2 expresiones regulares
Unidad 2 expresiones regulares
 
Sesion 1 3 categorias de investigación
Sesion 1 3 categorias de investigaciónSesion 1 3 categorias de investigación
Sesion 1 3 categorias de investigación
 
Unidad 6 comercialización de la educación
Unidad 6 comercialización de la educaciónUnidad 6 comercialización de la educación
Unidad 6 comercialización de la educación
 
Ejemplo para j cross
Ejemplo para j crossEjemplo para j cross
Ejemplo para j cross
 
Educacion para el siglo xxi
Educacion para el siglo xxiEducacion para el siglo xxi
Educacion para el siglo xxi
 
Unidad 5 aspectos eticos de las nuevas tecnologias
Unidad 5 aspectos eticos de las nuevas tecnologiasUnidad 5 aspectos eticos de las nuevas tecnologias
Unidad 5 aspectos eticos de las nuevas tecnologias
 
Unidad 4. lectura y escritura
Unidad 4. lectura y escrituraUnidad 4. lectura y escritura
Unidad 4. lectura y escritura
 
Ambientes
AmbientesAmbientes
Ambientes
 
Web quest
Web questWeb quest
Web quest
 
Presentacion nuevas tecnologías
Presentacion nuevas tecnologíasPresentacion nuevas tecnologías
Presentacion nuevas tecnologías
 

Kürzlich hochgeladen

Organizaciones Sociales formales y no formales
Organizaciones Sociales formales y no formalesOrganizaciones Sociales formales y no formales
Organizaciones Sociales formales y no formalesUniversidad del Istmo
 
Presentación del tema: tecnología educativa
Presentación del tema: tecnología educativaPresentación del tema: tecnología educativa
Presentación del tema: tecnología educativaricardoruizaleman
 
PROGRAMACIÓN CURRICULAR ANUAL DE CIENCIA Y TECNOLOGÍA
PROGRAMACIÓN CURRICULAR ANUAL DE CIENCIA Y TECNOLOGÍAPROGRAMACIÓN CURRICULAR ANUAL DE CIENCIA Y TECNOLOGÍA
PROGRAMACIÓN CURRICULAR ANUAL DE CIENCIA Y TECNOLOGÍAJoaqunSolrzano
 
Xardín de San Carlos (A Coruña) IES Monelos
Xardín de San Carlos (A Coruña) IES MonelosXardín de San Carlos (A Coruña) IES Monelos
Xardín de San Carlos (A Coruña) IES MonelosAgrela Elvixeo
 
PSICOLOGÍA. UNA INTRODUCCIÓN. ALCIRA ORSINI Y LETICIA BOSSELLINI 3.pdf
PSICOLOGÍA. UNA INTRODUCCIÓN. ALCIRA ORSINI Y LETICIA BOSSELLINI 3.pdfPSICOLOGÍA. UNA INTRODUCCIÓN. ALCIRA ORSINI Y LETICIA BOSSELLINI 3.pdf
PSICOLOGÍA. UNA INTRODUCCIÓN. ALCIRA ORSINI Y LETICIA BOSSELLINI 3.pdfCarlosAntonio456574
 
Escrito administrativo técnico y comerciales
Escrito administrativo técnico y comercialesEscrito administrativo técnico y comerciales
Escrito administrativo técnico y comercialesmelanieteresacontrer
 
La Gatera de la Villa nº 51. Revista cultural sobre Madrid..
La Gatera de la Villa nº 51. Revista cultural sobre Madrid..La Gatera de la Villa nº 51. Revista cultural sobre Madrid..
La Gatera de la Villa nº 51. Revista cultural sobre Madrid..La Gatera de la Villa
 
Concurso de Innovación Pedagógica T3 FONDEP 2024 Ccesa007.pdf
Concurso de Innovación Pedagógica  T3  FONDEP 2024 Ccesa007.pdfConcurso de Innovación Pedagógica  T3  FONDEP 2024 Ccesa007.pdf
Concurso de Innovación Pedagógica T3 FONDEP 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
CIENCIAS SOCIALES SEGUNDO TRIMESTRE CUARTO
CIENCIAS SOCIALES SEGUNDO TRIMESTRE CUARTOCIENCIAS SOCIALES SEGUNDO TRIMESTRE CUARTO
CIENCIAS SOCIALES SEGUNDO TRIMESTRE CUARTOCEIP TIERRA DE PINARES
 
ficha de aplicacion para estudiantes El agua para niños de primaria
ficha de aplicacion para estudiantes El agua para niños de primariaficha de aplicacion para estudiantes El agua para niños de primaria
ficha de aplicacion para estudiantes El agua para niños de primariamichel carlos Capillo Dominguez
 
EL ECLIPSE DE LA PAZ (cuento literario). Autor y diseñador JAVIER SOLIS NOYOLA
EL ECLIPSE DE LA PAZ (cuento literario). Autor y diseñador JAVIER SOLIS NOYOLAEL ECLIPSE DE LA PAZ (cuento literario). Autor y diseñador JAVIER SOLIS NOYOLA
EL ECLIPSE DE LA PAZ (cuento literario). Autor y diseñador JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
Programación Anual 2024 - CIENCIAS SOCIALES.docx
Programación Anual 2024  - CIENCIAS SOCIALES.docxProgramación Anual 2024  - CIENCIAS SOCIALES.docx
Programación Anual 2024 - CIENCIAS SOCIALES.docxJhordanBenitesSanche1
 
Recursos Tecnológicos, página AIP-CRT 2 0 2 4.pdf
Recursos Tecnológicos, página  AIP-CRT 2 0 2 4.pdfRecursos Tecnológicos, página  AIP-CRT 2 0 2 4.pdf
Recursos Tecnológicos, página AIP-CRT 2 0 2 4.pdfNELLYKATTY
 
GALATAS Y ROMANOS EXAMEN PARA LOS ALUMNO
GALATAS Y ROMANOS EXAMEN PARA LOS ALUMNOGALATAS Y ROMANOS EXAMEN PARA LOS ALUMNO
GALATAS Y ROMANOS EXAMEN PARA LOS ALUMNOJoseAmaya49
 
21 MARZO DIA INTERNACIONAL DOS BOSQUES.pdf
21 MARZO DIA INTERNACIONAL DOS BOSQUES.pdf21 MARZO DIA INTERNACIONAL DOS BOSQUES.pdf
21 MARZO DIA INTERNACIONAL DOS BOSQUES.pdfceeabarcia
 
Ejemplo de trabajo de TIC´s CON VARIAS OPCIONES DE LAS TAREAS
Ejemplo de trabajo de TIC´s CON VARIAS OPCIONES DE LAS TAREASEjemplo de trabajo de TIC´s CON VARIAS OPCIONES DE LAS TAREAS
Ejemplo de trabajo de TIC´s CON VARIAS OPCIONES DE LAS TAREASJavier Sanchez
 
Anna Llenas Serra. El monstruo de colores. Doctor de emociones.pdf
Anna Llenas Serra. El monstruo de colores. Doctor de emociones.pdfAnna Llenas Serra. El monstruo de colores. Doctor de emociones.pdf
Anna Llenas Serra. El monstruo de colores. Doctor de emociones.pdfSaraGabrielaPrezPonc
 

Kürzlich hochgeladen (20)

Organizaciones Sociales formales y no formales
Organizaciones Sociales formales y no formalesOrganizaciones Sociales formales y no formales
Organizaciones Sociales formales y no formales
 
Presentación del tema: tecnología educativa
Presentación del tema: tecnología educativaPresentación del tema: tecnología educativa
Presentación del tema: tecnología educativa
 
PROGRAMACIÓN CURRICULAR ANUAL DE CIENCIA Y TECNOLOGÍA
PROGRAMACIÓN CURRICULAR ANUAL DE CIENCIA Y TECNOLOGÍAPROGRAMACIÓN CURRICULAR ANUAL DE CIENCIA Y TECNOLOGÍA
PROGRAMACIÓN CURRICULAR ANUAL DE CIENCIA Y TECNOLOGÍA
 
VISITA DE ESTUDO À CRUZ VERMELHA _
VISITA DE ESTUDO À CRUZ VERMELHA                   _VISITA DE ESTUDO À CRUZ VERMELHA                   _
VISITA DE ESTUDO À CRUZ VERMELHA _
 
Xardín de San Carlos (A Coruña) IES Monelos
Xardín de San Carlos (A Coruña) IES MonelosXardín de San Carlos (A Coruña) IES Monelos
Xardín de San Carlos (A Coruña) IES Monelos
 
PSICOLOGÍA. UNA INTRODUCCIÓN. ALCIRA ORSINI Y LETICIA BOSSELLINI 3.pdf
PSICOLOGÍA. UNA INTRODUCCIÓN. ALCIRA ORSINI Y LETICIA BOSSELLINI 3.pdfPSICOLOGÍA. UNA INTRODUCCIÓN. ALCIRA ORSINI Y LETICIA BOSSELLINI 3.pdf
PSICOLOGÍA. UNA INTRODUCCIÓN. ALCIRA ORSINI Y LETICIA BOSSELLINI 3.pdf
 
Escrito administrativo técnico y comerciales
Escrito administrativo técnico y comercialesEscrito administrativo técnico y comerciales
Escrito administrativo técnico y comerciales
 
La Gatera de la Villa nº 51. Revista cultural sobre Madrid..
La Gatera de la Villa nº 51. Revista cultural sobre Madrid..La Gatera de la Villa nº 51. Revista cultural sobre Madrid..
La Gatera de la Villa nº 51. Revista cultural sobre Madrid..
 
Concurso de Innovación Pedagógica T3 FONDEP 2024 Ccesa007.pdf
Concurso de Innovación Pedagógica  T3  FONDEP 2024 Ccesa007.pdfConcurso de Innovación Pedagógica  T3  FONDEP 2024 Ccesa007.pdf
Concurso de Innovación Pedagógica T3 FONDEP 2024 Ccesa007.pdf
 
CIENCIAS SOCIALES SEGUNDO TRIMESTRE CUARTO
CIENCIAS SOCIALES SEGUNDO TRIMESTRE CUARTOCIENCIAS SOCIALES SEGUNDO TRIMESTRE CUARTO
CIENCIAS SOCIALES SEGUNDO TRIMESTRE CUARTO
 
ficha de aplicacion para estudiantes El agua para niños de primaria
ficha de aplicacion para estudiantes El agua para niños de primariaficha de aplicacion para estudiantes El agua para niños de primaria
ficha de aplicacion para estudiantes El agua para niños de primaria
 
EL ECLIPSE DE LA PAZ (cuento literario). Autor y diseñador JAVIER SOLIS NOYOLA
EL ECLIPSE DE LA PAZ (cuento literario). Autor y diseñador JAVIER SOLIS NOYOLAEL ECLIPSE DE LA PAZ (cuento literario). Autor y diseñador JAVIER SOLIS NOYOLA
EL ECLIPSE DE LA PAZ (cuento literario). Autor y diseñador JAVIER SOLIS NOYOLA
 
Programación Anual 2024 - CIENCIAS SOCIALES.docx
Programación Anual 2024  - CIENCIAS SOCIALES.docxProgramación Anual 2024  - CIENCIAS SOCIALES.docx
Programación Anual 2024 - CIENCIAS SOCIALES.docx
 
Recursos Tecnológicos, página AIP-CRT 2 0 2 4.pdf
Recursos Tecnológicos, página  AIP-CRT 2 0 2 4.pdfRecursos Tecnológicos, página  AIP-CRT 2 0 2 4.pdf
Recursos Tecnológicos, página AIP-CRT 2 0 2 4.pdf
 
Tema 5.- BASES DE DATOS Y GESTIÓN DE LA INF. PARA EL MARKETING.pdf
Tema 5.- BASES DE DATOS Y GESTIÓN DE LA INF. PARA EL MARKETING.pdfTema 5.- BASES DE DATOS Y GESTIÓN DE LA INF. PARA EL MARKETING.pdf
Tema 5.- BASES DE DATOS Y GESTIÓN DE LA INF. PARA EL MARKETING.pdf
 
Sesión de clase ES: Adoración sin fin...
Sesión de clase ES: Adoración sin fin...Sesión de clase ES: Adoración sin fin...
Sesión de clase ES: Adoración sin fin...
 
GALATAS Y ROMANOS EXAMEN PARA LOS ALUMNO
GALATAS Y ROMANOS EXAMEN PARA LOS ALUMNOGALATAS Y ROMANOS EXAMEN PARA LOS ALUMNO
GALATAS Y ROMANOS EXAMEN PARA LOS ALUMNO
 
21 MARZO DIA INTERNACIONAL DOS BOSQUES.pdf
21 MARZO DIA INTERNACIONAL DOS BOSQUES.pdf21 MARZO DIA INTERNACIONAL DOS BOSQUES.pdf
21 MARZO DIA INTERNACIONAL DOS BOSQUES.pdf
 
Ejemplo de trabajo de TIC´s CON VARIAS OPCIONES DE LAS TAREAS
Ejemplo de trabajo de TIC´s CON VARIAS OPCIONES DE LAS TAREASEjemplo de trabajo de TIC´s CON VARIAS OPCIONES DE LAS TAREAS
Ejemplo de trabajo de TIC´s CON VARIAS OPCIONES DE LAS TAREAS
 
Anna Llenas Serra. El monstruo de colores. Doctor de emociones.pdf
Anna Llenas Serra. El monstruo de colores. Doctor de emociones.pdfAnna Llenas Serra. El monstruo de colores. Doctor de emociones.pdf
Anna Llenas Serra. El monstruo de colores. Doctor de emociones.pdf
 

Unidad 4. tecnología de base de datos

  • 1. MAESTRIA EN TECNOLOGIAS DE INFORMACIÓN TECNOLOGÍAS DE LA INFORMACIÓN EN LAS ORGANIZACIONES MTI. ROSA IMELDA GARCÍA CHI UNIDAD 4. TECNOLOGÍA DE BASE DE DATOS
  • 2. MTI. ROSY CHI Temas de la Unidad 4
  • 3. MTI. ROSY CHI UNIDAD 4. TECNOLOGIA DE BASE DE DATOS Concepto de BASE DE DATOS
  • 4. MTI. ROSY CHI BASE DE DATOS - Concepto Una base de datos o banco de datos es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior uso. En este sentido, una biblioteca puede considerarse una base de datos compuesta en su mayoría por documentos y textos impresos en papel e indexados para su consulta.
  • 5. MTI. ROSY CHI BASE DE DATOS - Concepto Actualmente, y debido al desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de datos están en formato digital (electrónico), y por ende se ha desarrollado y se ofrece un amplio rango de soluciones al problema del almacenamiento de datos.
  • 6. MTI. ROSY CHI Sistemas Gestores de Bases de Datos Existen programas denominados sistemas gestores de bases de datos, abreviado SGBD, que permiten almacenar y posteriormente acceder a los datos de forma rápida y estructurada. Las propiedades de estos SGBD, así como su utilización y administración, se estudian dentro del ámbito de la informática.
  • 7. MTI. ROSY CHI Tipos de base de datos
  • 8. MTI. ROSY CHI Tipos de base de datos Las bases • de acuerdo al contexto de datos que se esté manejando, pueden • la utilidad de las mismas clasificarse o de varias • las necesidades que maneras, satisfagan.
  • 9. MTI. ROSY CHI Tipos de Base de Datos Según la variabilidad Según el de los datos contenido almacenados
  • 10. MTI. ROSY CHI Según la variabilidad de los datos almacenados Bases de datos estáticas Son bases de datos de sólo lectura, utilizadas primordialmente para almacenar datos históricos que posteriormente se pueden utilizar para estudiar el comportamiento de un conjunto de datos a través del tiempo, realizar proyecciones, tomar decisiones y realizar análisis de datos para inteligencia empresarial. Bases de datos dinámicas Éstas son bases de datos donde la información almacenada se modifica con el tiempo, permitiendo operaciones como actualización, borrado y adición de datos, además de las operaciones fundamentales de consulta. Un ejemplo de esto puede ser la base de datos utilizada en un sistema de información de un supermercado, una farmacia, un videoclub o una empresa.
  • 11. MTI. ROSY CHI Según el contenido Bases de datos bibliográficas Sólo contienen un subrogante (representante) de la fuente primaria, que permite localizarla. Un registro típico de una base de datos bibliográfica contiene información sobre el autor, fecha de publicación, editorial, título, edición, de una determinada publicación, etc. Puede contener un resumen o extracto de la publicación original, pero nunca el texto completo, porque si no, estaríamos en presencia de una base de datos a texto completo (o de fuentes primarias —ver más abajo). Como su nombre lo indica, el contenido son cifras o números. Por ejemplo, una colección de resultados de análisis de laboratorio, entre otras. Bases de datos de texto completo Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas las ediciones de una colección de revistas científicas.
  • 12. MTI. ROSY CHI Según el contenido Directorios Un ejemplo son las guías telefónicas en formato electrónico. Bases de datos o "bibliotecas" de información química o biológica Son bases de datos que almacenan diferentes tipos de información proveniente de la química, las ciencias de la vida o médicas
  • 13. MTI. ROSY CHI Según el contenido Se pueden considerar en varios subtipos: Las que almacenan secuencias de nucleótidos o proteínas. Las bases de datos de rutas metabólicas. Bases de datos de estructura, comprende los registros de datos experimentales sobre estructuras 3D de biomoléculas Bases de datos clínicas. Bases de datos bibliográficas (biológicas, químicas, médicas y de otros campos)
  • 14. MTI. ROSY CHI Modelos de bases de datos
  • 15. MTI. ROSY CHI Modelos de bases de datos Además de la clasificación por la función de las bases de datos, éstas también se pueden clasificar de acuerdo a su modelo de administración de datos.
  • 16. MTI. ROSY CHI ….Modelo de Base de Datos Un modelo de datos es básicamente una "descripción" de algo conocido como contenedor de datos (algo en donde se guarda la información), así como de los métodos para almacenar y recuperar información de esos contenedores. Los modelos de datos no son cosas físicas: son abstracciones que permiten la implementación de un sistema eficiente de base de datos; por lo general se refieren a algoritmos, y conceptos matemáticos.
  • 17. MTI. ROSY CHI Algunos modelos con frecuencia utilizados en las bases de datos: Bases de datos jerárquicas Base de datos de red • En este modelo los datos se organizan en forma • Éste es un modelo ligeramente distinto del de árbol invertido (algunos dicen raíz), en donde jerárquico; su diferencia fundamental es la un nodo padre de información puede tener modificación del concepto de nodo: se permite varios hijos. El nodo que no tiene padres es que un mismo nodo tenga varios padres llamado raíz, y a los nodos que no tienen hijos (posibilidad no permitida en el modelo se los conoce como hojas. jerárquico). • Las bases de datos jerárquicas son • Fue una gran mejora con respecto al modelo especialmente útiles en el caso de aplicaciones jerárquico, ya que ofrecía una solución eficiente que manejan un gran volumen de información y al problema de redundancia de datos; pero, aún datos muy compartidos permitiendo crear así, la dificultad que significa administrar la estructuras estables y de gran rendimiento. información en una base de datos de red ha • Una de las principales limitaciones de este significado que sea un modelo utilizado en su modelo es su incapacidad de representar mayoría por programadores más que por eficientemente la redundancia de datos. usuarios finales.
  • 18. MTI. ROSY CHI Algunos modelos con frecuencia utilizados en las bases de datos: Bases de datos relacionales Bases de datos transaccionales • Éste es el modelo utilizado en la actualidad para modelar • Son bases de datos cuyo único fin es el envío y problemas reales y administrar datos dinámicamente. Tras recepción de datos a grandes velocidades, estas bases ser postulados sus fundamentos en 1970 por Edgar Frank son muy poco comunes y están dirigidas por lo general Codd, de los laboratorios IBM en San José (California), no tardó en consolidarse como un nuevo paradigma en los al entorno de análisis de calidad, datos de producción e modelos de base de datos. Su idea fundamental es el uso de industrial, es importante entender que su fin único es "relaciones". recolectar y recuperar los datos a la mayor velocidad • Estas relaciones podrían considerarse en forma lógica como posible, por lo tanto la redundancia y duplicación de conjuntos de datos llamados "tuplas". Pese a que ésta es la información no es un problema como con las demás teoría de las bases de datos relacionales creadas por bases de datos, por lo general para poderlas aprovechar Codd, la mayoría de las veces se conceptualiza de una al máximo permiten algún tipo de conectividad a bases manera más fácil de imaginar. Esto es pensando en cada de datos relacionales. relación como si fuese una tabla que está compuesta por • Un ejemplo habitual de transacción es el traspaso de registros (las filas de una tabla), que representarían las una cantidad de dinero entre cuentas bancarias. tuplas, y campos (las columnas de una tabla). Normalmente se realiza mediante dos operaciones • En este modelo, el lugar y la forma en que se almacenen los distintas, una en la que se decrementa el saldo de la datos no tienen relevancia (a diferencia de otros modelos cuenta origen y otra en la que incrementamos el saldo como el jerárquico y el de red). Esto tiene la considerable ventaja de que es más fácil de entender y de utilizar para un de la cuenta destino. usuario esporádico de la base de datos. La información • Para garantizar la atomicidad del sistema (es decir, para puede ser recuperada o almacenada mediante "consultas" que no aparezca o desaparezca dinero), las dos que ofrecen una amplia flexibilidad y poder para administrar operaciones deben ser atómicas, es decir, el sistema la información. debe garantizar que, bajo cualquier circunstancia • El lenguaje más habitual para construir las consultas a bases (incluso una caída del sistema), el resultado final es de datos relacionales es SQL, Structured Query Language o que, o bien se han realizado las dos operaciones, o bien Lenguaje Estructurado de Consultas, un estándar no se ha realizado ninguna. implementado por los principales motores o sistemas de gestión de bases de datos relacionales.
  • 19. MTI. ROSY CHI Algunos modelos con frecuencia utilizados en las bases de datos: Bases de datos orientadas a objetos Bases de datos multidimensionales • Este modelo, bastante reciente, y propio de los modelos informáticos orientados a objetos, trata de almacenar en la base de datos los objetos completos (estado y • Son bases de datos ideadas para comportamiento). desarrollar aplicaciones muy • Una base de datos orientada a objetos es una base de datos concretas, como creación de Cubos que incorpora todos los conceptos importantes del paradigma de objetos: OLAP. • Encapsulación - Propiedad que permite ocultar la • Básicamente no se diferencian información al resto de los objetos, impidiendo así accesos incorrectos o conflictos. demasiado de las bases de datos • Herencia - Propiedad a través de la cual los objetos heredan relacionales (una tabla en una base de comportamiento dentro de una jerarquía de clases. datos relacional podría serlo también en • Polimorfismo - Propiedad de una operación mediante la cual puede ser aplicada a distintos tipos de objetos. una base de datos multidimensional), la • En bases de datos orientadas a objetos, los usuarios pueden diferencia está más bien a nivel definir operaciones sobre los datos como parte de la conceptual; en las bases de datos definición de la base de datos. Una operación (llamada función) se especifica en dos partes. La interfaz (o signatura) multidimensionales los campos o de una operación incluye el nombre de la operación y los atributos de una tabla pueden ser de dos tipos de datos de sus argumentos (o parámetros). La tipos, o bien representan dimensiones de implementación (o método) de la operación se especifica separadamente y puede modificarse sin afectar la interfaz. la tabla, o bien representan métricas que Los programas de aplicación de los usuarios pueden operar se desean estudiar. sobre los datos invocando a dichas operaciones a través de sus nombres y argumentos, sea cual sea la forma en la que se han implementado. Esto podría denominarse independencia entre programas y operaciones.
  • 20. MTI. ROSY CHI Algunos modelos con frecuencia utilizados en las bases de datos: Bases de datos deductivas Bases de datos documentales • Un sistema de base de datos deductiva, es un sistema de base de datos pero con la diferencia de que permite hacer • Permiten la indexación a deducciones a través de inferencias. • Se basa principalmente en reglas y hechos texto completo, y en que son almacenados en la base de datos. líneas generales realizar • Las bases de datos deductivas son también llamadas bases de datos lógicas, a raíz de búsquedas más potentes. que se basa en lógica matemática. Tesaurus es un sistema de • Este tipo de base de datos surge debido a las limitaciones de la Base de Datos índices optimizado para Relacional de responder a consultas este tipo de bases de recursivas y de deducir relaciones indirectas de los datos almacenados en la base de datos. datos.
  • 21. MTI. ROSY CHI BASE DE DATOS PERSONALES TECNOLOGIA DE BASE DE DATOS
  • 22. MTI. ROSY CHI BASE DE DATOS PERSONALES Son colecciones de datos que integran información de personas, tales como su nombre, su RFC, su dirección, su teléfono, su estado civil, su correo, entre otras. Estas Bases de Datos se encuentran y deben estar protegidas por la Ley de Datos Personales para que no se haga mal uso de ellas
  • 23. MTI. ROSY CHI BASE DE DATOS CORPORATIVAS TECNOLOGIA DE BASE DE DATOS
  • 24. MTI. ROSY CHI BASE DE DATOS CORPORATIVAS Con estas bases de datos, las Son colecciones de datos que la Estas colecciones involucran a organizaciones pueden construir empresa integra en diferentes bases de clientes, proveedores, productos, entre sistemas de información para la toma de datos. otros. decisiones o ERP
  • 26. MTI. ROSY CHI DATAWAREHOUSE TECNOLOGIA DE BASE DE DATOS
  • 27. MTI. ROSY CHI Datawarehouse o Almacén de Datos En el contexto de la informática, un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se trata, sobre todo, de un expediente completo de una organización, más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos (especialmente OLAP, procesamiento analítico en línea). El almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas dependiendo del subsistema de la entidad del que procedan o para el que sean necesario.
  • 28. MTI. ROSY CHI Características de un Data Warehouse 1. Orientado a temas • Orientado a los temas principales de la organización. La información se clasifica en función de los aspectos que son de interés para la organización. • Se organizan por temas para facilitar el acceso y el entendimiento por parte de los usuarios finales. • Por ejemplo, tenemos información que proviene de los datos operacionales de distintas áreas como son: prestamos, ahorros, nóminas y créditos. Pues los temas que nos pueden interesar son: clientes, productos, vendedores y actividad. 2. Integrado • En un sistema operacional no hay integración, pero en un Data Warehouse todos los datos se encuentran integrados. • Esta integración se muestra de diferentes maneras: consistencia en codificación de estructuras, en unidades de medida de las variables, en múltiples fuentes, en convenciones de nombres, en atributos físicos de los datos etc…
  • 29. MTI. ROSY CHI …Características de un Data Warehouse 3. Variante en el tiempo • En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente, por el contrario, la información almacenada en el Data Warehouse refleja un histórico de los datos en un horizonte de tiempo mucho más amplio (del orden de años). De esta forma podemos detectar tendencias en el tiempo. 4. No volátil • El Data Warehouse existe para ser leído y no para ser modificado, la información es por tanto permanente, la actualización del Data Warehouse significa la incorporación de los últimos valores que tomaron las distintas variables contenidas en él, sin ningún tipo de acción sobre lo que ya existía. • Los datos más recientes no sustituyen a los precedentes, sino que suelen mantenerse con un mayor nivel de detalle. Por ejemplo: en el año actual se guardarían las ventas diarias de los diferentes artículos, mientras que los datos anteriores se mantendrían accesibles de manera agregada.
  • 31. MTI. ROSY CHI DATAMART TECNOLOGIA DE BASE DE DATOS
  • 32. MTI. ROSY CHI Data marts Los Data marts son subconjuntos de datos de un data warehouse para áreas específicas.
  • 33. MTI. ROSY CHI Data marts Tiene una Tiene un función de propósito apoyo. Área específica. específico. Usuarios limitados.
  • 34. MTI. ROSY CHI CUBOS DE INFORMACIÓN UNIDAD 4.
  • 35. MTI. ROSY CHI Cubos de información Los cubos de información o cubos OLAP funcionan como los cubos de rompecabezas en los juegos, en el juego se trata de armar los colores y en el data warehouse se trata de organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3 dimensiones, los cubos OLAP tienen un número indefinido de dimensiones, razón por la cual también reciben el nombre de hipercubos. Un cubo OLAP contendrá datos de una determinada variable que se desea analizar, proporcionando una vista lógica de los datos provistos por el sistema de información hacia el data warehouse, esta vista estará dispuesta según unas dimensiones y podrá contener información calculada. El análisis de los datos está basado en las dimensiones del hipercubo, por lo tanto, se trata de un análisis multidimensional.
  • 36. MTI. ROSY CHI Cubos de información
  • 37. MTI. ROSY CHI VARIABLES Y DIMENSIONES A la información de un cubo puede acceder el ejecutivo mediante "tablas dinámicas" en una hoja de cálculo o a través de programas personalizados. Las tablas dinámicas le permiten manipular las vistas (cruces, filtrados, organización, totales) de la información con mucha facilidad. Las diferentes operaciones que se pueden realizar con cubos de información se producen con mucha rapidez. Llevando estos conceptos a un data warehouse, éste es una colección de datos que está formada por «dimensiones» y «variables», entendiendo como dimensiones a aquellos elementos que participan en el análisis y variables a los valores que se desean analizar.
  • 38. MTI. ROSY CHI Dimensiones Son catálogos de información Las dimensiones de un cubo son atributos complementaria necesaria para la Es decir, la información general relativos a las variables, son las presentación de los datos a los complementaria a cada uno de los perspectivas de análisis de las variables usuarios, como por ejemplo: registros de la tabla de hechos. (forman parte de la tabla de dimensiones). descripciones, nombres, zonas, rangos de tiempo, etc.
  • 39. MTI. ROSY CHI Variables También llamadas “indicadores de gestión”, son los datos que están siendo analizados. Forman parte de la tabla de hechos. Más formalmente, las variables representan algún aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numéricos para cada instancia del objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a las variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de dimensiones podrían ser: “productos”, “localidades” (o zonas), “el tiempo” (medido en días, horas, semanas, etc.), ...
  • 40. MTI. ROSY CHI Ejemplos Ejemplos de variables podrían ser: • Beneficios • Gastos • Ventas • etc. Ejemplos de dimensiones podrían ser: • producto (diferentes tipos o denominaciones de productos) • localidades (o provincia, o regiones, o zonas geográficas) • tiempo (medido de diferentes maneras, por horas, por días, por meses, por años, ...) • tipo de cliente (casado/soltero, joven/adulto/anciano, ...) • etc.
  • 41. MTI. ROSY CHI DATAMINING TECNOLOGIA DE BASE DE DATOS
  • 42. MTI. ROSY CHI Data Mining o Minería de Datos es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos.
  • 43. MTI. ROSY CHI Data Mining o Minería de Datos El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, que involucra aspectos de bases de datos y gestión de datos, procesamiento de datos, el modelo y las consideraciones de inferencia, métricas de Intereses, consideraciones de la Teoría de la complejidad computacional, post-procesamiento de las estructuras descubiertas, la visualización y actualización en línea.
  • 44. MTI. ROSY CHI …Data Mining El término es una palabra de moda, y es pero también se ha generalizado a cualquier tipo frecuentemente mal utilizado para referirse a de sistema de apoyo informático cualquier forma de datos a gran escala o decisión, incluyendo la inteligencia artificial procesamiento de la información , aprendizaje automático y la inteligencia (recolección, extracción, almacenamiento, análisis empresarial. y estadísticas),
  • 45. MTI. ROSY CHI Un proceso típico de minería de datos consta de los siguientes pasos generales: 1.Selección del conjunto de datos, tanto en lo que se refiere a las variables objetivo (aquellas que se quiere predecir, calcular o inferir), como a las variables independientes (las que sirven para hacer el cálculo o proceso), como posiblemente al muestreo de los registros disponibles. 2.Análisis de las propiedades de los datos, en especial los histogramas, diagramas de dispersión, presencia de valores atípicos y ausencia de datos (valores nulos). 3.Transformación del conjunto de datos de entrada, se realizará de diversas formas en función del análisis previo, con el objetivo de prepararlo para aplicar la técnica de minería de datos que mejor se adapte a los datos y al problema, a este paso también se le conoce como preprocesamiento de los datos.
  • 46. MTI. ROSY CHI …proceso típico de minería de datos 4.Seleccionar y aplicar la técnica de minería de datos, se construye el modelo predictivo, de clasificación o segmentación. 5.Extracción de conocimiento, mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un preprocesado diferente de los datos. 6.Interpretación y evaluación de datos, una vez obtenido el modelo, se debe proceder a su validación comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos.
  • 47. MTI. ROSY CHI PROTOCOLO DE UN PROYECTO DE MINERÍA DE DATOS Unidad 4. Tecnología de Base de Datos
  • 48. MTI. ROSY CHI Un proyecto de minería de datos tiene varias fases necesarias que son, esencialmente: Comprensión del negocio y del problema que se quiere resolver. Validación, comunicación, etc. de los resultados obtenidos. Determinación, obtención y limpieza de los datos necesarios. Integración, si procede, de los resultados en un sistema Creación de modelos transaccional o similar. matemáticos.
  • 49. MTI. ROSY CHI Técnicas de minería de datos
  • 50. MTI. ROSY CHI Las técnicas más representativas son: Redes neuronales Regresión lineal Árboles de decisión Modelos estadísticos Agrupamiento o Clustering Reglas de asociación
  • 51. MTI. ROSY CHI Las técnicas más representativas son: Redes neuronales.- Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. Algunos ejemplos de red neuronal son: • El Perceptrón • El Perceptrón multicapa • Los Mapas Autoorganizados, también conocidos como redes de Kohonen. Regresión lineal.- Es la más utilizada para formar relaciones entre datos. Rápida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse más de 2 variables.
  • 52. MTI. ROSY CHI Las técnicas más representativas son: Árboles de decisión.- Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lógicas, muy similares a los sistemas de predicción basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema. Ejemplos: • Algoritmo ID3 • Algoritmo C4.5 Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta.
  • 53. MTI. ROSY CHI Las técnicas más representativas son: Agrupamiento o Clustering.- Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes. Ejemplos: • Algoritmo K-means • Algoritmo K-medoids Reglas de asociación.- Se utilizan para descubrir hechos que ocurren en común dentro de un determinado conjunto de datos.
  • 54. MTI. ROSY CHI EJEMPLOS DE USO DE LA MINERÍA DE DATOS
  • 55. MTI. ROSY CHI Ejemplos de uso de la minería de datos Negocios Análisis de Hábitos de gases compra en supermercados Ingeniería Patrones de eléctrica fuga Genética Fraudes Ciencia e Recursos Ingeniería humanos Comportamiento Juegos en Internet Terrorismo