libro para colorear de Peppa pig, ideal para educación inicial
Data minning final tp internet inf 13 miercoles de 18 a 21
1. Trabajo practico Internet: Minería de Datos “Data Minning”
1
Estas buscando información sobre minería de datos (DATA MINING) aquí vas a
encontrar una explicación rápida y sencilla del tema, uso y aplicaciones.
Espero que te sirva de ayuda
Minería de Datos “Data Mining”:
Historia:
Desde los años sesenta los estadísticos manejaban términos como data fishing,
data mining o data archaeology con la idea de encontrar correlaciones sin una
hipótesis previa en bases de datos con ruido. A principios de los años ochenta,
Rakesh Agrawal, Gio Wiederhold, Robert Blum y Gregory Piatetsky-Shapiro, entre
otros, empezaron a consolidar los términos de data mining y KDD.A finales de los
años ochenta sólo existían un par de empresas dedicadas a esta tecnología; en
2002 ya existían más de 100 empresas en el mundo que ofrecen alrededor de 300
soluciones.
Las listas de discusión sobre este tema las forman investigadores de más de
ochenta países. Esta tecnología ha sido un buen punto de encuentro entre personas
pertenecientes al ámbito académico y al de los negocios.
¿Qué es y para qué sirve la Minería de Datos?
Es el estudio y tratamiento de datos masivos para extraer conclusiones e
información relevante de ellos. Es decir, La minería de datos es el proceso de
detectar la información procesable de los conjuntos grandes de datos. Utiliza el
análisis matemático para deducir los patrones y tendencias que existen en los
datos. Normalmente, estos patrones no se pueden detectar mediante la exploración
tradicional de los datos porque las relaciones son demasiado complejas o porque
hay demasiado datos.
Estos patrones y tendencias se pueden recopilar y definir como un modelo de
minería de datos.
La Minería de datos puede ser descriptiva (descubrir patrones interesantes o
relaciones) o predictivas (clasificar nuevos datos)
Hay áreas que toman ventaja de los resultados de aplicar minería de datos a su
información, como es el caso de la mercadotecnia, medicina, manufactura, química,
economía, etc.
Sus tareas más comunes son:
Clasificación: Organiza un dato dentro de una de las clases categóricas
predefinidas.
Regresión: El propósito de este modelo es hacer corresponder un dato con un
valor real de una variable.
2. Trabajo practico Internet: Minería de Datos “Data Minning”
2
Clustering: Es la agrupación de registros, observaciones o clases de objetos
similares. Por lo que un cluster es una colección de registros que tienen similitudes y
son distintos a cualquier otro cluster.
Generación de reglas: Se extraen o generan reglas de los datos, estas hacen
referencia al descubrimiento de relaciones de asociación y dependencias
funcionales entre los diferentes atributos.
Resumen: En esta tarea se proporcionan una descripción compacta de un
subconjunto de datos.
Análisis de secuencias: Se generan patrones secuénciales, el objetivo es modelar
los estados del proceso, extraer e informar de la desviación y tendencias en el
tiempo.
La generación de un modelo de minería de datos forma parte de un proceso mayor
que incluye desde la formulación de preguntas acerca de los datos y la creación de
un modelo para responderlas, hasta la implementación del modelo en un entorno
de trabajo.
Este proceso se puede definir mediante los seis pasos básicos siguientes:
3. Trabajo practico Internet: Minería de Datos “Data Minning”
3
Básicamente, el datamining surge para intentar ayudar a comprender el contenido
de un repositorio de datos. Con este fin, hace uso de prácticas estadísticas y, en
algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las
redes neuronales
De forma general, los datos son la materia prima bruta. En el momento que el
usuario les atribuye algún significado especial pasan a convertirse en información.
Cuando los especialistas elaboran o encuentran un modelo, haciendo que la
interpretación que surge entre la información y ese modelo represente un valor
agregado, entonces nos referimos al conocimiento. Vea más diferencias entre datos,
información y conocimiento.
Aunque en datamining cada caso concreto puede ser radicalmente distinto al
anterior, el proceso común a todos ellos se suele componer de cuatro etapas
principales:
Determinación de los objetivos. Trata de la delimitación de los objetivos
que el cliente desea bajo la orientación del especialista en data mining.
Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el
enriquecimiento, la reducción y la transformación de las bases de datos. Esta
etapa consume generalmente alrededor del setenta por ciento del tiempo
total de un proyecto de data mining
4. Trabajo practico Internet: Minería de Datos “Data Minning”
4
Determinación del modelo. Se comienza realizando unos análisis
estadísticos de los datos, y después se lleva a cabo una visualización gráfica
de los mismos para tener una primera aproximación. Según los objetivos
planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos
desarrollados en diferentes áreas de la Inteligencia Artificial
Análisis de los resultados. Verifica si los resultados obtenidos son
coherentes y los coteja con los obtenidos por los análisis estadísticos y de
visualización gráfica. El cliente determina si son novedosos y si le aportan un
nuevo conocimiento que le permita considerar sus decisiones.
En resumen, el datamining se presenta como una tecnología emergente, con varias
ventajas: por un lado, resulta un buen punto de encuentro entre los investigadores y
las personas de negocios; por otro, ahorra grandes cantidades de dinero a una
empresa y abre nuevas oportunidades de negocios. Además, no hay duda de que
trabajar con esta tecnología implica cuidar un sinnúmero de detalles debido a que el
producto final involucra "toma de decisiones.
5. Trabajo practico Internet: Minería de Datos “Data Minning”
5
Carga de trabajo en las fases de un proyecto de datamining
EJEMPLOS DE USO DE LA MINERÍA DE DATOS
NEGOCIOS La minería de datos puede contribuir significativamente en las
aplicaciones de administración empresarial basada en la relación con el cliente. En
lugar de contactar con el cliente de forma indiscriminada a través de un centro de
llamadas o enviando cartas, sólo se contactará con aquellos que se perciba que
tienen una mayor probabilidad de responder positivamente a una determinada oferta
o promoción. HÁBITOS DE COMPRA EN SUPERMERCADOS Un estudio muy
citado detectó que los viernes había una cantidad inusualmente elevada de clientes
que adquirían a la vez pañales y cerveza. Se detectó que se debía a que dicho día
solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de
semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión
con una cerveza en la mano. El supermercado pudo incrementar sus ventas de
cerveza colocándolas próximas a los
pañales para fomentar las ventas
compulsivas.
PATRONES DE FUGA En
muchas industrias como la banca, las
telecomunicaciones, etc., existe un
comprensible interés en detectar
cuanto antes aquellos clientes que
puedan estar pensando en rescindir
sus contratos para, posiblemente,
pasarse a la competencia. A estos
clientes y en función de su valor se les podrían hacer ofertas personalizadas, ofrecer
promociones especiales, etc., con el objetivo último de retenerlos. FRAUDES Un
caso análogo es el de la detección de transacciones de blanqueo de dinero o de
fraude en el uso de tarjetas de crédito o de servicios de telefonía móvil e, incluso, en
la relación de los contribuyentes con el fisco. Generalmente, estas operaciones
fraudulentas o ilegales suelen seguir patrones característicos que permiten, con
cierto grado de probabilidad, distinguirlas de las legítimas y desarrollar así
mecanismos para tomar medidas rápidas frente a ellas
.
RECURSOS HUMANOS La minería de datos también puede ser útil para los
departamentos de recursos humanos en la identificación de las características de
sus empleados de mayor éxito. La información obtenida puede ayudar a la
6. Trabajo practico Internet: Minería de Datos “Data Minning”
6
contratación de personal, centrándose en los esfuerzos de sus empleados y los
resultados obtenidos por éstos.
COMPORTAMIENTO EN INTERNET También es un área en boga el del
análisis del comportamiento de los visitantes sobre todo, cuando son clientes
potenciales en una página de Internet. O la utilización de la información obtenida por
medios más o menos legítimos sobre ellos para ofrecerles propaganda adaptada
específicamente a su perfil. O para, una vez que adquieren un determinado
producto, saber inmediatamente qué otro ofrecerle teniendo en cuenta la
información histórica disponible acerca de los clientes que han comprado primero.
8. Trabajo practico Internet: Minería de Datos “Data Minning”
8
JUEGOS: Esta nueva área en la minería de datos consiste en la extracción de
estrategias utilizadas
por personas para los
oráculos para
determinados juegos
combinacionales. Los
planteamientos
actuales sobre
reconocimiento de
patrones, no parecen
poder aplicarse con
éxito al funcionamiento
de estos oráculos
TERRORISMO La
minería de datos ha
sido citada como el método por el cual la unidad Able Danger del Ejército de los
EE.UU. había identificado al líder de los atentados del 11 de septiembre de 2001,
Mohammed Atta, y a otros tres secuestradores del "11-S" como posibles miembros
de una célula de Al Qaeda que operan en los EE.UU. más de un año antes del
ataque.
INGENIERIA ELÉCTRICA: En el ámbito de la ingeniería eléctrica, las técnicas
minería de datos han sido ampliamente utilizadas para monitorizar las condiciones
de las instalaciones de alta tensión. La finalidad de esta monitorización es obtener
información valiosa sobre el estado del aislamiento de los equipos. Para la vigilancia
de las vibraciones o el análisis de los cambios de carga en transformadores se
utilizan ciertas técnicas para agrupación de datos (clustering) tales como los Mapas
Auto-Organizativos (SOM, Self-organizing map).
TENDENCIAS: La Minería de Datos ha sufrido transformaciones en los últimos años
de acuerdo con cambios tecnológicos, de estrategias de marketing, la extensión de
los modelos de compra en línea, etc. Los más importantes de ellos son: La
importancia que han cobrado los datos no estructurados (texto, páginas de Internet,
etc.) 1 La necesidad de integrar los algoritmos y resultados obtenidos en sistemas
operacionales, portales de Internet, etc. 2 La exigencia de que los procesos
funcionen prácticamente en línea (por ejemplo, que frente a un fraude con una
tarjeta de crédito). 3 Los tiempos de respuesta. El gran volumen de datos que hay
que procesar en muchos casos para obtener un modelo válido es un inconveniente;
esto implica grandes cantidades de tiempo de proceso y hay problemas que
requieren una respuesta en tiempo real.
9. Trabajo practico Internet: Minería de Datos “Data Minning”
9
En resumen:
El Data Mining se presenta como una tecnología emergente, con varias
ventajas: por un lado, resulta un buen punto de encuentro entre los
investigadores y las personas de negocios; por otro, ahorra grandes
cantidades de dinero a una empresa y abre nuevas oportunidades de
negocios. Además, no hay duda de que trabajar con esta tecnología implica
cuidar un sinnúmero de detalles debido a que el producto final involucra
"toma de decisiones". El Data Mining (minería de datos), es el conjunto de
técnicas y tecnologías que permiten explorar grandes bases de datos, de
manera automática o semiautomática, con el objetivo de encontrar patrones
repetitivos, tendencias o reglas que expliquen el comportamiento de los datos
en un determinado contexto.
10. Trabajo practico Internet: Minería de Datos “Data Minning”
10
Si aun no tienes claro que es la minería de datos elegimos
este video de chicos que trabajaron como nosotros y nos
ayudo a comprender mejor, de una manera divertida y
moderna DATA MINING
http://www.youtube.com/watch?v=-aPU13W7Xvw&ytsession=lguIuRGalK-
CE45UStSNYRuASxRwcN45JxHqWu0Fx_W_ktuGdzURW427aTS0VdPQlcersIdluHK
ws41n9-
JCOnJhMBAMJG_A1k3pD8ZF9df2hvvLQgzEnn_7P3Nel2XlOHhVuaTorhou7wTO7P
R2fDuV9XLBA3J_nKAxzTgxqDqIBaoHpFEba7b1RHr8kS9nHiyD_gektMg_QiZnb5H
exzhoypgLvyx7y27skQ9D4wIErktK2NHumY8ce-
uHWyjatknFULinSJ_6cMCE9LjhE5Gw0g7j4gEU
11. Trabajo practico Internet: Minería de Datos “Data Minning”
11
Referencias:
http://msdn.microsoft.com/es-es/library/ms174949.aspx
Clara la información e interesante llamo mucho la atención la explicación con
imágenes
http://silvercorp.wordpress.com/2013/04/24/mineria-de-datos-que-es-y-para-
que-sirve/
Buena explicación sobre el tema fácil de comprender
http://sinnexus.es/business_intelligence/datamining.aspx
Buenas imágenes con datos
http://www.ejournal.unam.mx/rca/190/RCA19007.pdf
Datos diferentes que complementaron la información
Los siguientes son links de donde se extrajeron la mayoría de la imágenes utilizadas, se
usaron las más acordes a lo volcado en el texto armado y además que revelen más del tema
http://www.google.com/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&cad=
rja&docid=CdibUylKSRbz1M&tbnid=oGlQSiDvJnX3uM:&ved=0CAQQjB0&url
=http%3A%2F%2Fsociologianecesaria.blogspot.com%2F2013%2F04%2Fqu
e-es-mineria-de-
datos.html&ei=tYzPUZDnConwiwLf2oDQAg&bvm=bv.48572450,d.cGE&psig=
AFQjCNH-yhQjsAKrPUhMNuRXRvauXf2RzQ&ust=1372642865331286