SlideShare ist ein Scribd-Unternehmen logo
1 von 3
Minería de datos: conceptualización y utilidad
La minería de datos es una actividad que está a medio camino entre la Informática, la Estadística y la
Documentación, y que se ha estado utilizando en numerosas disciplinas para el análisis de grandes
cantidades de datos. En bibliotecas, su práctica está poco extendida a pesar las múltiples aplicaciones
que tiene.
El objetivo de este artículo es hacer una introducción teórica a la minería de datos para profundizar
después en su aplicación en bibliotecas, presentándose éstas como un campo ideal de trabajo. De
esta aplicación, denominada en inglés bibliomining (término para cuya traducción al español se
propone emplear "bibliominería"), se explican brevemente algunos de los usos prácticos, que van
desde la evaluación de bibliotecas, la planificación de adquisiciones, la organización de la colección y
los estudios de usuarios. Otra de las aplicaciones de mayor interés es la elaboración de sistemas de
recomendaciones tal y como se vienen aplicando en servicios web, y que entra en el campo de la
llamada Biblioteca 2.0 (en inglés Library 2.0).
La bibliominería, al igual que cualquier actividad de minería de datos, entraña ciertos problemas
respecto a la privacidad. Aquí se presentan algunas de las posibles medidas a tomar al respecto.
Conceptualización
El gran crecimiento de las bases de datos y el aumento de las capacidades de almacenamiento de
información, han hecho que todo tipo de organizaciones puedan disponer de una gran cantidad y
variedad de datos relativos a su actividad diaria. En muchas de estas organizaciones se han dado
cuenta del potencial que tiene esta información para el apoyo a la gestión. Su estudio permite ver la
evolución y desarrollo de las organizaciones, y por lo tanto, trazar una línea de tendencia que muestre
por dónde pueden moverse en un futuro.
Así, el estudio de los datos y la información almacenados en las bases de datos ofrece una visión
perspectiva (qué se está haciendo y cómo se está haciendo) y prospectiva (cómo puede evolucionar la
organización en un futuro a corto-medio plazo) de la organización, y es por ello por lo que tiene una
función de apoyo a la toma de decisiones.
Este estudio de las bases de datos ha sido, y es, mucho más común en organizaciones económicas y
empresariales, desde supermercados hasta grandes multinacionales, pero también organismos
científicos que manejan grandes cantidades de información han visto la utilidad de este tipo de
estudios.
Debido a que la información en las bases de datos está más desestructurada (siguiendo el modelo
DIKW)2 que en otras fuentes de información, para su utilización es necesario un proceso de
tratamiento y análisis exhaustivo. Estas tareas de análisis de la información de las bases de datos se
denominan minería de datos (en inglés data mining) o descubrimiento de información en bases de
datos (en inglés knowledge discovery in databases o KDD)3. Bajo esta perspectiva Hand, Mannila y
Smyth definen minería de datos como "la ciencia de extracción de información útil de grandes
conjuntos de datos o de bases de datos" (Hand et al., 2001). Para algunos autores minería de datos y
KDD se refieren a lo mismo, mientras que para otros KDD se refiere a un proceso de varias fases,
entre las que se encuentra la minería de datos (Hernández et al., 2004).
Tal como señalan Fayyad, Piatetsky-Shapiro y Smyth, la gran cantidad de datos que se almacenan en
las organizaciones hace imposible la utilización de métodos manuales para su análisis (Fayyad et al.,
1996). Por ello son necesarias técnicas y herramientas informáticas capaces de ayudar al hombre de
forma "inteligente" y "automática" en el análisis de grandes cantidades de datos.
Estos mismos autores aportan la definición de minería más citada en la literatura sobre el tema:
"minería de datos es un proceso no trivial de identificación de patrones de datos válidos, nuevos,
potencialmente usables y comprensibles". Es decir, se trata de un proceso concreto, específico, con un
objetivo, que busca identificar repeticiones y/o tendencias en un conjunto de datos que resulten útiles y
sean veraces. Para Hernández Orallo, Ramírez Quintana y Ferri Ramírez (Hernández et al., 2004), en
esta definición se resumen las propiedades del conocimiento extraído: válido, novedoso,
potencialmente útil y comprensible.
Este proceso de minería de datos, Fayyad, Piatetsky-Shapiro y Smyth (Fayyad et al., 1996) lo
descomponen en nueve fases lineales e iterativas, del mismo modo, Kudyba y Hoptroff lo hacen desde
el punto de vista empresarial (Kudyba; Hoptroff, 2001). Estas fases, aunque con distinta denominación,
consisten en tres operaciones: definición de la información que se pretende obtener, toma y
procesamiento de datos, análisis de los resultados, obtención y consolidación de nueva información.
En el campo de las bibliotecas, Guenther, basándose en Brethenoux y Strange, simplifica las fases
resumiéndolas en tres (Guenther, 2000):
•Selección y adquisición de datos: definir qué datos se quieren recopilar y qué método o
procedimiento se va a usar para ello.
•Preparación y proceso de datos.
•Interpretación e integración (de los resultados).
En cualquiera de todos estos pasos, y en cualquiera de las propuestas consultadas, el proceso
fundamental es el de la selección de los datos. Si el conjunto de datos (o bases de datos) a utilizar no
es el adecuado para el tipo de análisis que se pretende llevar a cabo, el éxito del proceso de minería
de datos se verá frustrado.
El proceso de la minería de datos es similar al proceso de elaboración de una estadística, que para
Montañá (Montañá Lacambra, 2005) pasa también por tres fases: la recopilación de los datos, su
procesamiento y la difusión del resultado final. Si bien el producto final de las estadísticas es una de
las materias primas de la minería de datos.
El primer impulso importante para el desarrollo de esta disciplina se dio en The First International
Conference on Knowledge Discovery and Data Mining (KDD-95) dentro de la Fourteenth International
Joint Conference on Artificial Intelligence (IJCAI-95), coordinada por Usama Fayyad y Ramasamy
Uthurusamy.
Por ese entonces el propio Fayyad, junto con Simoudis, definían minería de datos (aunque
predominaba el uso de la expresiónknowledge discovery in databases) como "un campo emergente
que combina técnicas de aprendizaje-máquina, reconocimiento de patrones, estadística, bases de
datos y visualización para extraer automáticamente conceptos, conceptos interrelacionados, y patrones
de interés desde grandes bases de datos. Su tarea principal es la extracción de conocimiento (o
información) de datos de bajo nivel (bases de datos)" (Fayyad; Simoudis, 1995).
Así pues, la minería de datos es un campo inicialmente relacionado con la Inteligencia Artificial y la
Estadística, en el que la Documentación y demás Ciencias de la Información han participado
posteriormente, desde el punto de vista de la administración y gestión (management) de centros de
información, y como parte de las tareas de gestión de la información y del conocimiento. De este
modo, la minería de datos supone una reivindicación del valor de las fuentes de datos estadísticas
para la gestión.
Utilidad de la minería de datos
Actualmente, la minería de datos es una actividad en expansión aplicada cada vez en más disciplinas,
que han visto la utilidad del estudio de datos para apoyar la toma de decisiones. Especial énfasis está
teniendo en aquellas áreas relacionadas con la Economía, mediante la Econometría, y dentro del
campo de inteligencia de los negocios.
El caso más tratado (y tomado como referencia para explicar diferentes tipos de algoritmos de minería
de datos) es el de los supermercados (Agrawal; Imielinski; Swami, 1993) (Brin; Motwani; Ullman; Tsur,
1997) (Chi-Wing Wong; Wai-Chee Fu; Wang, 2005) (Hernández et al., 2004), ya que conocer el perfil
de compra de los clientes puede ayudar a organizar el stock. De un modo similar, aunque más
exhaustiva, es su utilización en comercio electrónico (Kohavi, 2001) (Kohavi; Provost, 2001), ya que en
este caso es posible obtener mucha más información del comportamiento global del cliente, y no sólo
conocer las compras. A su vez, y en el paso anterior en la cadena de producción, los proveedores y
distribuidores pueden planificar la producción conforme a la demanda. Sin embargo, aunque eficiente,
este modelo de actuación muestra su debilidad en momentos de excepción, como los casos de
supermercados desabastecidos por no disponer de stock durante huelgas, o la incapacidad de hacer
frente a grandes demandas en momentos de crisis (equipamiento y material tras el paso del huracán
Katrina o el hundimiento del petrolero Prestige).
También relacionados con la Economía, son los estudios para evitar pérdidas de clientes y fraudes
(mediante la detección de cambios de comportamiento sospechosos) (Fawcett; Provost, 1997) (Cox;
Eick; Wills; Brachman, 1997), así como la concesión de créditos rápidos y de seguros (Hernández et
al., 2004). En todos estos casos se pueden realizar previsiones de riesgo mediante la asignación de
los individuos a unos perfiles de los que se conoce un patrón de comportamiento, tras analizar unas
variables clave.
Asimismo, en la realización de estudios de mercados puede ayudar a mostrar cambios en las
tendencias de consumo a gran escala de un país.
En Medicina puede mostrar patrones entre enfermos de la misma dolencia, y ver la evolución de
epidemias en grandes poblaciones. También en disciplinas como la Astronomía, la Bio-informática y la
Genética ayuda a estudiar las grandes cantidades de datos con que se trabaja.
Otros campos concretos donde la integración de bases de datos y el desarrollo de actividades de
minería de datos sería útil, son la posibilidad de compartir datos de investigación científica y de la
administración pública para la seguridad ciudadana (Clifton; Doan; Elmagarmid; Kantarcioglu;
Schadow; Suciu; Vaidya, 2004).
En otro sector totalmente diferente, Ma (Ma; Liu; Wong; Yu; Lee, 2000) presentan una aplicación para
el desarrollo de minería de datos en educación con la finalidad de localizar, de manera muy precisa,
estudiantes que necesitan clases de apoyo de una determinada materia.
En bibliotecas, la minería de datos puede resultar igualmente muy útil para la toma de decisiones
basadas en la evidencia, aún cuando se manejan cantidades de datos mucho menores (Guenther,
2000).

Weitere ähnliche Inhalte

Was ist angesagt?

Teoría de la Información (Tema 1)
Teoría de la Información (Tema 1) Teoría de la Información (Tema 1)
Teoría de la Información (Tema 1) luisalfredotayupoveg1
 
Gerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningGerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningNicoleaks
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kddYaz_Cuapio
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textosJesús Tramullas
 
Minería de datos
Minería de datosMinería de datos
Minería de datosKeopx
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual dataPamela Paz
 
Data Mining
Data MiningData Mining
Data Miningbrobelo
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datossaibelr
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisMundo Contact
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datoselsemieni
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 

Was ist angesagt? (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Md session1
Md session1Md session1
Md session1
 
Teoría de la Información (Tema 1)
Teoría de la Información (Tema 1) Teoría de la Información (Tema 1)
Teoría de la Información (Tema 1)
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Gerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningGerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data Mining
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Minig text and audiovisual data
Minig text and audiovisual dataMinig text and audiovisual data
Minig text and audiovisual data
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Data Mining
Data MiningData Mining
Data Mining
 
Organizacion de datos
Organizacion de datosOrganizacion de datos
Organizacion de datos
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Ensayo sobre data mining
Ensayo sobre data miningEnsayo sobre data mining
Ensayo sobre data mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 

Andere mochten auch

Dr Yousef Elshrek is One co-authors in this study >>>> Global, regional, and...
Dr Yousef Elshrek is  One co-authors in this study >>>> Global, regional, and...Dr Yousef Elshrek is  One co-authors in this study >>>> Global, regional, and...
Dr Yousef Elshrek is One co-authors in this study >>>> Global, regional, and...Univ. of Tripoli
 
March 13, 2015
March 13, 2015March 13, 2015
March 13, 2015khyps13
 
March 3, 2015
March 3, 2015March 3, 2015
March 3, 2015khyps13
 
April 22, 2015
April 22, 2015April 22, 2015
April 22, 2015khyps13
 
Eric Jordan at Solespace 2015
Eric Jordan at Solespace 2015Eric Jordan at Solespace 2015
Eric Jordan at Solespace 2015glennhirsch
 

Andere mochten auch (7)

Dr Yousef Elshrek is One co-authors in this study >>>> Global, regional, and...
Dr Yousef Elshrek is  One co-authors in this study >>>> Global, regional, and...Dr Yousef Elshrek is  One co-authors in this study >>>> Global, regional, and...
Dr Yousef Elshrek is One co-authors in this study >>>> Global, regional, and...
 
March 13, 2015
March 13, 2015March 13, 2015
March 13, 2015
 
We .jpg
We .jpgWe .jpg
We .jpg
 
On designing automatic reaction strategy for critical infrastructure scada sy...
On designing automatic reaction strategy for critical infrastructure scada sy...On designing automatic reaction strategy for critical infrastructure scada sy...
On designing automatic reaction strategy for critical infrastructure scada sy...
 
March 3, 2015
March 3, 2015March 3, 2015
March 3, 2015
 
April 22, 2015
April 22, 2015April 22, 2015
April 22, 2015
 
Eric Jordan at Solespace 2015
Eric Jordan at Solespace 2015Eric Jordan at Solespace 2015
Eric Jordan at Solespace 2015
 

Ähnlich wie MINERIA DE DATOS

Minería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y TendenciasMinería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y Tendenciastravon1
 
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
La gestión de datos de investigación en el  horizonte de las bibliotecas de i...La gestión de datos de investigación en el  horizonte de las bibliotecas de i...
La gestión de datos de investigación en el horizonte de las bibliotecas de i...Julio Alonso Arévalo
 
Información en conocimiento xavier polanco
Información en conocimiento xavier polancoInformación en conocimiento xavier polanco
Información en conocimiento xavier polancoJERZXANDER12
 
Apoyo de la mineria de datos a la vt
Apoyo de la mineria de datos a  la vtApoyo de la mineria de datos a  la vt
Apoyo de la mineria de datos a la vtOscarAngelesSnchez
 
La informática médica y los sistemas de información
La informática médica y los sistemas de informaciónLa informática médica y los sistemas de información
La informática médica y los sistemas de informaciónSilvia Restrepo
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosLuis Fernando Aguas Bucheli
 
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdfDialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdfJairo Almeida
 
Gestión del conocimiento y minería de datos
Gestión del conocimiento y minería de datosGestión del conocimiento y minería de datos
Gestión del conocimiento y minería de datosUniversidad de Belgrano
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesMaría Sánchez González (@cibermarikiya)
 
Optimización de base de datos ACCESS - Metodología de la Investigación
Optimización de base de datos ACCESS - Metodología de la InvestigaciónOptimización de base de datos ACCESS - Metodología de la Investigación
Optimización de base de datos ACCESS - Metodología de la InvestigaciónAlfredo Humberto Escalante Godinez
 
Arquitectura de datos empresariales actividad 2
Arquitectura de datos empresariales   actividad 2Arquitectura de datos empresariales   actividad 2
Arquitectura de datos empresariales actividad 2CarlosTenelema1
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 

Ähnlich wie MINERIA DE DATOS (20)

27009 26933-1-pb
27009 26933-1-pb27009 26933-1-pb
27009 26933-1-pb
 
Minería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y TendenciasMinería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y Tendencias
 
Gestión de datos de investigación (gdi) (1)
Gestión de datos de investigación (gdi) (1)Gestión de datos de investigación (gdi) (1)
Gestión de datos de investigación (gdi) (1)
 
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
La gestión de datos de investigación en el  horizonte de las bibliotecas de i...La gestión de datos de investigación en el  horizonte de las bibliotecas de i...
La gestión de datos de investigación en el horizonte de las bibliotecas de i...
 
Información en conocimiento xavier polanco
Información en conocimiento xavier polancoInformación en conocimiento xavier polanco
Información en conocimiento xavier polanco
 
Apoyo de la mineria de datos a la vt
Apoyo de la mineria de datos a  la vtApoyo de la mineria de datos a  la vt
Apoyo de la mineria de datos a la vt
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Lozano william rl_1
Lozano william rl_1Lozano william rl_1
Lozano william rl_1
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
La informática médica y los sistemas de información
La informática médica y los sistemas de informaciónLa informática médica y los sistemas de información
La informática médica y los sistemas de información
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
Big data-grupo-7
Big data-grupo-7Big data-grupo-7
Big data-grupo-7
 
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdfDialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
Dialnet-MineriaDeDatosAplicadaAlAnalisisBibliometricoDescr-6652723.pdf
 
Gestión del conocimiento y minería de datos
Gestión del conocimiento y minería de datosGestión del conocimiento y minería de datos
Gestión del conocimiento y minería de datos
 
3709 13911-1-pb
3709 13911-1-pb3709 13911-1-pb
3709 13911-1-pb
 
2019-T9 Data Science
2019-T9 Data Science2019-T9 Data Science
2019-T9 Data Science
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
 
Optimización de base de datos ACCESS - Metodología de la Investigación
Optimización de base de datos ACCESS - Metodología de la InvestigaciónOptimización de base de datos ACCESS - Metodología de la Investigación
Optimización de base de datos ACCESS - Metodología de la Investigación
 
Arquitectura de datos empresariales actividad 2
Arquitectura de datos empresariales   actividad 2Arquitectura de datos empresariales   actividad 2
Arquitectura de datos empresariales actividad 2
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 

Kürzlich hochgeladen

Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxMaritzaRetamozoVera
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxlclcarmen
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFAROJosé Luis Palma
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoFundación YOD YOD
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdfDemetrio Ccesa Rayme
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arteRaquel Martín Contreras
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMarjorie Burga
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...JAVIER SOLIS NOYOLA
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticosisabeltrejoros
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdfBaker Publishing Company
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosCesarFernandez937857
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dstEphaniiie
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 

Kürzlich hochgeladen (20)

Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docx
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
 
Heinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativoHeinsohn Privacidad y Ciberseguridad para el sector educativo
Heinsohn Privacidad y Ciberseguridad para el sector educativo
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdf
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arte
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
texto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticostexto argumentativo, ejemplos y ejercicios prácticos
texto argumentativo, ejemplos y ejercicios prácticos
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf
 
Informatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos BásicosInformatica Generalidades - Conceptos Básicos
Informatica Generalidades - Conceptos Básicos
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Power Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptxPower Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptx
 

MINERIA DE DATOS

  • 1. Minería de datos: conceptualización y utilidad La minería de datos es una actividad que está a medio camino entre la Informática, la Estadística y la Documentación, y que se ha estado utilizando en numerosas disciplinas para el análisis de grandes cantidades de datos. En bibliotecas, su práctica está poco extendida a pesar las múltiples aplicaciones que tiene. El objetivo de este artículo es hacer una introducción teórica a la minería de datos para profundizar después en su aplicación en bibliotecas, presentándose éstas como un campo ideal de trabajo. De esta aplicación, denominada en inglés bibliomining (término para cuya traducción al español se propone emplear "bibliominería"), se explican brevemente algunos de los usos prácticos, que van desde la evaluación de bibliotecas, la planificación de adquisiciones, la organización de la colección y los estudios de usuarios. Otra de las aplicaciones de mayor interés es la elaboración de sistemas de recomendaciones tal y como se vienen aplicando en servicios web, y que entra en el campo de la llamada Biblioteca 2.0 (en inglés Library 2.0). La bibliominería, al igual que cualquier actividad de minería de datos, entraña ciertos problemas respecto a la privacidad. Aquí se presentan algunas de las posibles medidas a tomar al respecto. Conceptualización El gran crecimiento de las bases de datos y el aumento de las capacidades de almacenamiento de información, han hecho que todo tipo de organizaciones puedan disponer de una gran cantidad y variedad de datos relativos a su actividad diaria. En muchas de estas organizaciones se han dado cuenta del potencial que tiene esta información para el apoyo a la gestión. Su estudio permite ver la evolución y desarrollo de las organizaciones, y por lo tanto, trazar una línea de tendencia que muestre por dónde pueden moverse en un futuro. Así, el estudio de los datos y la información almacenados en las bases de datos ofrece una visión perspectiva (qué se está haciendo y cómo se está haciendo) y prospectiva (cómo puede evolucionar la organización en un futuro a corto-medio plazo) de la organización, y es por ello por lo que tiene una función de apoyo a la toma de decisiones. Este estudio de las bases de datos ha sido, y es, mucho más común en organizaciones económicas y empresariales, desde supermercados hasta grandes multinacionales, pero también organismos científicos que manejan grandes cantidades de información han visto la utilidad de este tipo de estudios. Debido a que la información en las bases de datos está más desestructurada (siguiendo el modelo DIKW)2 que en otras fuentes de información, para su utilización es necesario un proceso de tratamiento y análisis exhaustivo. Estas tareas de análisis de la información de las bases de datos se denominan minería de datos (en inglés data mining) o descubrimiento de información en bases de datos (en inglés knowledge discovery in databases o KDD)3. Bajo esta perspectiva Hand, Mannila y Smyth definen minería de datos como "la ciencia de extracción de información útil de grandes conjuntos de datos o de bases de datos" (Hand et al., 2001). Para algunos autores minería de datos y KDD se refieren a lo mismo, mientras que para otros KDD se refiere a un proceso de varias fases, entre las que se encuentra la minería de datos (Hernández et al., 2004). Tal como señalan Fayyad, Piatetsky-Shapiro y Smyth, la gran cantidad de datos que se almacenan en las organizaciones hace imposible la utilización de métodos manuales para su análisis (Fayyad et al., 1996). Por ello son necesarias técnicas y herramientas informáticas capaces de ayudar al hombre de forma "inteligente" y "automática" en el análisis de grandes cantidades de datos. Estos mismos autores aportan la definición de minería más citada en la literatura sobre el tema: "minería de datos es un proceso no trivial de identificación de patrones de datos válidos, nuevos, potencialmente usables y comprensibles". Es decir, se trata de un proceso concreto, específico, con un objetivo, que busca identificar repeticiones y/o tendencias en un conjunto de datos que resulten útiles y sean veraces. Para Hernández Orallo, Ramírez Quintana y Ferri Ramírez (Hernández et al., 2004), en
  • 2. esta definición se resumen las propiedades del conocimiento extraído: válido, novedoso, potencialmente útil y comprensible. Este proceso de minería de datos, Fayyad, Piatetsky-Shapiro y Smyth (Fayyad et al., 1996) lo descomponen en nueve fases lineales e iterativas, del mismo modo, Kudyba y Hoptroff lo hacen desde el punto de vista empresarial (Kudyba; Hoptroff, 2001). Estas fases, aunque con distinta denominación, consisten en tres operaciones: definición de la información que se pretende obtener, toma y procesamiento de datos, análisis de los resultados, obtención y consolidación de nueva información. En el campo de las bibliotecas, Guenther, basándose en Brethenoux y Strange, simplifica las fases resumiéndolas en tres (Guenther, 2000): •Selección y adquisición de datos: definir qué datos se quieren recopilar y qué método o procedimiento se va a usar para ello. •Preparación y proceso de datos. •Interpretación e integración (de los resultados). En cualquiera de todos estos pasos, y en cualquiera de las propuestas consultadas, el proceso fundamental es el de la selección de los datos. Si el conjunto de datos (o bases de datos) a utilizar no es el adecuado para el tipo de análisis que se pretende llevar a cabo, el éxito del proceso de minería de datos se verá frustrado. El proceso de la minería de datos es similar al proceso de elaboración de una estadística, que para Montañá (Montañá Lacambra, 2005) pasa también por tres fases: la recopilación de los datos, su procesamiento y la difusión del resultado final. Si bien el producto final de las estadísticas es una de las materias primas de la minería de datos. El primer impulso importante para el desarrollo de esta disciplina se dio en The First International Conference on Knowledge Discovery and Data Mining (KDD-95) dentro de la Fourteenth International Joint Conference on Artificial Intelligence (IJCAI-95), coordinada por Usama Fayyad y Ramasamy Uthurusamy. Por ese entonces el propio Fayyad, junto con Simoudis, definían minería de datos (aunque predominaba el uso de la expresiónknowledge discovery in databases) como "un campo emergente que combina técnicas de aprendizaje-máquina, reconocimiento de patrones, estadística, bases de datos y visualización para extraer automáticamente conceptos, conceptos interrelacionados, y patrones de interés desde grandes bases de datos. Su tarea principal es la extracción de conocimiento (o información) de datos de bajo nivel (bases de datos)" (Fayyad; Simoudis, 1995). Así pues, la minería de datos es un campo inicialmente relacionado con la Inteligencia Artificial y la Estadística, en el que la Documentación y demás Ciencias de la Información han participado posteriormente, desde el punto de vista de la administración y gestión (management) de centros de información, y como parte de las tareas de gestión de la información y del conocimiento. De este modo, la minería de datos supone una reivindicación del valor de las fuentes de datos estadísticas para la gestión. Utilidad de la minería de datos Actualmente, la minería de datos es una actividad en expansión aplicada cada vez en más disciplinas, que han visto la utilidad del estudio de datos para apoyar la toma de decisiones. Especial énfasis está teniendo en aquellas áreas relacionadas con la Economía, mediante la Econometría, y dentro del campo de inteligencia de los negocios. El caso más tratado (y tomado como referencia para explicar diferentes tipos de algoritmos de minería de datos) es el de los supermercados (Agrawal; Imielinski; Swami, 1993) (Brin; Motwani; Ullman; Tsur, 1997) (Chi-Wing Wong; Wai-Chee Fu; Wang, 2005) (Hernández et al., 2004), ya que conocer el perfil de compra de los clientes puede ayudar a organizar el stock. De un modo similar, aunque más exhaustiva, es su utilización en comercio electrónico (Kohavi, 2001) (Kohavi; Provost, 2001), ya que en este caso es posible obtener mucha más información del comportamiento global del cliente, y no sólo conocer las compras. A su vez, y en el paso anterior en la cadena de producción, los proveedores y distribuidores pueden planificar la producción conforme a la demanda. Sin embargo, aunque eficiente, este modelo de actuación muestra su debilidad en momentos de excepción, como los casos de
  • 3. supermercados desabastecidos por no disponer de stock durante huelgas, o la incapacidad de hacer frente a grandes demandas en momentos de crisis (equipamiento y material tras el paso del huracán Katrina o el hundimiento del petrolero Prestige). También relacionados con la Economía, son los estudios para evitar pérdidas de clientes y fraudes (mediante la detección de cambios de comportamiento sospechosos) (Fawcett; Provost, 1997) (Cox; Eick; Wills; Brachman, 1997), así como la concesión de créditos rápidos y de seguros (Hernández et al., 2004). En todos estos casos se pueden realizar previsiones de riesgo mediante la asignación de los individuos a unos perfiles de los que se conoce un patrón de comportamiento, tras analizar unas variables clave. Asimismo, en la realización de estudios de mercados puede ayudar a mostrar cambios en las tendencias de consumo a gran escala de un país. En Medicina puede mostrar patrones entre enfermos de la misma dolencia, y ver la evolución de epidemias en grandes poblaciones. También en disciplinas como la Astronomía, la Bio-informática y la Genética ayuda a estudiar las grandes cantidades de datos con que se trabaja. Otros campos concretos donde la integración de bases de datos y el desarrollo de actividades de minería de datos sería útil, son la posibilidad de compartir datos de investigación científica y de la administración pública para la seguridad ciudadana (Clifton; Doan; Elmagarmid; Kantarcioglu; Schadow; Suciu; Vaidya, 2004). En otro sector totalmente diferente, Ma (Ma; Liu; Wong; Yu; Lee, 2000) presentan una aplicación para el desarrollo de minería de datos en educación con la finalidad de localizar, de manera muy precisa, estudiantes que necesitan clases de apoyo de una determinada materia. En bibliotecas, la minería de datos puede resultar igualmente muy útil para la toma de decisiones basadas en la evidencia, aún cuando se manejan cantidades de datos mucho menores (Guenther, 2000).