SlideShare ist ein Scribd-Unternehmen logo
1 von 47
Introducción al
Machine Learning o
Aprendizaje Automático
Contenidos
• Introducción
• Técnicas
– Clasificación
– Clustering
– Regresión
• Casos de Uso y Herramientas
2
Introducción al Machine Learning
Introducción
• Es un campo de la Inteligencia Artificial
• Su nombre está derivado del concepto que trata
con la construcción y estudio de sistemas que
aprenden de los datos.
• Es un concepto teórico en el que existen varias
técnicas con múltiples implementaciones.
• http://es.wikipedia.org/wiki/Machine_learning
En otras palabras…
“Un programa de ordenador se dice que es
capaz de aprender de la experiencia (E) con
una serie de tareas (T) y una medida del
rendimiento (P) si su desempeño en las
tareas T mejora con E”
Terminología
• Características/Rasgos
– Nº de características o rasgos distintos que se pueden utilizar para
describir cada elemento de una manera cuantitativa
• Muestras/Ejemplos
– Una muestra es un elemento a procesar (por ejemplo clasificar).
Puede ser un documento, una foto, un vídeo, una fila en una base de
datos o cualquier cosa que podamos describir con un número fijo de
rasgos cuantitativos
• Vector de características
– Vector n-dimensional con características numéricas que representan
un objeto
• Extracción de Características
– Preparación del vector de características
– Transforma los datos en un espacio con alta dimensionalidad a un
espacio con menos dimensiones
• Conjunto de Entrenamiento/Evolución
– Conjunto de datos destinado a descubrir relaciones predictivas.
Manzana
Qué quieres decir con…
Vamos a profundizar un poco…
Aprendizaje (Training)
Características (Features):
1. Color: Rojo
2. Tipo: Fruta
3. Forma: Redonda
4. Comestible: Si
etc…
Características:
1. Azul cielo
2. Logotipo
3. Redondo
4. No
etc…
Características:
1. Verde
2. Fruta
3. Redonda
4. Si
etc…
Flujo
a) Entrenamiento: Conjunto de entrenamiento con datos
etiquetados (variable objetivo conocida/etiquetada)
b) Predicción: Conjunto de test con variable objetivo desconocida
Categorías
• Aprendizaje Supervisado
• Aprendizaje No Supervisado
• Aprendizaje Semisupervisado
• Aprendizaje por refuerzo
Aprendizaje Supervisado
• Las clases correctas del conjunto de datos de
entrenamiento son conocidas
Aprendizaje Supervisado
• Secuencias de ADN con etiquetas binarias que indican si cada
secuencia se centra en una zona de inicio de transcripción (TSS) o no.
Aprendizaje No Supervisado
• Las clases correctas del conjunto de datos de
entrenamiento no son conocidas
Aprendizaje Semisupervisado
• Mezcla de aprendizaje Supervisado y No Supervisado
Aprendizaje por Refuerzo
• Permite al programa o agente software aprender su
comportamiento basado en la información que recibe del entorno.
• Este comportamiento se puede aprender de una sola vez, o ir
adaptándose con el paso del tiempo.
Técnicas de Machine Learning
Técnicas
• Clasificación: predecir una clase con las
observaciones
• Clustering: agrupar las observaciones en
grupos significativos
• Regresión (predicción): predecir un valor con
las observaciones
Clasificación
• Clasificar un documento en una categoría predefinida
• Los documentos pueden ser texto, imágenes
Ejemplo: Clasificador Bayesiano Ingenuo.
• Pasos:
– Paso 1: Entrenar el programa (construir un modelo) usando el
conjunto de entrenamiento con una categoría conocida por
ejemplo : deportes, política, economía, sucesos …
• El clasificador calculara la probabilidad de cada palabra, la probabilidad
es lo que hará a un documento pertenecer a una de las categorías
consideradas.
– Paso 2: Probar el modelo construido con el conjunto de datos de
test.
• https://es.wikipedia.org/wiki/Clasificador_bayesiano_ingenuo
Clustering
• Clustering es la tarea de agrupar un conjunto de
objetos de tal manera que los objetos en el mismo
grupo (llamado clúster) son más similares entre sí.
• Por ejemplo con estas palabras clave
– “zapatos de hombre”
– “zapatos de mujer”
– “camisetas de mujer”
– “camisetas de hombre”
– Pueden ser agrupadas en 2 categorías “zapatos” y
“camisetas” o “hombre” y “mujer”
• Los métodos más populares son clustering K-medias y
clustering Jerárquico.
Clustering K-medias
https://es.wikipedia.org/wiki/K-means
• Tiene como objetivo la partición de un conjunto de n observaciones
en k clusters en el que cada observación pertenece al grupo más
cercano a la media.
Clustering Jerárquico
• Método de análisis de grupos el cual busca construir
una jerarquía de grupos.
• Existen 2 estrategias:
– Aglomerativas:
• Enfoque ascendente: cada observación comienza en su propio
grupo, y los pares de grupos son mezclados mientras uno sube en
la jerarquía
• Su complejidad temporal es de O(n^3)
– Divisivas:
• Aproximación descendente: todas las observaciones comienzan en
un grupo, y se realizan particiones a medida que bajamos en la
jerarquía.
• Su complejidad temporal es de O(2^n)
https://es.wikipedia.org/wiki/Agrupamiento_jerárquico
Regresión
• Es una medida de la relación entre
una variable dependiente (por
ejemplo la salida) y los valores de una
serie de variables independientes
(por ejemplo: tiempo y coste)
• El analisis de la regresión es un
proceso estadístico para estimar las
relaciones entre las variables.
• Regresión significa predecir la salida
o resultado usando los datos de
entrenamiento.
• Es popular la regresión logística
(regresión binaria)
• https://es.wikipedia.org/wiki/Regresión_logística
Clasificación vs Regresión
• Clasificar significa agrupar
la resultados de salida en
una clase.
• Usar clasificación para
predecir el tipo de un
tumor (maligno o
benigno) a partir de los
datos de entrenamiento
• Si la variable es
discreta/categórica,
entonces estamos ante un
problema de clasificación
• Regresión significa
predecir el valor de salida
utilizando los datos de
entrenamiento.
• Usar regresión para
predecir el precio de la
vivienda a partir de los
datos de entrenamiento
• Si nuestra objetivo es un
nº real/continuo, estamos
ante un problema de
regresión.
Clasificación vs Regresión
Casos de Uso y Herramientas
Casos de Uso
• Detección de Spam: Hotmail, Yahoo, Gmail
• Traducción Automática: Google Translate
• Búsqueda de Imágenes Similares: Google
Reverse image search
• Clustering (KMeans) : Recomendaciones de
Amazon
• Clasificación: Google News
Continúa..
Casos de Uso (continuación)
• Resumen de textos- Google News
• Puntuación de una crítica/comentario: Yelp
• Detección de Fraude: Visa/MasterCard
• Toma de decisiones: Banca/Seguros
• Análisis de sentimientos: Twitter, Facebook
• Reconocimiento de voz: Siri en iPhone
• Reconocimiento Facial: Etiquetado en fotos
de Facebook
Clasificación en Acción
¿No es fácil?
No, no es fácil (Carpeta de Correo no deseado)
No es
Spam
No es
Spam
Reconocimiento de nombres de entidades
Idiomas soportados por herramienta:
• NLTK: Inglés.
• Stanford: Inglés, Español, Chino y Árabe.
• OpenNLP: Inglés, Español, Alemán y Holandés.
• Polyglot-NER: 40 principales idiomas (Inglés, Español, Francés, Ruso,
Polaco, Portugués, Italiano, Holandés. Árabe, Hebreo, Japonés,
Vietnamita, …)
Reconocimiento de nombres de entidades
Imágenes Similares/Duplicadas
Recuerda
¿Características?
Extracción de características:
• Anchura
• Altura
• Contraste
• Brillo
• Posición
• Matiz
• Colores
Información Extra:
Librería LIRE (Lucene Image
REtrieval)
http://www.lire-project.net/
Recomendaciones
Gestión de Inventario
• Serie temporal con las unidades vendidas de un
determinado artículo.
• Información disponible: 38 meses desde Junio
2012 – Agosto 2015
Gestión de Inventario
• Descomponemos la serie original en componentes Y[t] = T[t] + S[t] + e[t]
– Componente estacional (S[t])  Oscilaciones con periodicidad anual o
submúltiplos del año
– Componente Tendencial (T[t])  Recoge la parte de la variable vinculada
principalmente con factores de largo plazo.
– Componente de Irregular/Error (e[t])  Se determina al quitar los
componentes estacional y el tendencial de la serie original
Gestión de Inventario
• Predicción utilizando el método ARIMA .
• ARIMA es un modelo estadístico que utiliza
variaciones y regresiones de datos estadísticos con
el fin de encontrar patrones para una predicción
hacia el futuro.
Gestión de Inventario
• Holt-Winters es un método de alisado exponencial que
tiene en cuenta el componente de tendencia (método de
Holt, extensión del método de alisado exponencial simple)
y el componente estacional (extensión por Winters del
método de Holt)
Gestión de Inventario
La predicción de Holt-Winters incluye 3 series
temporales:
• Ajustada
• Superior
• Inferior
Diagnóstico del cáncer de pecho
Redes Neuronales para el diagnóstico de tumores
malignos o benignos.
Herramientas y Frameworks
• Scikit-learn, Pandas, TensorFlow - Python
• Weka – Herramienta con una colección de algoritmos
• OpenNLP – Procesamiento del Lenguaje natural Java
• LingPipe – Procesamiento de texto con lingüística
computacional
• Stanford NLP – Procesamiento del Lenguaje Natural
• Mallet – Modelado de Temas
• Gensim – Modelado de Temas - Python
• LIBSVM : Máquinas de vectores de soporte - Python
Herramientas y Frameworks
• Apache Mahout – Librerías ML Big Data
designadas para ser escalables
• MLib , Spark ML – ML Big Data con Apache Spark
• forecast : Predicción con series temporales – R
• nnet : Redes neuronales – R
• arules – Reglas de asociación – R
• randomForest – Clasificación y regresión
utilizando bosques aleatorios – R
• Carrot2 – Clustering de resultados de búsquedas
Machine Learning - Big Data
Machine Learning aplicado al Big Data
Conceptos Avanzados
• Modelado de Temas
• Búsqueda Semántica
• Descomposición en valores singulares (SVD)
• Resumen/Recapitulación
Sector Privado
Referencias y Datos de Contacto
Sector Público
Referencias y Datos de Contacto
www.TodoBI.com
info@stratebi.com
www.stratebi.com
Mas información
Tfno: 91.788.34.10
Madrid: Avenida de Brasil, 17, Planta 16
Barcelona: C/ Valencia, 63
Brasil: Av. Paulista, 37 4 andar

Weitere ähnliche Inhalte

Was ist angesagt?

Protocolos De Contencion
Protocolos De ContencionProtocolos De Contencion
Protocolos De Contencionpaulino2
 
Data mining: Classification and prediction
Data mining: Classification and predictionData mining: Classification and prediction
Data mining: Classification and predictionDataminingTools Inc
 
DATA WRANGLING presentation.pptx
DATA WRANGLING presentation.pptxDATA WRANGLING presentation.pptx
DATA WRANGLING presentation.pptxAbdullahAbbasi55
 
Machine learning introduction
Machine learning introductionMachine learning introduction
Machine learning introductionAnas Jamil
 
Fundamentos de bpm gestion de procesos de negocio control y mejora
Fundamentos de bpm   gestion  de procesos de negocio control y mejoraFundamentos de bpm   gestion  de procesos de negocio control y mejora
Fundamentos de bpm gestion de procesos de negocio control y mejoraMeinzul ND
 
Machine learning life cycle
Machine learning life cycleMachine learning life cycle
Machine learning life cycleRamjee Ganti
 
Seguridad En Sistemas Distribuidos
Seguridad En Sistemas DistribuidosSeguridad En Sistemas Distribuidos
Seguridad En Sistemas DistribuidosHECTOR JAVIER
 
Machine Learning Algorithms
Machine Learning AlgorithmsMachine Learning Algorithms
Machine Learning AlgorithmsDezyreAcademy
 
Modelo supervisado knn
Modelo supervisado knnModelo supervisado knn
Modelo supervisado knnMaryRojas59
 
Introduction to Python for Data Science
Introduction to Python for Data ScienceIntroduction to Python for Data Science
Introduction to Python for Data ScienceArc & Codementor
 
Sistemas críticos - Ingeniería de Sistemas
Sistemas críticos - Ingeniería de SistemasSistemas críticos - Ingeniería de Sistemas
Sistemas críticos - Ingeniería de SistemasUniminuto - San Francisco
 
Sistemas Operativos I- Algoritmo de QUANTUM
Sistemas Operativos I- Algoritmo de QUANTUMSistemas Operativos I- Algoritmo de QUANTUM
Sistemas Operativos I- Algoritmo de QUANTUMMari Cruz
 
Machine-Learning-A-Z-Course-Downloadable-Slides-V1.5.pdf
Machine-Learning-A-Z-Course-Downloadable-Slides-V1.5.pdfMachine-Learning-A-Z-Course-Downloadable-Slides-V1.5.pdf
Machine-Learning-A-Z-Course-Downloadable-Slides-V1.5.pdfMaris R
 
Data science.chapter-1,2,3
Data science.chapter-1,2,3Data science.chapter-1,2,3
Data science.chapter-1,2,3varshakumar21
 

Was ist angesagt? (20)

Antecedentes de los sistemas distribuidos.
Antecedentes de los sistemas distribuidos.Antecedentes de los sistemas distribuidos.
Antecedentes de los sistemas distribuidos.
 
Machine Learning.pptx
Machine Learning.pptxMachine Learning.pptx
Machine Learning.pptx
 
Protocolos De Contencion
Protocolos De ContencionProtocolos De Contencion
Protocolos De Contencion
 
Data mining: Classification and prediction
Data mining: Classification and predictionData mining: Classification and prediction
Data mining: Classification and prediction
 
DATA WRANGLING presentation.pptx
DATA WRANGLING presentation.pptxDATA WRANGLING presentation.pptx
DATA WRANGLING presentation.pptx
 
Machine learning introduction
Machine learning introductionMachine learning introduction
Machine learning introduction
 
Big data
Big dataBig data
Big data
 
Fundamentos de bpm gestion de procesos de negocio control y mejora
Fundamentos de bpm   gestion  de procesos de negocio control y mejoraFundamentos de bpm   gestion  de procesos de negocio control y mejora
Fundamentos de bpm gestion de procesos de negocio control y mejora
 
Decision tree
Decision treeDecision tree
Decision tree
 
Machine learning life cycle
Machine learning life cycleMachine learning life cycle
Machine learning life cycle
 
01 Data Mining: Concepts and Techniques, 2nd ed.
01 Data Mining: Concepts and Techniques, 2nd ed.01 Data Mining: Concepts and Techniques, 2nd ed.
01 Data Mining: Concepts and Techniques, 2nd ed.
 
Seguridad En Sistemas Distribuidos
Seguridad En Sistemas DistribuidosSeguridad En Sistemas Distribuidos
Seguridad En Sistemas Distribuidos
 
Machine Learning Algorithms
Machine Learning AlgorithmsMachine Learning Algorithms
Machine Learning Algorithms
 
Modelo supervisado knn
Modelo supervisado knnModelo supervisado knn
Modelo supervisado knn
 
Introduction to Python for Data Science
Introduction to Python for Data ScienceIntroduction to Python for Data Science
Introduction to Python for Data Science
 
Sistemas críticos - Ingeniería de Sistemas
Sistemas críticos - Ingeniería de SistemasSistemas críticos - Ingeniería de Sistemas
Sistemas críticos - Ingeniería de Sistemas
 
Sistemas Operativos I- Algoritmo de QUANTUM
Sistemas Operativos I- Algoritmo de QUANTUMSistemas Operativos I- Algoritmo de QUANTUM
Sistemas Operativos I- Algoritmo de QUANTUM
 
Machine-Learning-A-Z-Course-Downloadable-Slides-V1.5.pdf
Machine-Learning-A-Z-Course-Downloadable-Slides-V1.5.pdfMachine-Learning-A-Z-Course-Downloadable-Slides-V1.5.pdf
Machine-Learning-A-Z-Course-Downloadable-Slides-V1.5.pdf
 
Data science.chapter-1,2,3
Data science.chapter-1,2,3Data science.chapter-1,2,3
Data science.chapter-1,2,3
 
Frames
FramesFrames
Frames
 

Ähnlich wie Introducción al ML

Machine Learning.pptx
Machine Learning.pptxMachine Learning.pptx
Machine Learning.pptxManuel Duque
 
CIITEC Fundamentos de Deep Learning.pptx
CIITEC  Fundamentos de Deep Learning.pptxCIITEC  Fundamentos de Deep Learning.pptx
CIITEC Fundamentos de Deep Learning.pptxicebeam7
 
Ingeniería de requerimientos i
Ingeniería de requerimientos iIngeniería de requerimientos i
Ingeniería de requerimientos iPablo Macon
 
Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial Gina Mejía
 
Introduccion-de-Machine-Learning-Con-Python (2).pptx
Introduccion-de-Machine-Learning-Con-Python (2).pptxIntroduccion-de-Machine-Learning-Con-Python (2).pptx
Introduccion-de-Machine-Learning-Con-Python (2).pptxJorge293
 
Universidad de oriente- Técnicas y herramientas de desarrollo de software
Universidad de oriente- Técnicas y herramientas de desarrollo de softwareUniversidad de oriente- Técnicas y herramientas de desarrollo de software
Universidad de oriente- Técnicas y herramientas de desarrollo de softwareRosmar Pinto
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxAnonymousEoGAaTF
 
Dise   ños investigaci-  ón corta (1)
Dise   ños investigaci-  ón corta (1)Dise   ños investigaci-  ón corta (1)
Dise   ños investigaci-  ón corta (1)Frances Domenech
 
Aplicaciones Difusas: Aprendizaje Supervisado-Problemas Clasificación
Aplicaciones Difusas: Aprendizaje Supervisado-Problemas ClasificaciónAplicaciones Difusas: Aprendizaje Supervisado-Problemas Clasificación
Aplicaciones Difusas: Aprendizaje Supervisado-Problemas ClasificaciónLuis Fernando Aguas Bucheli
 
2.Recolección y analisis de datos cualitativos
2.Recolección y analisis de datos cualitativos2.Recolección y analisis de datos cualitativos
2.Recolección y analisis de datos cualitativosEdison Coimbra G.
 
#HablemosDeTestingDay - Ángel Nuñez: Agile Test Strategy
#HablemosDeTestingDay - Ángel Nuñez: Agile Test Strategy#HablemosDeTestingDay - Ángel Nuñez: Agile Test Strategy
#HablemosDeTestingDay - Ángel Nuñez: Agile Test StrategyHablemosDeTesting
 
Aprendizaje Automàtico - Introduccion a Machine Learning
Aprendizaje Automàtico - Introduccion a Machine LearningAprendizaje Automàtico - Introduccion a Machine Learning
Aprendizaje Automàtico - Introduccion a Machine LearningHugo Median Rivas
 
ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1
ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1
ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1CARLOS MASSUH
 
13 desarrollo-de-software-fundamentos-poo-1
13 desarrollo-de-software-fundamentos-poo-113 desarrollo-de-software-fundamentos-poo-1
13 desarrollo-de-software-fundamentos-poo-1johnny herrera
 
Desarrollo de Software fundamentos POO 1era Parte subido JHS
Desarrollo de Software fundamentos POO 1era Parte subido JHSDesarrollo de Software fundamentos POO 1era Parte subido JHS
Desarrollo de Software fundamentos POO 1era Parte subido JHSjohnny herrera
 
Herramientas y Frameworks para el desarrollo de AI
Herramientas y Frameworks para el desarrollo de AIHerramientas y Frameworks para el desarrollo de AI
Herramientas y Frameworks para el desarrollo de AICarl W. Handlin
 
Clase3 Programación Orientada a Objetos
Clase3 Programación Orientada a ObjetosClase3 Programación Orientada a Objetos
Clase3 Programación Orientada a Objetosdesimartinez
 

Ähnlich wie Introducción al ML (20)

Machine Learning.pptx
Machine Learning.pptxMachine Learning.pptx
Machine Learning.pptx
 
CIITEC Fundamentos de Deep Learning.pptx
CIITEC  Fundamentos de Deep Learning.pptxCIITEC  Fundamentos de Deep Learning.pptx
CIITEC Fundamentos de Deep Learning.pptx
 
Ingeniería de requerimientos i
Ingeniería de requerimientos iIngeniería de requerimientos i
Ingeniería de requerimientos i
 
MTI. CLASE 6.pptx
MTI. CLASE 6.pptxMTI. CLASE 6.pptx
MTI. CLASE 6.pptx
 
Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial
 
Introduccion-de-Machine-Learning-Con-Python (2).pptx
Introduccion-de-Machine-Learning-Con-Python (2).pptxIntroduccion-de-Machine-Learning-Con-Python (2).pptx
Introduccion-de-Machine-Learning-Con-Python (2).pptx
 
Universidad de oriente- Técnicas y herramientas de desarrollo de software
Universidad de oriente- Técnicas y herramientas de desarrollo de softwareUniversidad de oriente- Técnicas y herramientas de desarrollo de software
Universidad de oriente- Técnicas y herramientas de desarrollo de software
 
Fundamentos IA
Fundamentos IAFundamentos IA
Fundamentos IA
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
 
Dise   ños investigaci-  ón corta (1)
Dise   ños investigaci-  ón corta (1)Dise   ños investigaci-  ón corta (1)
Dise   ños investigaci-  ón corta (1)
 
Aplicaciones Difusas: Aprendizaje Supervisado-Problemas Clasificación
Aplicaciones Difusas: Aprendizaje Supervisado-Problemas ClasificaciónAplicaciones Difusas: Aprendizaje Supervisado-Problemas Clasificación
Aplicaciones Difusas: Aprendizaje Supervisado-Problemas Clasificación
 
2.Recolección y analisis de datos cualitativos
2.Recolección y analisis de datos cualitativos2.Recolección y analisis de datos cualitativos
2.Recolección y analisis de datos cualitativos
 
#HablemosDeTestingDay - Ángel Nuñez: Agile Test Strategy
#HablemosDeTestingDay - Ángel Nuñez: Agile Test Strategy#HablemosDeTestingDay - Ángel Nuñez: Agile Test Strategy
#HablemosDeTestingDay - Ángel Nuñez: Agile Test Strategy
 
Aprendizaje Automàtico - Introduccion a Machine Learning
Aprendizaje Automàtico - Introduccion a Machine LearningAprendizaje Automàtico - Introduccion a Machine Learning
Aprendizaje Automàtico - Introduccion a Machine Learning
 
ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1
ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1
ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1
 
13 desarrollo-de-software-fundamentos-poo-1
13 desarrollo-de-software-fundamentos-poo-113 desarrollo-de-software-fundamentos-poo-1
13 desarrollo-de-software-fundamentos-poo-1
 
Desarrollo de Software fundamentos POO 1era Parte subido JHS
Desarrollo de Software fundamentos POO 1era Parte subido JHSDesarrollo de Software fundamentos POO 1era Parte subido JHS
Desarrollo de Software fundamentos POO 1era Parte subido JHS
 
Herramientas y Frameworks para el desarrollo de AI
Herramientas y Frameworks para el desarrollo de AIHerramientas y Frameworks para el desarrollo de AI
Herramientas y Frameworks para el desarrollo de AI
 
Clase3 Programación Orientada a Objetos
Clase3 Programación Orientada a ObjetosClase3 Programación Orientada a Objetos
Clase3 Programación Orientada a Objetos
 
Proceso de obtención de datos
Proceso de obtención de datosProceso de obtención de datos
Proceso de obtención de datos
 

Mehr von Stratebi

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentesStratebi
 
Azure Synapse
Azure SynapseAzure Synapse
Azure SynapseStratebi
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with PythonStratebi
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with PythonStratebi
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasStratebi
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup SpainStratebi
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)Stratebi
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integrationStratebi
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data MarketingStratebi
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works Stratebi
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data AnalyticsStratebi
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosStratebi
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports AnalyticsStratebi
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme AnalysisStratebi
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIStratebi
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overviewStratebi
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalleStratebi
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con TalendStratebi
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend IntroducionStratebi
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent AnalyticsStratebi
 

Mehr von Stratebi (20)

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentes
 
Azure Synapse
Azure SynapseAzure Synapse
Azure Synapse
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with Python
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with Python
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicas
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup Spain
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integration
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data Marketing
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y Cursos
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports Analytics
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme Analysis
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBI
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overview
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalle
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con Talend
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend Introducion
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent Analytics
 

Kürzlich hochgeladen

Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalMarcosAlvarezSalinas
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfINFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfMiguelGomez900779
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdfJC Díaz Herrera
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllJulietaCarbajalOsis
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaRosaHurtado26
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfPOULANDERSONDELGADOA2
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxCristianCastro978067
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 

Kürzlich hochgeladen (20)

Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajal
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfINFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 

Introducción al ML

  • 1. Introducción al Machine Learning o Aprendizaje Automático
  • 2. Contenidos • Introducción • Técnicas – Clasificación – Clustering – Regresión • Casos de Uso y Herramientas 2
  • 4. Introducción • Es un campo de la Inteligencia Artificial • Su nombre está derivado del concepto que trata con la construcción y estudio de sistemas que aprenden de los datos. • Es un concepto teórico en el que existen varias técnicas con múltiples implementaciones. • http://es.wikipedia.org/wiki/Machine_learning
  • 5. En otras palabras… “Un programa de ordenador se dice que es capaz de aprender de la experiencia (E) con una serie de tareas (T) y una medida del rendimiento (P) si su desempeño en las tareas T mejora con E”
  • 6. Terminología • Características/Rasgos – Nº de características o rasgos distintos que se pueden utilizar para describir cada elemento de una manera cuantitativa • Muestras/Ejemplos – Una muestra es un elemento a procesar (por ejemplo clasificar). Puede ser un documento, una foto, un vídeo, una fila en una base de datos o cualquier cosa que podamos describir con un número fijo de rasgos cuantitativos • Vector de características – Vector n-dimensional con características numéricas que representan un objeto • Extracción de Características – Preparación del vector de características – Transforma los datos en un espacio con alta dimensionalidad a un espacio con menos dimensiones • Conjunto de Entrenamiento/Evolución – Conjunto de datos destinado a descubrir relaciones predictivas.
  • 7. Manzana Qué quieres decir con… Vamos a profundizar un poco…
  • 8. Aprendizaje (Training) Características (Features): 1. Color: Rojo 2. Tipo: Fruta 3. Forma: Redonda 4. Comestible: Si etc… Características: 1. Azul cielo 2. Logotipo 3. Redondo 4. No etc… Características: 1. Verde 2. Fruta 3. Redonda 4. Si etc…
  • 9. Flujo a) Entrenamiento: Conjunto de entrenamiento con datos etiquetados (variable objetivo conocida/etiquetada) b) Predicción: Conjunto de test con variable objetivo desconocida
  • 10. Categorías • Aprendizaje Supervisado • Aprendizaje No Supervisado • Aprendizaje Semisupervisado • Aprendizaje por refuerzo
  • 11. Aprendizaje Supervisado • Las clases correctas del conjunto de datos de entrenamiento son conocidas
  • 12. Aprendizaje Supervisado • Secuencias de ADN con etiquetas binarias que indican si cada secuencia se centra en una zona de inicio de transcripción (TSS) o no.
  • 13. Aprendizaje No Supervisado • Las clases correctas del conjunto de datos de entrenamiento no son conocidas
  • 14. Aprendizaje Semisupervisado • Mezcla de aprendizaje Supervisado y No Supervisado
  • 15. Aprendizaje por Refuerzo • Permite al programa o agente software aprender su comportamiento basado en la información que recibe del entorno. • Este comportamiento se puede aprender de una sola vez, o ir adaptándose con el paso del tiempo.
  • 17. Técnicas • Clasificación: predecir una clase con las observaciones • Clustering: agrupar las observaciones en grupos significativos • Regresión (predicción): predecir un valor con las observaciones
  • 18. Clasificación • Clasificar un documento en una categoría predefinida • Los documentos pueden ser texto, imágenes Ejemplo: Clasificador Bayesiano Ingenuo. • Pasos: – Paso 1: Entrenar el programa (construir un modelo) usando el conjunto de entrenamiento con una categoría conocida por ejemplo : deportes, política, economía, sucesos … • El clasificador calculara la probabilidad de cada palabra, la probabilidad es lo que hará a un documento pertenecer a una de las categorías consideradas. – Paso 2: Probar el modelo construido con el conjunto de datos de test. • https://es.wikipedia.org/wiki/Clasificador_bayesiano_ingenuo
  • 19. Clustering • Clustering es la tarea de agrupar un conjunto de objetos de tal manera que los objetos en el mismo grupo (llamado clúster) son más similares entre sí. • Por ejemplo con estas palabras clave – “zapatos de hombre” – “zapatos de mujer” – “camisetas de mujer” – “camisetas de hombre” – Pueden ser agrupadas en 2 categorías “zapatos” y “camisetas” o “hombre” y “mujer” • Los métodos más populares son clustering K-medias y clustering Jerárquico.
  • 20. Clustering K-medias https://es.wikipedia.org/wiki/K-means • Tiene como objetivo la partición de un conjunto de n observaciones en k clusters en el que cada observación pertenece al grupo más cercano a la media.
  • 21. Clustering Jerárquico • Método de análisis de grupos el cual busca construir una jerarquía de grupos. • Existen 2 estrategias: – Aglomerativas: • Enfoque ascendente: cada observación comienza en su propio grupo, y los pares de grupos son mezclados mientras uno sube en la jerarquía • Su complejidad temporal es de O(n^3) – Divisivas: • Aproximación descendente: todas las observaciones comienzan en un grupo, y se realizan particiones a medida que bajamos en la jerarquía. • Su complejidad temporal es de O(2^n) https://es.wikipedia.org/wiki/Agrupamiento_jerárquico
  • 22. Regresión • Es una medida de la relación entre una variable dependiente (por ejemplo la salida) y los valores de una serie de variables independientes (por ejemplo: tiempo y coste) • El analisis de la regresión es un proceso estadístico para estimar las relaciones entre las variables. • Regresión significa predecir la salida o resultado usando los datos de entrenamiento. • Es popular la regresión logística (regresión binaria) • https://es.wikipedia.org/wiki/Regresión_logística
  • 23. Clasificación vs Regresión • Clasificar significa agrupar la resultados de salida en una clase. • Usar clasificación para predecir el tipo de un tumor (maligno o benigno) a partir de los datos de entrenamiento • Si la variable es discreta/categórica, entonces estamos ante un problema de clasificación • Regresión significa predecir el valor de salida utilizando los datos de entrenamiento. • Usar regresión para predecir el precio de la vivienda a partir de los datos de entrenamiento • Si nuestra objetivo es un nº real/continuo, estamos ante un problema de regresión.
  • 25. Casos de Uso y Herramientas
  • 26. Casos de Uso • Detección de Spam: Hotmail, Yahoo, Gmail • Traducción Automática: Google Translate • Búsqueda de Imágenes Similares: Google Reverse image search • Clustering (KMeans) : Recomendaciones de Amazon • Clasificación: Google News Continúa..
  • 27. Casos de Uso (continuación) • Resumen de textos- Google News • Puntuación de una crítica/comentario: Yelp • Detección de Fraude: Visa/MasterCard • Toma de decisiones: Banca/Seguros • Análisis de sentimientos: Twitter, Facebook • Reconocimiento de voz: Siri en iPhone • Reconocimiento Facial: Etiquetado en fotos de Facebook
  • 29. No, no es fácil (Carpeta de Correo no deseado) No es Spam No es Spam
  • 30. Reconocimiento de nombres de entidades Idiomas soportados por herramienta: • NLTK: Inglés. • Stanford: Inglés, Español, Chino y Árabe. • OpenNLP: Inglés, Español, Alemán y Holandés. • Polyglot-NER: 40 principales idiomas (Inglés, Español, Francés, Ruso, Polaco, Portugués, Italiano, Holandés. Árabe, Hebreo, Japonés, Vietnamita, …)
  • 32. Imágenes Similares/Duplicadas Recuerda ¿Características? Extracción de características: • Anchura • Altura • Contraste • Brillo • Posición • Matiz • Colores Información Extra: Librería LIRE (Lucene Image REtrieval) http://www.lire-project.net/
  • 34. Gestión de Inventario • Serie temporal con las unidades vendidas de un determinado artículo. • Información disponible: 38 meses desde Junio 2012 – Agosto 2015
  • 35. Gestión de Inventario • Descomponemos la serie original en componentes Y[t] = T[t] + S[t] + e[t] – Componente estacional (S[t])  Oscilaciones con periodicidad anual o submúltiplos del año – Componente Tendencial (T[t])  Recoge la parte de la variable vinculada principalmente con factores de largo plazo. – Componente de Irregular/Error (e[t])  Se determina al quitar los componentes estacional y el tendencial de la serie original
  • 36. Gestión de Inventario • Predicción utilizando el método ARIMA . • ARIMA es un modelo estadístico que utiliza variaciones y regresiones de datos estadísticos con el fin de encontrar patrones para una predicción hacia el futuro.
  • 37. Gestión de Inventario • Holt-Winters es un método de alisado exponencial que tiene en cuenta el componente de tendencia (método de Holt, extensión del método de alisado exponencial simple) y el componente estacional (extensión por Winters del método de Holt)
  • 38. Gestión de Inventario La predicción de Holt-Winters incluye 3 series temporales: • Ajustada • Superior • Inferior
  • 39. Diagnóstico del cáncer de pecho Redes Neuronales para el diagnóstico de tumores malignos o benignos.
  • 40. Herramientas y Frameworks • Scikit-learn, Pandas, TensorFlow - Python • Weka – Herramienta con una colección de algoritmos • OpenNLP – Procesamiento del Lenguaje natural Java • LingPipe – Procesamiento de texto con lingüística computacional • Stanford NLP – Procesamiento del Lenguaje Natural • Mallet – Modelado de Temas • Gensim – Modelado de Temas - Python • LIBSVM : Máquinas de vectores de soporte - Python
  • 41. Herramientas y Frameworks • Apache Mahout – Librerías ML Big Data designadas para ser escalables • MLib , Spark ML – ML Big Data con Apache Spark • forecast : Predicción con series temporales – R • nnet : Redes neuronales – R • arules – Reglas de asociación – R • randomForest – Clasificación y regresión utilizando bosques aleatorios – R • Carrot2 – Clustering de resultados de búsquedas
  • 42. Machine Learning - Big Data
  • 44. Conceptos Avanzados • Modelado de Temas • Búsqueda Semántica • Descomposición en valores singulares (SVD) • Resumen/Recapitulación
  • 45. Sector Privado Referencias y Datos de Contacto
  • 46. Sector Público Referencias y Datos de Contacto
  • 47. www.TodoBI.com info@stratebi.com www.stratebi.com Mas información Tfno: 91.788.34.10 Madrid: Avenida de Brasil, 17, Planta 16 Barcelona: C/ Valencia, 63 Brasil: Av. Paulista, 37 4 andar