SlideShare ist ein Scribd-Unternehmen logo
1 von 56
Las 53 Claves para conocer Machine
Learning…
… desde las trincheras
#1
Machine Learning es un ‘subcampo’
de la Inteligencia Artificial
#2
El nombre de ‘Machine Learning’
deriva del ‘Estudio de sistemas que
pueden aprender de los datos’
#3
Machine Learning es la capacidad de
un sistema para generalizar usando la
experiencia.
Consiste en el uso de estas
generalizaciones para dar respuesta a
las ‘cuestiones del futuro’
#4
En Machine Learning existen
algoritmos ‘supervisados’ que son
transparentes para los seres humanos,
en los que somos capaces de seguir el
razonamiento detrás de la
generalización
#5
Ejemplos de Algoritmos Supervisados:
- Arboles de Decisión
- Métodos basados en normas
#6
Algoritmos no transparentes para los
humanos o de aprendizaje no
supervisado serían las redes
neuronales o Máquinas de vectores
de soporte entre otros
#7
El primer indicio de Machine Learning
viene de 1950, con el ‘Test de Turing’
para determinar si una máquina podía
tener inteligencia real
#8
En 1967 se codifica el algoritmo del
vecino más cercano, permitiendo a
un computador a empezar a usar el
reconocimiento de patrones,
permitiendo resolver problemas como
el del agente viajero
#9
En 2011 Google desarrolla Google
Brain , su red neuronal es capaz de
descubrir y categorizar objetos
#10
Machine Learning trata con
problemas tales como la clasificación:
reconocer las etiquetas de datos,
dados dichos datos o predecir una
clase dadas las observaciones
#11
Machine Learning resuelve problemas
de agrupamiento de datos similares
de forma conjunta, conocido como
Clustering
#12
Machine Learning trata con
problemas tales como la regresión, en
la que se predice una característica
dadas otras
#13
En Machine Learning se trabaja
normalmente con un conjunto de
datos de entrenamiento y otro de test
#14
En el aprendizaje supervisado, el
número correcto de clases objetivo
del conjunto de entrenamiento es
conocido
#15
En el aprendizaje no supervisado el
número correcto de clases objetivo
del conjunto de entrenamiento es
desconocido
#16
Dentro de la clasificación uno de los
algoritmos más populares es el de
‘Bayes ingenuo’
#17
Dentro de la clasificación uno de los
algoritmos más populares es el de
‘Bayes ingenuo’
#17
Existen 2 tipos de variable en Machine
Learning:
Variable objetivo o clase sobre la que
se quiere realizar una predicción y
variables explicativas de entrada que
sirve para explicar el comportamiento
de la variable objetivo
#18
La clasificación se puede utilizar para
predecir un tipo de tumor dado un
conjunto de datos de entrenamiento:
benigno o maligno
#19
La regresión se utilizará por ejemplo
para predecir el precio de una
vivienda dado un juego de datos de
entrenamiento
#20
Si nuestro objetivo es predecir un
número real o variable de naturaleza
continua entonces utilizaremos
regresión
#21
Si nuestro problema tiene una variable
objetivo discreta o categórica
entonces se resolverá utilizando
clasificación
#22
Weka (Pentaho Data Mining) es una
herramienta open source basada
para el aprendizaje automático que
incluye muchos algoritmos
predefinidos
#23
En Python existen paquetes orientados
a machine learning: scikit-learn,
pandas, Pylearn2…
#24
Si utilizamos R disponemos de varias
librerías dedicadas a ML: e1071, rpart,
igraph, nnet, randomForest, caret,
kernlab, gbm, earth, mboost….
#25
Herramientas de Machine Learning
con Big Data: Apache Mahout, MLib
que opera sobre Apache Spark
#26
Las redes neuronales son un
paradigma de aprendizaje
automático inspirado en la forma en
que funciona el sistema nervioso de los
animales
#27
En 1957 Frank Rosenblatt diseña la
primera red neuronal (el perceptrón)
que simula los procesos de
pensamiento del cerebro humano
#28
Amazon y Netflix usan sistemas de
recomendación para acertar en los
gustos de sus clientes. Uno de los
algoritmos empleados en estos
sistemas es el K-vecinos más cercanos
#29
Para el análisis de sentimientos se
utilizan técnicas de procesamiento de
lenguajes naturales
#30
Deep learning es la utilización de
algoritmos para hacer
representaciones abstractas de
información y facilitar el aprendizaje
automático.
#31
Esto permite que una máquina, a
partir de esos patrones de datos, sea
capaz de reconocer el habla, el
movimiento, una señal o una imagen.
#32
En 1997 IBM’s Deep Blue gana al
campeón mundial de ajedrez.
#33
Aplicaciones del Machine Learning:
Medicina, Bioinformática, Marketing,
Procesamiento del Lenguaje Natural,
Procesamiento de imágenes, Visión
artificial, Detección de Spam…
#34
En Machine Learning, para obtener un
gran modelo, se deben elegir bien el
método y los parámetros relacionados
con él. Esto suele ser tarea de un
Científico de datos
#35
Es fundamental comprender como
traducir los problemas de negocio en
algoritmos de Machine Learning
#36
Si hablamos de Machine Learning en
la actualidad, R es el lenguaje de
programación más popular en el
campo académico y Python en la
empresa privada
#37
Amazon lanza su propia plataforma
de Machine Learning en 2015.
Amazon Machine Learning
#38
El Machine Learning se apoya entre
otros en los siguientes campos de las
matemáticas: Álgebra lineal, cálculo ,
teoría de la probabilidad y teoría de
grafos
#39
Es fundamental eliminar el ruido y el
sesgo de nuestros juegos de datos
para aplicar algoritmos Machine
Learning
#40
C4.5 es un algoritmo utilizado para
generar un árbol de decisión. Los
árboles de decisión pueden ser usados
para clasificación y, por esto, nos
solemos referir a C4.5 como un
clasificador estadístico
#41
Hay que ser cuidadoso de no realizar
un sobreajuste de nuestro modelo al
conjunto de entrenamiento , puesto
que obtendríamos un rendimiento
pobre en nuestras predicciones
#42
Top 10 algoritmos Machine Learning :
C4.5, k-means, Support vector
machines, Apriori, EM , PageRank,
AdaBoost, k-nearest neighbours class,
Naïve Bayes, CART
#43
PageRank es una familia de
algoritmos utilizados para asignar de
forma numérica la relevancia de las
páginas web indexadas por un motor
de búsqueda
#44
El Método de alisado exponencial es
una forma de pronosticar la demanda
de un producto en un periodo dado
#45
En esta técnica se estima que la
demanda será igual a, por ejemplo, la
media de los consumos históricos para
un periodo dado, dando una mayor
ponderación a los valores más
cercanos en el tiempo
#46
El algoritmo apriori se usa para
encontrar Reglas de asociación en un
conjunto de datos. Este algoritmo se
basa en el conocimiento previo o “a
priori” de los conjuntos frecuentes,
esto sirve para reducir el espacio de
búsqueda y aumentar la eficiencia
#47
Lo mágico del Machine Learning es su
capacidad de construir y adaptar un
árbol de decisiones en base a los
datos conocidos, y de aplicar además
fórmulas heurísticas en cada nodo del
árbol, construyendo un sistema de
inferencias
#48
El algoritmo Adaptative Boosting
(AdaBoost) propone entrenar
iterativamente una serie de
clasificadores base
#49
De tal modo que cada nuevo
clasificador preste mayor atención a
los datos clasificados erróneamente
por los clasificadores anteriores, y
combinarlos de tal modo que se
obtenga un clasificador con elevadas
prestaciones
#50
Una de las medidas más utilizadas
para comparar la calidad de los
algoritmos es la raíz del error
cuadrático medio (RMSE) de la
predicción sobre la variable a
predecir
#51
Para visualizar los datos se utilizan
librerías como AmCharts, Raphael,
Protovis o Flare
#52
En el aprendizaje genético se aplican
algoritmos inspirados en la teoría de la
evolución para encontrar
descripciones generales a conjuntos
de ejemplos
#53
Se utilizan técnicas de Machine
Learning para problemas tan distintos
como el reconocimiento facial o la
predicción de terremotos
Stratebi: Quiénes somos
www.TodoBI.com
info@stratebi.com
www.stratebi.com
Mas información
Tfno: 91.770.68.50
Madrid: Pº de la Castellana, 164, 1º
Barcelona: C/ Valencia, 63
Brasil: Av. Paulista, 37 4 andar

Weitere ähnliche Inhalte

Was ist angesagt?

Computacion diapositivas
Computacion diapositivasComputacion diapositivas
Computacion diapositivasWaleskaEscobar1
 
Jornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big DataJornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big DataUrko Zurutuza
 
Data Science, Big Data, Machine Learning, ecosistema de conceptos
Data Science, Big Data, Machine Learning, ecosistema de conceptosData Science, Big Data, Machine Learning, ecosistema de conceptos
Data Science, Big Data, Machine Learning, ecosistema de conceptosBeatriz Martín @zigiella
 
Data Mining. Extracción de Conocimiento en Grandes Bases de Datos
Data Mining. Extracción de Conocimiento en Grandes Bases de DatosData Mining. Extracción de Conocimiento en Grandes Bases de Datos
Data Mining. Extracción de Conocimiento en Grandes Bases de DatosRoberto Espinosa
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantesCarlos Toxtli
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopEduardo Castro
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Stratebi
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesJuan José Domenech
 
Machine learning for dummies - Azuges November 2016
Machine learning for dummies - Azuges November 2016Machine learning for dummies - Azuges November 2016
Machine learning for dummies - Azuges November 2016Carlos Landeras Martínez
 

Was ist angesagt? (13)

USO DE MAXQDA Y ATLASTI
USO DE MAXQDA Y ATLASTIUSO DE MAXQDA Y ATLASTI
USO DE MAXQDA Y ATLASTI
 
Computacion diapositivas
Computacion diapositivasComputacion diapositivas
Computacion diapositivas
 
Jornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big DataJornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big Data
 
Big Data & RRHH
Big Data & RRHHBig Data & RRHH
Big Data & RRHH
 
Data Science, Big Data, Machine Learning, ecosistema de conceptos
Data Science, Big Data, Machine Learning, ecosistema de conceptosData Science, Big Data, Machine Learning, ecosistema de conceptos
Data Science, Big Data, Machine Learning, ecosistema de conceptos
 
Data Mining. Extracción de Conocimiento en Grandes Bases de Datos
Data Mining. Extracción de Conocimiento en Grandes Bases de DatosData Mining. Extracción de Conocimiento en Grandes Bases de Datos
Data Mining. Extracción de Conocimiento en Grandes Bases de Datos
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantes
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre Hadoop
 
Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)Big Data Open Source Analytics (español)
Big Data Open Source Analytics (español)
 
Big Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patronesBig Data - Conceptos, herramientas y patrones
Big Data - Conceptos, herramientas y patrones
 
Big Data y Business Intelligence con Software Open Source
Big Data y Business Intelligence con Software Open SourceBig Data y Business Intelligence con Software Open Source
Big Data y Business Intelligence con Software Open Source
 
Machine learning
Machine learningMachine learning
Machine learning
 
Machine learning for dummies - Azuges November 2016
Machine learning for dummies - Azuges November 2016Machine learning for dummies - Azuges November 2016
Machine learning for dummies - Azuges November 2016
 

Andere mochten auch

Introduccion a Cassandra
Introduccion a CassandraIntroduccion a Cassandra
Introduccion a CassandraStratebi
 
Del bit al big data
Del bit al big dataDel bit al big data
Del bit al big dataPowerData
 
Apache Storm: Introduccion
Apache Storm: IntroduccionApache Storm: Introduccion
Apache Storm: IntroduccionStratebi
 
Overview sap bo girona nib efimatica
Overview sap bo girona nib efimaticaOverview sap bo girona nib efimatica
Overview sap bo girona nib efimaticaEfimatica
 
Instalación y Configuración de Pentaho BI y MySQL
Instalación y Configuración de Pentaho BI y MySQLInstalación y Configuración de Pentaho BI y MySQL
Instalación y Configuración de Pentaho BI y MySQLT.I.C
 
Manual de instalación de pentaho para windows 7
Manual de instalación de pentaho para windows 7Manual de instalación de pentaho para windows 7
Manual de instalación de pentaho para windows 7German Pinchao
 
Comparativa herramientas Business Intelligence
Comparativa herramientas Business IntelligenceComparativa herramientas Business Intelligence
Comparativa herramientas Business IntelligenceStratebi
 

Andere mochten auch (7)

Introduccion a Cassandra
Introduccion a CassandraIntroduccion a Cassandra
Introduccion a Cassandra
 
Del bit al big data
Del bit al big dataDel bit al big data
Del bit al big data
 
Apache Storm: Introduccion
Apache Storm: IntroduccionApache Storm: Introduccion
Apache Storm: Introduccion
 
Overview sap bo girona nib efimatica
Overview sap bo girona nib efimaticaOverview sap bo girona nib efimatica
Overview sap bo girona nib efimatica
 
Instalación y Configuración de Pentaho BI y MySQL
Instalación y Configuración de Pentaho BI y MySQLInstalación y Configuración de Pentaho BI y MySQL
Instalación y Configuración de Pentaho BI y MySQL
 
Manual de instalación de pentaho para windows 7
Manual de instalación de pentaho para windows 7Manual de instalación de pentaho para windows 7
Manual de instalación de pentaho para windows 7
 
Comparativa herramientas Business Intelligence
Comparativa herramientas Business IntelligenceComparativa herramientas Business Intelligence
Comparativa herramientas Business Intelligence
 

Ähnlich wie 53 Claves para conocer Machine Learning

Clase Inteligencia Artificial Unidad 3
Clase Inteligencia Artificial Unidad 3Clase Inteligencia Artificial Unidad 3
Clase Inteligencia Artificial Unidad 3K Reyes
 
Qué es el machine learning aplicado a geologia.docx
Qué es el machine learning aplicado a geologia.docxQué es el machine learning aplicado a geologia.docx
Qué es el machine learning aplicado a geologia.docxmariamore9
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Ana Delgado
 
Metodo de Busquedas de IA.pdf
Metodo de Busquedas de IA.pdfMetodo de Busquedas de IA.pdf
Metodo de Busquedas de IA.pdfoswnarly
 
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmosManual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmosSpacetoshare
 
El Libro de la Inteligencia Artificial (versión 5)
El Libro de la Inteligencia Artificial (versión 5)El Libro de la Inteligencia Artificial (versión 5)
El Libro de la Inteligencia Artificial (versión 5)Alfredo Vela Zancada
 
El Libro de la Inteligencia Artificial (versión 8)
El Libro de la Inteligencia Artificial (versión 8)El Libro de la Inteligencia Artificial (versión 8)
El Libro de la Inteligencia Artificial (versión 8)Alfredo Vela Zancada
 
Minería de datos
Minería de datosMinería de datos
Minería de datosanag catal
 
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdfAprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdfGerard Alba
 
Aprendizaje Automatizado
Aprendizaje AutomatizadoAprendizaje Automatizado
Aprendizaje AutomatizadoVivian Lainez
 
SISTEMAS BASADOS EN EL CONOCIMIENTO
SISTEMAS BASADOS EN EL CONOCIMIENTOSISTEMAS BASADOS EN EL CONOCIMIENTO
SISTEMAS BASADOS EN EL CONOCIMIENTOLUIS5111987
 
SISTEMAS BASADOS EN CONOCIMIENTOS
SISTEMAS BASADOS EN CONOCIMIENTOSSISTEMAS BASADOS EN CONOCIMIENTOS
SISTEMAS BASADOS EN CONOCIMIENTOSLUIS5111987
 

Ähnlich wie 53 Claves para conocer Machine Learning (20)

Introducción a machine learning
Introducción a machine learningIntroducción a machine learning
Introducción a machine learning
 
Estudiante
EstudianteEstudiante
Estudiante
 
Machine Learning para Todos
Machine Learning para TodosMachine Learning para Todos
Machine Learning para Todos
 
Clase Inteligencia Artificial Unidad 3
Clase Inteligencia Artificial Unidad 3Clase Inteligencia Artificial Unidad 3
Clase Inteligencia Artificial Unidad 3
 
Qué es el machine learning aplicado a geologia.docx
Qué es el machine learning aplicado a geologia.docxQué es el machine learning aplicado a geologia.docx
Qué es el machine learning aplicado a geologia.docx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Machine Learning.pptx
Machine Learning.pptxMachine Learning.pptx
Machine Learning.pptx
 
Metodo de Busquedas de IA.pdf
Metodo de Busquedas de IA.pdfMetodo de Busquedas de IA.pdf
Metodo de Busquedas de IA.pdf
 
Manual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmosManual de análisis y diseño de algoritmos
Manual de análisis y diseño de algoritmos
 
El Libro de la Inteligencia Artificial (versión 5)
El Libro de la Inteligencia Artificial (versión 5)El Libro de la Inteligencia Artificial (versión 5)
El Libro de la Inteligencia Artificial (versión 5)
 
El Libro de la Inteligencia Artificial (versión 8)
El Libro de la Inteligencia Artificial (versión 8)El Libro de la Inteligencia Artificial (versión 8)
El Libro de la Inteligencia Artificial (versión 8)
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdfAprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
 
Aprendizaje Automatizado
Aprendizaje AutomatizadoAprendizaje Automatizado
Aprendizaje Automatizado
 
ahora
ahoraahora
ahora
 
SISTEMAS BASADOS EN EL CONOCIMIENTO
SISTEMAS BASADOS EN EL CONOCIMIENTOSISTEMAS BASADOS EN EL CONOCIMIENTO
SISTEMAS BASADOS EN EL CONOCIMIENTO
 
SISTEMAS BASADOS EN CONOCIMIENTOS
SISTEMAS BASADOS EN CONOCIMIENTOSSISTEMAS BASADOS EN CONOCIMIENTOS
SISTEMAS BASADOS EN CONOCIMIENTOS
 

Mehr von Stratebi

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentesStratebi
 
Azure Synapse
Azure SynapseAzure Synapse
Azure SynapseStratebi
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with PythonStratebi
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with PythonStratebi
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasStratebi
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup SpainStratebi
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)Stratebi
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integrationStratebi
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data MarketingStratebi
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works Stratebi
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data AnalyticsStratebi
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosStratebi
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports AnalyticsStratebi
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme AnalysisStratebi
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIStratebi
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overviewStratebi
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalleStratebi
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con TalendStratebi
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend IntroducionStratebi
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent AnalyticsStratebi
 

Mehr von Stratebi (20)

Destinos turisticos inteligentes
Destinos turisticos inteligentesDestinos turisticos inteligentes
Destinos turisticos inteligentes
 
Azure Synapse
Azure SynapseAzure Synapse
Azure Synapse
 
Options for Dashboards with Python
Options for Dashboards with PythonOptions for Dashboards with Python
Options for Dashboards with Python
 
Dashboards with Python
Dashboards with PythonDashboards with Python
Dashboards with Python
 
PowerBI Tips y buenas practicas
PowerBI Tips y buenas practicasPowerBI Tips y buenas practicas
PowerBI Tips y buenas practicas
 
Machine Learning Meetup Spain
Machine Learning Meetup SpainMachine Learning Meetup Spain
Machine Learning Meetup Spain
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)
 
SAP - PowerBI integration
SAP - PowerBI integrationSAP - PowerBI integration
SAP - PowerBI integration
 
Aplicaciones Big Data Marketing
Aplicaciones Big Data MarketingAplicaciones Big Data Marketing
Aplicaciones Big Data Marketing
 
A federated information infrastructure that works
A federated information infrastructure that works A federated information infrastructure that works
A federated information infrastructure that works
 
9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics9 problemas en proyectos Data Analytics
9 problemas en proyectos Data Analytics
 
PowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y CursosPowerBI: Soluciones, Aplicaciones y Cursos
PowerBI: Soluciones, Aplicaciones y Cursos
 
Sports Analytics
Sports AnalyticsSports Analytics
Sports Analytics
 
Vertica Extreme Analysis
Vertica Extreme AnalysisVertica Extreme Analysis
Vertica Extreme Analysis
 
Businesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBIBusinesss Intelligence con Vertica y PowerBI
Businesss Intelligence con Vertica y PowerBI
 
Vertica Analytics Database general overview
Vertica Analytics Database general overviewVertica Analytics Database general overview
Vertica Analytics Database general overview
 
Talend Cloud en detalle
Talend Cloud en detalleTalend Cloud en detalle
Talend Cloud en detalle
 
Master Data Management (MDM) con Talend
Master Data Management (MDM) con TalendMaster Data Management (MDM) con Talend
Master Data Management (MDM) con Talend
 
Talend Introducion
Talend IntroducionTalend Introducion
Talend Introducion
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent Analytics
 

Kürzlich hochgeladen

Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosEstefaniaRojas54
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfPOULANDERSONDELGADOA2
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllJulietaCarbajalOsis
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalMarcosAlvarezSalinas
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 

Kürzlich hochgeladen (20)

Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajal
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 

53 Claves para conocer Machine Learning

  • 1. Las 53 Claves para conocer Machine Learning… … desde las trincheras
  • 2. #1 Machine Learning es un ‘subcampo’ de la Inteligencia Artificial
  • 3. #2 El nombre de ‘Machine Learning’ deriva del ‘Estudio de sistemas que pueden aprender de los datos’
  • 4. #3 Machine Learning es la capacidad de un sistema para generalizar usando la experiencia. Consiste en el uso de estas generalizaciones para dar respuesta a las ‘cuestiones del futuro’
  • 5. #4 En Machine Learning existen algoritmos ‘supervisados’ que son transparentes para los seres humanos, en los que somos capaces de seguir el razonamiento detrás de la generalización
  • 6. #5 Ejemplos de Algoritmos Supervisados: - Arboles de Decisión - Métodos basados en normas
  • 7. #6 Algoritmos no transparentes para los humanos o de aprendizaje no supervisado serían las redes neuronales o Máquinas de vectores de soporte entre otros
  • 8. #7 El primer indicio de Machine Learning viene de 1950, con el ‘Test de Turing’ para determinar si una máquina podía tener inteligencia real
  • 9. #8 En 1967 se codifica el algoritmo del vecino más cercano, permitiendo a un computador a empezar a usar el reconocimiento de patrones, permitiendo resolver problemas como el del agente viajero
  • 10. #9 En 2011 Google desarrolla Google Brain , su red neuronal es capaz de descubrir y categorizar objetos
  • 11. #10 Machine Learning trata con problemas tales como la clasificación: reconocer las etiquetas de datos, dados dichos datos o predecir una clase dadas las observaciones
  • 12. #11 Machine Learning resuelve problemas de agrupamiento de datos similares de forma conjunta, conocido como Clustering
  • 13. #12 Machine Learning trata con problemas tales como la regresión, en la que se predice una característica dadas otras
  • 14. #13 En Machine Learning se trabaja normalmente con un conjunto de datos de entrenamiento y otro de test
  • 15. #14 En el aprendizaje supervisado, el número correcto de clases objetivo del conjunto de entrenamiento es conocido
  • 16. #15 En el aprendizaje no supervisado el número correcto de clases objetivo del conjunto de entrenamiento es desconocido
  • 17. #16 Dentro de la clasificación uno de los algoritmos más populares es el de ‘Bayes ingenuo’
  • 18. #17 Dentro de la clasificación uno de los algoritmos más populares es el de ‘Bayes ingenuo’
  • 19. #17 Existen 2 tipos de variable en Machine Learning: Variable objetivo o clase sobre la que se quiere realizar una predicción y variables explicativas de entrada que sirve para explicar el comportamiento de la variable objetivo
  • 20. #18 La clasificación se puede utilizar para predecir un tipo de tumor dado un conjunto de datos de entrenamiento: benigno o maligno
  • 21. #19 La regresión se utilizará por ejemplo para predecir el precio de una vivienda dado un juego de datos de entrenamiento
  • 22. #20 Si nuestro objetivo es predecir un número real o variable de naturaleza continua entonces utilizaremos regresión
  • 23. #21 Si nuestro problema tiene una variable objetivo discreta o categórica entonces se resolverá utilizando clasificación
  • 24. #22 Weka (Pentaho Data Mining) es una herramienta open source basada para el aprendizaje automático que incluye muchos algoritmos predefinidos
  • 25. #23 En Python existen paquetes orientados a machine learning: scikit-learn, pandas, Pylearn2…
  • 26. #24 Si utilizamos R disponemos de varias librerías dedicadas a ML: e1071, rpart, igraph, nnet, randomForest, caret, kernlab, gbm, earth, mboost….
  • 27. #25 Herramientas de Machine Learning con Big Data: Apache Mahout, MLib que opera sobre Apache Spark
  • 28. #26 Las redes neuronales son un paradigma de aprendizaje automático inspirado en la forma en que funciona el sistema nervioso de los animales
  • 29. #27 En 1957 Frank Rosenblatt diseña la primera red neuronal (el perceptrón) que simula los procesos de pensamiento del cerebro humano
  • 30. #28 Amazon y Netflix usan sistemas de recomendación para acertar en los gustos de sus clientes. Uno de los algoritmos empleados en estos sistemas es el K-vecinos más cercanos
  • 31. #29 Para el análisis de sentimientos se utilizan técnicas de procesamiento de lenguajes naturales
  • 32. #30 Deep learning es la utilización de algoritmos para hacer representaciones abstractas de información y facilitar el aprendizaje automático.
  • 33. #31 Esto permite que una máquina, a partir de esos patrones de datos, sea capaz de reconocer el habla, el movimiento, una señal o una imagen.
  • 34. #32 En 1997 IBM’s Deep Blue gana al campeón mundial de ajedrez.
  • 35. #33 Aplicaciones del Machine Learning: Medicina, Bioinformática, Marketing, Procesamiento del Lenguaje Natural, Procesamiento de imágenes, Visión artificial, Detección de Spam…
  • 36. #34 En Machine Learning, para obtener un gran modelo, se deben elegir bien el método y los parámetros relacionados con él. Esto suele ser tarea de un Científico de datos
  • 37. #35 Es fundamental comprender como traducir los problemas de negocio en algoritmos de Machine Learning
  • 38. #36 Si hablamos de Machine Learning en la actualidad, R es el lenguaje de programación más popular en el campo académico y Python en la empresa privada
  • 39. #37 Amazon lanza su propia plataforma de Machine Learning en 2015. Amazon Machine Learning
  • 40. #38 El Machine Learning se apoya entre otros en los siguientes campos de las matemáticas: Álgebra lineal, cálculo , teoría de la probabilidad y teoría de grafos
  • 41. #39 Es fundamental eliminar el ruido y el sesgo de nuestros juegos de datos para aplicar algoritmos Machine Learning
  • 42. #40 C4.5 es un algoritmo utilizado para generar un árbol de decisión. Los árboles de decisión pueden ser usados para clasificación y, por esto, nos solemos referir a C4.5 como un clasificador estadístico
  • 43. #41 Hay que ser cuidadoso de no realizar un sobreajuste de nuestro modelo al conjunto de entrenamiento , puesto que obtendríamos un rendimiento pobre en nuestras predicciones
  • 44. #42 Top 10 algoritmos Machine Learning : C4.5, k-means, Support vector machines, Apriori, EM , PageRank, AdaBoost, k-nearest neighbours class, Naïve Bayes, CART
  • 45. #43 PageRank es una familia de algoritmos utilizados para asignar de forma numérica la relevancia de las páginas web indexadas por un motor de búsqueda
  • 46. #44 El Método de alisado exponencial es una forma de pronosticar la demanda de un producto en un periodo dado
  • 47. #45 En esta técnica se estima que la demanda será igual a, por ejemplo, la media de los consumos históricos para un periodo dado, dando una mayor ponderación a los valores más cercanos en el tiempo
  • 48. #46 El algoritmo apriori se usa para encontrar Reglas de asociación en un conjunto de datos. Este algoritmo se basa en el conocimiento previo o “a priori” de los conjuntos frecuentes, esto sirve para reducir el espacio de búsqueda y aumentar la eficiencia
  • 49. #47 Lo mágico del Machine Learning es su capacidad de construir y adaptar un árbol de decisiones en base a los datos conocidos, y de aplicar además fórmulas heurísticas en cada nodo del árbol, construyendo un sistema de inferencias
  • 50. #48 El algoritmo Adaptative Boosting (AdaBoost) propone entrenar iterativamente una serie de clasificadores base
  • 51. #49 De tal modo que cada nuevo clasificador preste mayor atención a los datos clasificados erróneamente por los clasificadores anteriores, y combinarlos de tal modo que se obtenga un clasificador con elevadas prestaciones
  • 52. #50 Una de las medidas más utilizadas para comparar la calidad de los algoritmos es la raíz del error cuadrático medio (RMSE) de la predicción sobre la variable a predecir
  • 53. #51 Para visualizar los datos se utilizan librerías como AmCharts, Raphael, Protovis o Flare
  • 54. #52 En el aprendizaje genético se aplican algoritmos inspirados en la teoría de la evolución para encontrar descripciones generales a conjuntos de ejemplos
  • 55. #53 Se utilizan técnicas de Machine Learning para problemas tan distintos como el reconocimiento facial o la predicción de terremotos
  • 56. Stratebi: Quiénes somos www.TodoBI.com info@stratebi.com www.stratebi.com Mas información Tfno: 91.770.68.50 Madrid: Pº de la Castellana, 164, 1º Barcelona: C/ Valencia, 63 Brasil: Av. Paulista, 37 4 andar