SlideShare uma empresa Scribd logo
1 de 11
OBTENÇÃO DE COMBINAÇÃO
ÓTIMA DE CLASSIFICADORES
Rodrigo Pasti
rodrigo.pasti@gmail.com
Realidade...
 Você possui um problema para resolver. Por
um exemplo de
classificação, predição, detecção de
anomalias.
 O que você precisa para resolver um
problema desses?
 1- Saber algumas características do
problema.
 2- Saber que tipo de método pode ser
apropriado para resolvê-lo.
 3- Testar os métodos e escolher o de melhor
desempenho.
Realidade...
 Qual é o grande problema com os passos
descritos anteriormente?
 Teorema No Free Lunch!
 1- Para um problema X, qual o melhor
método?
 2- Supondo que exista um método ótimo.
Quais os conjuntos de seus parâmetros que
permitem gerar um modelo ótimo?
 3- O problema X tem solução satisfatória
com os métodos existentes?
Realidade...
 Agora imagine que você seja uma
especialista em análise e mineração de
dados.
 Toda semana surge um problema desses
para você resolver.
 O que você faz?
 Você faz aqueles três passos anteriores?
Supondo um problema qualquer
 Base de dados X. Objetivo: conseguir um
classificador ótimo ou próximo disso.
 Para gerar um modelo você divide sua base.
Em geral:
 Treinamento, Validação e Teste.
 Treinamento e Teste.
 Qual seria o classificador ótimo?
 Você pode até conseguir um classificador
ótimo para sua base X, mas ele será
realmente ótimo?
Espaço de Classificadores
C
Classificador
Supondo Base X
Espaço de Classificadores
C
Classificador
Supondo Base X Classificador ótimo
Espaço de Classificadores
C
Classificador
Supondo Base X
Classificadores quando
juntos formam um
modelo ótimo
Combinando Classificadores
 Objetivo: busca pela mistura de
classificadores que dá o melhor desempenho
possível.
 Como: explorando o espaço de busca de
classificadores.
 Algoritmos de busca.
 Problema: como misturar os classificadores.
Combinando Classificadores
 Informações únicas presentes em cada
classificador
 Quando em conjunto produzem um melhor
desempenho.
 Por exemplo, dados 10 classificadores e a
base X.
 Para uma amostra de validação, apenas o
classificador 1 acerta. Os demais erram.
 O classificador 1 também possui péssimo
desempenho.
 Tendência: dar pouca importância a ele.
 Problema: perda de informações relevantes.
Objetivo e Solução Candidata
 Objetivo: encontrar um conjunto de
classificadores que acertem todas as
amostras de uma base de validação.
 Representação da solução:
 s = {MLP12,Tree2,Naive1,MLP2,MLP10};
 s = {c1, c2, c3, c4, c5};
 Weka e resultados...

Mais conteúdo relacionado

Semelhante a Combinação de classificadores para obtenção de desempenho ótimo

Machine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & PythonMachine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & PythonGabriel Schade Cardoso
 
Aula resolução de problema Modelagem Ambiental
Aula resolução de problema Modelagem AmbientalAula resolução de problema Modelagem Ambiental
Aula resolução de problema Modelagem AmbientalJean Leão
 
Texto 02 ferr qlide x masp
Texto 02 ferr qlide x maspTexto 02 ferr qlide x masp
Texto 02 ferr qlide x maspschiavi-rs
 
Apostila análise e síntese nível i v01
Apostila análise e síntese   nível i v01Apostila análise e síntese   nível i v01
Apostila análise e síntese nível i v01Gestaointeligente
 
Aprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaAprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaWalter Hugo Lopez Pinaya
 
Resolvendo Problemas
Resolvendo ProblemasResolvendo Problemas
Resolvendo Problemasjacqe
 
Primeira aula sp1
Primeira aula sp1Primeira aula sp1
Primeira aula sp1gastaovalle
 
Introdução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaIntrodução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaFernando Palma
 
Aprendizado de máquina
Aprendizado de máquinaAprendizado de máquina
Aprendizado de máquinaparasite
 
Capítulo 16 Livro Algoritmos e Programação de Computadores Autores JR., Diler...
Capítulo 16 Livro Algoritmos e Programação de Computadores Autores JR., Diler...Capítulo 16 Livro Algoritmos e Programação de Computadores Autores JR., Diler...
Capítulo 16 Livro Algoritmos e Programação de Computadores Autores JR., Diler...Os Fantasmas !
 
Algoritmo Genético para busca de máximo de função
Algoritmo Genético para busca de máximo de funçãoAlgoritmo Genético para busca de máximo de função
Algoritmo Genético para busca de máximo de funçãoDiego Souza Silva
 
Founder Institute - Customer Development
Founder Institute  - Customer DevelopmentFounder Institute  - Customer Development
Founder Institute - Customer DevelopmentRicardo Moraes
 
(ACH2002) Introdução à Análise de Algoritmos - Aula 04
(ACH2002) Introdução à Análise de Algoritmos - Aula 04(ACH2002) Introdução à Análise de Algoritmos - Aula 04
(ACH2002) Introdução à Análise de Algoritmos - Aula 04Norton Trevisan Roman
 
Test-Driven Development - Introdução ao método de construção de software guia...
Test-Driven Development - Introdução ao método de construção de software guia...Test-Driven Development - Introdução ao método de construção de software guia...
Test-Driven Development - Introdução ao método de construção de software guia...Thiago Faria de Andrade
 
Pratica de IdeAção 2
Pratica de IdeAção 2Pratica de IdeAção 2
Pratica de IdeAção 2Mayra de Souza
 

Semelhante a Combinação de classificadores para obtenção de desempenho ótimo (20)

Machine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & PythonMachine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & Python
 
Pizzaria ferram1
Pizzaria ferram1Pizzaria ferram1
Pizzaria ferram1
 
Aula resolução de problema Modelagem Ambiental
Aula resolução de problema Modelagem AmbientalAula resolução de problema Modelagem Ambiental
Aula resolução de problema Modelagem Ambiental
 
C# 8 e ML.NET
C# 8 e ML.NETC# 8 e ML.NET
C# 8 e ML.NET
 
Texto 02 ferr qlide x masp
Texto 02 ferr qlide x maspTexto 02 ferr qlide x masp
Texto 02 ferr qlide x masp
 
Apostila análise e síntese nível i v01
Apostila análise e síntese   nível i v01Apostila análise e síntese   nível i v01
Apostila análise e síntese nível i v01
 
Aprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaAprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociência
 
Resolvendo Problemas
Resolvendo ProblemasResolvendo Problemas
Resolvendo Problemas
 
Primeira aula sp1
Primeira aula sp1Primeira aula sp1
Primeira aula sp1
 
Introdução à Aprendizagem de Máquina
Introdução à Aprendizagem de MáquinaIntrodução à Aprendizagem de Máquina
Introdução à Aprendizagem de Máquina
 
Aprendizado de máquina
Aprendizado de máquinaAprendizado de máquina
Aprendizado de máquina
 
Aula 01
Aula 01 Aula 01
Aula 01
 
Capítulo 16 Livro Algoritmos e Programação de Computadores Autores JR., Diler...
Capítulo 16 Livro Algoritmos e Programação de Computadores Autores JR., Diler...Capítulo 16 Livro Algoritmos e Programação de Computadores Autores JR., Diler...
Capítulo 16 Livro Algoritmos e Programação de Computadores Autores JR., Diler...
 
Algoritmo Genético para busca de máximo de função
Algoritmo Genético para busca de máximo de funçãoAlgoritmo Genético para busca de máximo de função
Algoritmo Genético para busca de máximo de função
 
Founder Institute - Customer Development
Founder Institute  - Customer DevelopmentFounder Institute  - Customer Development
Founder Institute - Customer Development
 
Ap algoritmosglauco
Ap algoritmosglaucoAp algoritmosglauco
Ap algoritmosglauco
 
(ACH2002) Introdução à Análise de Algoritmos - Aula 04
(ACH2002) Introdução à Análise de Algoritmos - Aula 04(ACH2002) Introdução à Análise de Algoritmos - Aula 04
(ACH2002) Introdução à Análise de Algoritmos - Aula 04
 
Test-Driven Development - Introdução ao método de construção de software guia...
Test-Driven Development - Introdução ao método de construção de software guia...Test-Driven Development - Introdução ao método de construção de software guia...
Test-Driven Development - Introdução ao método de construção de software guia...
 
Learning to Rank
Learning to RankLearning to Rank
Learning to Rank
 
Pratica de IdeAção 2
Pratica de IdeAção 2Pratica de IdeAção 2
Pratica de IdeAção 2
 

Mais de LCoN Mackenzie

Utilizando Medidas de Centralidade na Extração de Palavras-Chave de Grafos Te...
Utilizando Medidas de Centralidade na Extração de Palavras-Chave de Grafos Te...Utilizando Medidas de Centralidade na Extração de Palavras-Chave de Grafos Te...
Utilizando Medidas de Centralidade na Extração de Palavras-Chave de Grafos Te...LCoN Mackenzie
 
Honeypots: o que são, para que servem e como extrair informações
Honeypots: o que são, para que servem e como extrair informaçõesHoneypots: o que são, para que servem e como extrair informações
Honeypots: o que são, para que servem e como extrair informaçõesLCoN Mackenzie
 
Reconhecimento de alimentos utilizando Redes Neurais Artificiais
Reconhecimento de alimentos utilizando Redes Neurais ArtificiaisReconhecimento de alimentos utilizando Redes Neurais Artificiais
Reconhecimento de alimentos utilizando Redes Neurais ArtificiaisLCoN Mackenzie
 
Processamento de Informação em Sistemas Naturais
Processamento de Informação em Sistemas NaturaisProcessamento de Informação em Sistemas Naturais
Processamento de Informação em Sistemas NaturaisLCoN Mackenzie
 
Navegacao de Robótica Autônoma em Ambientes Dinâmicos
Navegacao de Robótica Autônoma em Ambientes DinâmicosNavegacao de Robótica Autônoma em Ambientes Dinâmicos
Navegacao de Robótica Autônoma em Ambientes DinâmicosLCoN Mackenzie
 
Excerpts from Darwin's "On the Origin of Species"
Excerpts from Darwin's "On the Origin of Species"Excerpts from Darwin's "On the Origin of Species"
Excerpts from Darwin's "On the Origin of Species"LCoN Mackenzie
 
Metalearning: a survey of trends and technologies
Metalearning: a survey of trends and technologiesMetalearning: a survey of trends and technologies
Metalearning: a survey of trends and technologiesLCoN Mackenzie
 

Mais de LCoN Mackenzie (7)

Utilizando Medidas de Centralidade na Extração de Palavras-Chave de Grafos Te...
Utilizando Medidas de Centralidade na Extração de Palavras-Chave de Grafos Te...Utilizando Medidas de Centralidade na Extração de Palavras-Chave de Grafos Te...
Utilizando Medidas de Centralidade na Extração de Palavras-Chave de Grafos Te...
 
Honeypots: o que são, para que servem e como extrair informações
Honeypots: o que são, para que servem e como extrair informaçõesHoneypots: o que são, para que servem e como extrair informações
Honeypots: o que são, para que servem e como extrair informações
 
Reconhecimento de alimentos utilizando Redes Neurais Artificiais
Reconhecimento de alimentos utilizando Redes Neurais ArtificiaisReconhecimento de alimentos utilizando Redes Neurais Artificiais
Reconhecimento de alimentos utilizando Redes Neurais Artificiais
 
Processamento de Informação em Sistemas Naturais
Processamento de Informação em Sistemas NaturaisProcessamento de Informação em Sistemas Naturais
Processamento de Informação em Sistemas Naturais
 
Navegacao de Robótica Autônoma em Ambientes Dinâmicos
Navegacao de Robótica Autônoma em Ambientes DinâmicosNavegacao de Robótica Autônoma em Ambientes Dinâmicos
Navegacao de Robótica Autônoma em Ambientes Dinâmicos
 
Excerpts from Darwin's "On the Origin of Species"
Excerpts from Darwin's "On the Origin of Species"Excerpts from Darwin's "On the Origin of Species"
Excerpts from Darwin's "On the Origin of Species"
 
Metalearning: a survey of trends and technologies
Metalearning: a survey of trends and technologiesMetalearning: a survey of trends and technologies
Metalearning: a survey of trends and technologies
 

Combinação de classificadores para obtenção de desempenho ótimo

  • 1. OBTENÇÃO DE COMBINAÇÃO ÓTIMA DE CLASSIFICADORES Rodrigo Pasti rodrigo.pasti@gmail.com
  • 2. Realidade...  Você possui um problema para resolver. Por um exemplo de classificação, predição, detecção de anomalias.  O que você precisa para resolver um problema desses?  1- Saber algumas características do problema.  2- Saber que tipo de método pode ser apropriado para resolvê-lo.  3- Testar os métodos e escolher o de melhor desempenho.
  • 3. Realidade...  Qual é o grande problema com os passos descritos anteriormente?  Teorema No Free Lunch!  1- Para um problema X, qual o melhor método?  2- Supondo que exista um método ótimo. Quais os conjuntos de seus parâmetros que permitem gerar um modelo ótimo?  3- O problema X tem solução satisfatória com os métodos existentes?
  • 4. Realidade...  Agora imagine que você seja uma especialista em análise e mineração de dados.  Toda semana surge um problema desses para você resolver.  O que você faz?  Você faz aqueles três passos anteriores?
  • 5. Supondo um problema qualquer  Base de dados X. Objetivo: conseguir um classificador ótimo ou próximo disso.  Para gerar um modelo você divide sua base. Em geral:  Treinamento, Validação e Teste.  Treinamento e Teste.  Qual seria o classificador ótimo?  Você pode até conseguir um classificador ótimo para sua base X, mas ele será realmente ótimo?
  • 8. Espaço de Classificadores C Classificador Supondo Base X Classificadores quando juntos formam um modelo ótimo
  • 9. Combinando Classificadores  Objetivo: busca pela mistura de classificadores que dá o melhor desempenho possível.  Como: explorando o espaço de busca de classificadores.  Algoritmos de busca.  Problema: como misturar os classificadores.
  • 10. Combinando Classificadores  Informações únicas presentes em cada classificador  Quando em conjunto produzem um melhor desempenho.  Por exemplo, dados 10 classificadores e a base X.  Para uma amostra de validação, apenas o classificador 1 acerta. Os demais erram.  O classificador 1 também possui péssimo desempenho.  Tendência: dar pouca importância a ele.  Problema: perda de informações relevantes.
  • 11. Objetivo e Solução Candidata  Objetivo: encontrar um conjunto de classificadores que acertem todas as amostras de uma base de validação.  Representação da solução:  s = {MLP12,Tree2,Naive1,MLP2,MLP10};  s = {c1, c2, c3, c4, c5};  Weka e resultados...