SlideShare ist ein Scribd-Unternehmen logo
1 von 52
Downloaden Sie, um offline zu lesen
Algoritmos Genéticos na
                         Otimização de Consultas
                             por Similaridade
                                   Dann Luciano de Menezes
                                   Orientador: Ronildo Moura




sexta-feira, 30 de abril de 2010
Desafio
                                   ≅60 slides em 30 min




sexta-feira, 30 de abril de 2010
Agenda

                       • Motivação
                       • Consultas por Similaridade
                       • Algoritmos Genéticos
                       • Solução
                       • Conclusões

sexta-feira, 30 de abril de 2010
Motivação



sexta-feira, 30 de abril de 2010
SGBDs Atuais



sexta-feira, 30 de abril de 2010
1 < 2 < ... < 1000
                                   a < b < ... < Y < Z
                                           =


sexta-feira, 30 de abril de 2010
SGBDs Similares



sexta-feira, 30 de abril de 2010
<
                                   >

sexta-feira, 30 de abril de 2010
≅

sexta-feira, 30 de abril de 2010
Consultas por
                                    Similaridade


sexta-feira, 30 de abril de 2010
Similaridade
                                        ???


sexta-feira, 30 de abril de 2010
Ninguém = Ninguém



sexta-feira, 30 de abril de 2010
Todo Objeto é mais ou menos
      Similar a um Conjunto de Objetos
             para um Conjunto de
                 Características


sexta-feira, 30 de abril de 2010
Perguntas Relevantes

      • Como Comparar Dados Complexos?
      • Como Expressar Consultas Sobre Dados Complexos?
      • Como Indexar Dados Complexos?


sexta-feira, 30 de abril de 2010
Domínios Métricos
                                    Como Comparar Dados Complexos?




sexta-feira, 30 de abril de 2010
Domínio Métrico
      • Definido por M = (D, d( ) ) onde:
       • D, é conjunto de objetos
       • d( ), é função de distância (Dissimilaridade), onde
                     dados x, y, z ε D d:DxD → R+, atendem:
                   • Simetria → d(x,y) = d (y,x);
                   • Não Negatividade → 0 ≤ d(x,y) <∞, d(x,x) = 0;
                   • Desigualdade Triangular → d(x,y) ≤ d(x,z) + d(y,z).
sexta-feira, 30 de abril de 2010
Operadores por
                                    Similaridade
                      Como Expressar Consultas sobre Dados Complexos




sexta-feira, 30 de abril de 2010
Operadores por
                                    Similaridade

                       • RQ(S ,R ) → Similarity Range Query
                                   q   q

                        • Consulta por Abrangência


sexta-feira, 30 de abril de 2010
Range Query




sexta-feira, 30 de abril de 2010
Operadores por
                                    Similaridade

                       • k-NNQ(S ,k) → k-Nearest Neighbor
                                       q
                               Query
                             • Consulta aos K vizinhos mais próximos


sexta-feira, 30 de abril de 2010
k-Nearest Neighbor




sexta-feira, 30 de abril de 2010
Método de Acesso
                                       Métrico
                                    Como Indexar Dados Complexos?




sexta-feira, 30 de abril de 2010
Métodos de Acesso
                                       Métrico
                       • Estrutura de Indexação de Dados
                               Complexos
                       • M-Tree
                       • Slim-Tree
                       • TM-Tree

sexta-feira, 30 de abril de 2010
Slim-Tree

                       • Estrutura Balanceada e Dinâmica
                       • Cresce das Folhas para Raiz
                       • Objetos Armazenados nas Folhas
                       • Estrutura Hierárquica
                       • Cálculos de Distância Otimizados

sexta-feira, 30 de abril de 2010
Slim-Tree




sexta-feira, 30 de abril de 2010
Problemas



sexta-feira, 30 de abril de 2010
Maldição da
                                   Dimensionalidade


sexta-feira, 30 de abril de 2010
Sobreposição de
                                     Conjuntos


sexta-feira, 30 de abril de 2010
sexta-feira, 30 de abril de 2010
Algoritmos Genéticos



sexta-feira, 30 de abril de 2010
Algoritmos Genéticos

                       • Uma técnica de Busca extremamente
                               eficiente no seu objetivo de varrer o
                               espaço de soluções e encontrar
                               soluções próximas da solução ótima.
                       • Ramo da Computação Evolutiva
                       • Técnica Heurística de Otimização Global

sexta-feira, 30 de abril de 2010
Algoritmos Genéticos




sexta-feira, 30 de abril de 2010
Algoritmos Genéticos

                       • Baseados
                        • Seleção Natural (Darwin)
                        • Genética
                       • Idealizados
                        • John Holland e David Goldberg

sexta-feira, 30 de abril de 2010
Algoritmos Genéticos




sexta-feira, 30 de abril de 2010
Algoritmos Genéticos
                       •       Terminologia
                             •     Cromossomo Genoma
                             •     Gene
                             •     Indivíduo
                             •     Genótipo
                             •     Fenótipo
                             •     Alelo


sexta-feira, 30 de abril de 2010
Algoritmos Genéticos

                       • Representação da Informação
                        • Binaria
                        • Real
                        • Dado Abstrato

sexta-feira, 30 de abril de 2010
Algoritmos Genéticos




sexta-feira, 30 de abril de 2010
Algoritmos Genéticos




sexta-feira, 30 de abril de 2010
Seleção


                       • Método da Roleta
                       • Método do Torneio


sexta-feira, 30 de abril de 2010
Operadores Genéticos



sexta-feira, 30 de abril de 2010
Crossover

                       • 1 ponto
                       • 2 pontos
                       • Uniforme


sexta-feira, 30 de abril de 2010
sexta-feira, 30 de abril de 2010
Mutação

                       • Taxa de Mutação
                        • Alta
                        • Baixa


sexta-feira, 30 de abril de 2010
sexta-feira, 30 de abril de 2010
Solução



sexta-feira, 30 de abril de 2010
Representação da
                                       Solução




                                        S2   1   2



sexta-feira, 30 de abril de 2010
Resultados



sexta-feira, 30 de abril de 2010
Conclusões



sexta-feira, 30 de abril de 2010
Trabalhos Futuros



sexta-feira, 30 de abril de 2010
Duvidas, Sugestões, Criticas ?
sexta-feira, 30 de abril de 2010
Dann Luciano de Menezes

                                    dannluciano@gmail.com
                                         @dannluciano
                                        (86) 8859-6618

                                   Muito Obrigado!



sexta-feira, 30 de abril de 2010
Referencias
     •        BUENO Renato, TRAINA Agma J. M. e TRAINA JR Caetano. Algoritmos Genéticos para Consultas por Similaridade.
              2005.

     •        TRAINA JR Caetano, TRAINA Agma, SEEGER Bernhard e FALOUTSOS Christos. Slim-trees: High Performace Metric
              Tree Minimizing Overlap Between Nodes. 1999.

     •        NADVORNY César Feijó. TM-tree: um Método  de Acesso para consultas por similaridade. 2005.

     •        Ferreira Mônica Ribeiro Porto. Suporte a consultas por similaridade unárias em SQL. 2008.

     •        CHINO Fabio Jun Takada. Visualizando a organização e o comportamento de estruturas métricas: Aplicações em
              consultas por similaridade. 2004.

     •        ZUBEN Fernando J. Von. Computação Evolutiva: Uma Abordagem Pragmática.

     •        GOLDBERG David E. Genetic Algorithms in Search, Optimization, and Machine Learning. Addison-Wesley Company
              Inc. 1989.

     •        BÄCK Thomas, FOGEL David B e MICHALEWICZ Zbigniew. Evolutionary Computation 1: Basic Algorithms and
              Operators. Institute of Physics Publishing. 2000.

     •        RUSSEL Stuart e NORVIG Peter. Inteligência Artificial. 2˚ Ed. Rio de Janeiro: Editora Campus. 2004.

     •        LACERDA Estéfane e CARVALHO André. Introdução aos Algoritmos Genéticos. Capítulo 3.

     •        YAMAROTO Cláudio Haruo. Uso de Lógica Nebulosa na Construção e na Utilização  da Arvore Métrica Slim-tree.
              2002.

sexta-feira, 30 de abril de 2010

Weitere ähnliche Inhalte

Empfohlen

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Empfohlen (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Sacic

  • 1. Algoritmos Genéticos na Otimização de Consultas por Similaridade Dann Luciano de Menezes Orientador: Ronildo Moura sexta-feira, 30 de abril de 2010
  • 2. Desafio ≅60 slides em 30 min sexta-feira, 30 de abril de 2010
  • 3. Agenda • Motivação • Consultas por Similaridade • Algoritmos Genéticos • Solução • Conclusões sexta-feira, 30 de abril de 2010
  • 5. SGBDs Atuais sexta-feira, 30 de abril de 2010
  • 6. 1 < 2 < ... < 1000 a < b < ... < Y < Z = sexta-feira, 30 de abril de 2010
  • 8. < > sexta-feira, 30 de abril de 2010
  • 9. ≅ sexta-feira, 30 de abril de 2010
  • 10. Consultas por Similaridade sexta-feira, 30 de abril de 2010
  • 11. Similaridade ??? sexta-feira, 30 de abril de 2010
  • 12. Ninguém = Ninguém sexta-feira, 30 de abril de 2010
  • 13. Todo Objeto é mais ou menos Similar a um Conjunto de Objetos para um Conjunto de Características sexta-feira, 30 de abril de 2010
  • 14. Perguntas Relevantes • Como Comparar Dados Complexos? • Como Expressar Consultas Sobre Dados Complexos? • Como Indexar Dados Complexos? sexta-feira, 30 de abril de 2010
  • 15. Domínios Métricos Como Comparar Dados Complexos? sexta-feira, 30 de abril de 2010
  • 16. Domínio Métrico • Definido por M = (D, d( ) ) onde: • D, é conjunto de objetos • d( ), é função de distância (Dissimilaridade), onde dados x, y, z ε D d:DxD → R+, atendem: • Simetria → d(x,y) = d (y,x); • Não Negatividade → 0 ≤ d(x,y) <∞, d(x,x) = 0; • Desigualdade Triangular → d(x,y) ≤ d(x,z) + d(y,z). sexta-feira, 30 de abril de 2010
  • 17. Operadores por Similaridade Como Expressar Consultas sobre Dados Complexos sexta-feira, 30 de abril de 2010
  • 18. Operadores por Similaridade • RQ(S ,R ) → Similarity Range Query q q • Consulta por Abrangência sexta-feira, 30 de abril de 2010
  • 19. Range Query sexta-feira, 30 de abril de 2010
  • 20. Operadores por Similaridade • k-NNQ(S ,k) → k-Nearest Neighbor q Query • Consulta aos K vizinhos mais próximos sexta-feira, 30 de abril de 2010
  • 22. Método de Acesso Métrico Como Indexar Dados Complexos? sexta-feira, 30 de abril de 2010
  • 23. Métodos de Acesso Métrico • Estrutura de Indexação de Dados Complexos • M-Tree • Slim-Tree • TM-Tree sexta-feira, 30 de abril de 2010
  • 24. Slim-Tree • Estrutura Balanceada e Dinâmica • Cresce das Folhas para Raiz • Objetos Armazenados nas Folhas • Estrutura Hierárquica • Cálculos de Distância Otimizados sexta-feira, 30 de abril de 2010
  • 27. Maldição da Dimensionalidade sexta-feira, 30 de abril de 2010
  • 28. Sobreposição de Conjuntos sexta-feira, 30 de abril de 2010
  • 29. sexta-feira, 30 de abril de 2010
  • 31. Algoritmos Genéticos • Uma técnica de Busca extremamente eficiente no seu objetivo de varrer o espaço de soluções e encontrar soluções próximas da solução ótima. • Ramo da Computação Evolutiva • Técnica Heurística de Otimização Global sexta-feira, 30 de abril de 2010
  • 33. Algoritmos Genéticos • Baseados • Seleção Natural (Darwin) • Genética • Idealizados • John Holland e David Goldberg sexta-feira, 30 de abril de 2010
  • 35. Algoritmos Genéticos • Terminologia • Cromossomo Genoma • Gene • Indivíduo • Genótipo • Fenótipo • Alelo sexta-feira, 30 de abril de 2010
  • 36. Algoritmos Genéticos • Representação da Informação • Binaria • Real • Dado Abstrato sexta-feira, 30 de abril de 2010
  • 39. Seleção • Método da Roleta • Método do Torneio sexta-feira, 30 de abril de 2010
  • 41. Crossover • 1 ponto • 2 pontos • Uniforme sexta-feira, 30 de abril de 2010
  • 42. sexta-feira, 30 de abril de 2010
  • 43. Mutação • Taxa de Mutação • Alta • Baixa sexta-feira, 30 de abril de 2010
  • 44. sexta-feira, 30 de abril de 2010
  • 46. Representação da Solução S2 1 2 sexta-feira, 30 de abril de 2010
  • 50. Duvidas, Sugestões, Criticas ? sexta-feira, 30 de abril de 2010
  • 51. Dann Luciano de Menezes dannluciano@gmail.com @dannluciano (86) 8859-6618 Muito Obrigado! sexta-feira, 30 de abril de 2010
  • 52. Referencias • BUENO Renato, TRAINA Agma J. M. e TRAINA JR Caetano. Algoritmos Genéticos para Consultas por Similaridade. 2005. • TRAINA JR Caetano, TRAINA Agma, SEEGER Bernhard e FALOUTSOS Christos. Slim-trees: High Performace Metric Tree Minimizing Overlap Between Nodes. 1999. • NADVORNY César Feijó. TM-tree: um Método  de Acesso para consultas por similaridade. 2005. • Ferreira Mônica Ribeiro Porto. Suporte a consultas por similaridade unárias em SQL. 2008. • CHINO Fabio Jun Takada. Visualizando a organização e o comportamento de estruturas métricas: Aplicações em consultas por similaridade. 2004. • ZUBEN Fernando J. Von. Computação Evolutiva: Uma Abordagem Pragmática. • GOLDBERG David E. Genetic Algorithms in Search, Optimization, and Machine Learning. Addison-Wesley Company Inc. 1989. • BÄCK Thomas, FOGEL David B e MICHALEWICZ Zbigniew. Evolutionary Computation 1: Basic Algorithms and Operators. Institute of Physics Publishing. 2000. • RUSSEL Stuart e NORVIG Peter. Inteligência Artificial. 2˚ Ed. Rio de Janeiro: Editora Campus. 2004. • LACERDA Estéfane e CARVALHO André. Introdução aos Algoritmos Genéticos. Capítulo 3. • YAMAROTO Cláudio Haruo. Uso de Lógica Nebulosa na Construção e na Utilização  da Arvore Métrica Slim-tree. 2002. sexta-feira, 30 de abril de 2010