SlideShare ist ein Scribd-Unternehmen logo
1 von 39
Downloaden Sie, um offline zu lesen
Mestrado em Ciência da Computação
Universidade do Estado do Rio Grande do Norte – (UERN)
 Universidade Federal Rural do Semi-Árido – (UFERSA)


        Mineração de Padrões Frequentes

                    Thiago Reis da Silva
Sumário

• Introdução;

• Conceitos básicos;

• Mineração de Padrões Frequentes;

• Mineração de Regra de Associação;

• Medidas de Interesse Objetivas e Subjetivas;

• Mineração de Itemset Frequente;

• Outros tipos de mineração de regras de associação;

• Restrições baseadas em mineração de exceções;

• Estado da arte;

• Aplicação;                                           2
Introdução

• Padrões de Mineração Frequente (PRF) aparecem repetidas vezes
   no BD;

• Ex.: par de itens, como, café e leite
    – Sequência de como comprar uma câmera fotográfica e logo depois um cartão
      de memória;

• Padrões frequentes (PF) assumem papel essência em tarefas de
   Mineração de Dados (MD);

• Objetivo: encontrar padrões de determinado interesse em uma
   base de dados:
    – Ex.: regras de associação, agrupamentos e outras;                      3
Introdução

• PF = suporte maior que um dado limite inferior;
   – Interesse não apenas no conjunto de PF;

• A MPF respondem perguntas do tipo:
   – Que regras de associação são mais interessante;

   – Como podemos tirar proveito de preferências do usuário ou restrições para
      acelerar o processo de mineração?




                                                                             4
Conceitos Básicos

• Mineração de Itemset Frequente;
   – Descoberta de associação e correlações;

• Ajuda no processo decisório;
   – Ex.: análise de cesta de compra;

• Analisa hábitos de compra dos clientes;

• Design de estratégia de marketing;




                                               5
Conceitos Básicos

• Ex.: “Clientes que compram Leite. Qual a probabilidade de
   comprarem pão?”;

• Análise de cesta básica pode ajudar a criar layouts diferentes;

• Ex.:
    – Itens comprados juntos podem ser colocados próximos;

    – Itens comprados juntos podem ser colocados em seções diferentes;




                                                                         6
Mineração de Padrões Frequente

• Análise de cesta básica;

• Existem vários tipos;

• A MPF podem ser classificados de diversas maneiras:

   – Com base nos níveis de abstração envolvidos na regra:
   – Diferentes níveis de aplicação;

• Ex.:
   – Compra (X, “Computador”) → Compra (X, “Impressora HP”)

   – Compra (X, “Notebook”) → Compra (X, “Impressora HP”)


                                                              7
Mineração de Padrões Frequente

• Com base na dimensão de dados envolvidos na regra:

• Dimensão única:
   – Ex.:

   – Compra (X, “Computador”) → Compra (X, “Antivírus”);

• Multidimensional:
   – Ex.:

   – Idade (X, “30..39”)^Renda(X, “2000..35000”) → Compra(X, “HDTV”)




                                                                       8
Mineração de Padrões Frequente

• Com base nos tipos de valores tratados na regra:

• Booleana:
   – Ex.:

   – Compra (X, “Computador”) → Compra (X, “Impressora HP”);

• Quantitativo:
   – Ex.:

   – Idade (X, “30..39”)^Renda(X, “2000..35000”) → Compra(X, “HDTV”)




                                                                       9
Mineração de Regra de Associação

• Importante tarefa de MD;

• Ex.: análise de cesta compra;

• As Regras de associação representam padrões onde a ocorrência de
  eventos em conjunto em alta;

• Ex.: 75% que A e B → C;

• Objetivo:   encontrar     todos   os   conjuntos   de   itens   que
  frequentemente ocorre na base de dados;



                                                                   10
Mineração de Regra de Associação

• RA = X → Y;

• (X) antecedente e (Y) consequente;

• Medidas de interesse: suporte e confiança;

• Suporte: indica a porcentagem de ocorrência concomitante dos
  conjuntos X e Y na base de dados;




                     Figura 1: Regra de suporte

                                                            11
Mineração de Regra de Associação

• Confiança: indica a frequência em que a ocorrência do conjunto de
  itens X implica na ocorrência do conjunto Y.




                      Figura 2: Regra de confiança




                                                                 12
Mineração de Regra de Associação

• Exemplo prático:

• Itemset, X e Y, {Pão} e {Leite};

• Suporte: é comprado o nº de linha na qual
                                               Figura 3: Análise de cesta de
Ocorrem os 2 itemset                                      compras
Suporte = 3/5 = 0,6

• Confiança: frequência em que o item consequente Y ocorre dado o
   itemset antecedente X;

Confiança = ¾ = 0,75

Pão → Leite [suporte = 60%; confiança = 75%]
                                                                        13
Mineração de Regra de Associação

   • Problema:

   • Será que o fato de uma certa regra de associação grau de confiança
      alto é o suficiente para considerar a uma “boa regra”?




                                                       Figura 5: banco de
                                                      dados de transações
                                                           de clientes

Figura 4: Representação numérica de cada artigo do
                                                                        14
                  supermercado
Mineração de Regra de Associação

• {Cerveja}, {Manteiga} só acontece juntos apenas em uma única
   transação;

• Confiança de 100%;

• Regra não é boa (suporte 0,1666%);

• Boa: conf (r) > α e sup (r) ≥ β




                                                            15
Mineração de Regra de Associação

• As regras de associação surgiram como opção para responder
  questões como:
   – Encontre todas as regras que possuem “café” como termo consequente;

   – Encontre todas as regras que possuem “café” como termo antecedente;

   – Encontre todas as regras que possuem “café” como antecedente e “leite”
     como consequente;




                                                                           16
Medidas de Interesse Subjetiva e
                Objetiva

• Críticas ao modelo suporte/confiança;

• Problema:
    – Geração excessiva de regras;

• Outras medidas foram proposta com o intuito de identificar as
   regras que são de fato relevante e úteis;
• Medidas: objetivas e subjetivas;




                                                             17
Medidas de Interesse Subjetiva e
                Objetiva

• Medidas de Interesse Objetivas (MIO):

• Índices estatísticos para avaliar a força da regra;

• Regra interessante (valor do suporte > valor esperado);

• Tipos:
    – Lift: regra de associação A → B, esta medida indica o quanto mais frequente
       torna-se B quando A ocorre;

    – Regra: Lift (A → B ) = conf (A → B)/sup(B)




                                                                               18
Medidas de Interesse Subjetiva e
               Objetiva

• Medidas de Interesse Objetivas (MIO):

• Tipos:
   – Rule Interest

   – Regra: RI (A → B ) = sup (A → B) – supesp(A → B)




                                                        19
Medidas de Interesse Subjetiva e
                Objetiva

• Medidas de Interesse Subjetiva (MIS):
• Considera a opinião do analista;

• As MIO identificam estatisticamente a força da regra;

• Possui valores altos para a MIO e não subjetivas interessantes;

• Fatores para tornar a regra de associação subjetivamente interessante:
   utilidade e a inesperabilidade;




                                                                      20
Medidas de Interesse Subjetiva e
                Objetiva

• Medidas de Interesse Subjetiva (MIS):

• Medida de utilidade: se o usuário pode fazer algo a partir dela;

• Medida de inesperabilidade: considera que uma regra tem grande
   chance de ser interessante se contradiz as expectativas;

• Ex.: associação entre fraldas e cervejas em um supermercado
   quando os consumidores são casais jovens;
    – É útil e inesperada;




                                                                     21
Mineração de Itemset Frequente

• É uma tarefa normalmente executada sobre dados de transação de
  clientes;

• O processo de descobrir itemset frequente pode ser decomposta
  em 2 etapas:
   – Encontrar todos os conjuntos de itemset frequente;

   – Utilizar os itemset frequentes obtidos para gerar de associações;




                                                                         22
Mineração de Itemset Frequente

• Algoritmos para a descoberta de itemset frequente:
   – Apriori, FPGrowth, Max-miner, outros;

• Apriori:
   – Mais utilizado;

   – Baseado no fato de usar conhecimento já obtidos nos itens anteriores;

   – Fases: geração, poda e validação;




                                                                             23
Outros tipos de Mineração de Regras
           de Associação

• Regras de associação envolve conceitos de diferentes níveis:

• Regras de Associação Multinível:

• Pode ser extraído de forma eficiente usando hierarquias
  (generalização)




                          Figura 6: Hierarquia de classificação
                                                                  24
Outros tipos de Mineração de Regras
           de Associação

• Regras de Associação Multidimensional:

• Capacidade de minerar regras com atributos categóricos ou
  quantitativos;

• Ex.: data warehouse;

• Considerando uma base de dados de um supermercado

• Ex.:
   – (Sexo = “F”)^(30 < idade ≤ 35)→Forma de pagamento = “cartão de crédito”;




                                                                                25
Outros tipos de Mineração de Regras
           de Associação

• Regras de Associação Hibrída:

• Uma dimensão pode aparecer repetidas vezes;

• Ex.:
    – (Sexo=“M”)^(Casado=“N”)^(Produto=“Cerveja”)→ (Produto=“Salaminho”)

• É útil pois envolve dados pessoais e quantitativos;




                                                                           26
Outros tipos de Mineração de Regras
           de Associação

• Regras de Associação Quantitativas:

• Dados categóricos estão associados a algum tipo de classificação;

• Dados quantitativos podem ser divididos em 2 classes:
   – Indicativo e real;

• Dados quantitativos indicativos são dados numéricos que pertence
  ao conjunto dos números reais;
   – Ex.: 4 pães, 3 leites;




                                                                      27
Outros tipos de Mineração de Regras
           de Associação

• Regras de Associação Quantitativas:

• Dados quantitativos reais são dados numéricos que pertencem ao
  conjunto dos números reais e estão associados a um       item
  específico;

• Ex.: notas de provas;

• Nos BD de aplicações é comum a ocorrência de dados
  quantitativos;



                                                              28
Outros tipos de Mineração de Regras
           de Associação

• Regras de Associação Quantitativas:

• X → Y, itemset contém valores quantitativos;

• Os itens são considerados como uma dupla (x, v);

• Ex.: (Pães(cinco) → (Leite(dois);




                                                     29
Restrições baseadas em mineração
             de exceções

• É uma tarefa complicada;

• Tipos de restrições:
   – Restrições do tipo de conhecimento;

   – Restrições de dados;

   – Restrições de padrões interessantes;

   – Restrições de regras;




                                            30
Restrições baseadas em mineração
             de exceções

• Ex.:

• “As famílias que compram couve e linguiça, não costumam compra
  brócolis”;

• Identificação de clientes com diferentes perfis de compra;

• {couve}→ {brócolis}




                                                               31
Estado da Arte

• Diversas áreas, tais como:




Figura 7: compras no cartão de créditos   Figura 8: serviços bancários


                                                                    32
Estado da Arte




                                    Figura 10: combinações incomuns
Figura 9: históricos de pacientes
                                           de resgate de seguro

                                                             33
Estado da Arte




Figura 11: serviços de telecomunicações




                                          34
Aplicações




Figura 12: aplicativo WEKA




                             35
Aplicações


Figura 13: regra de associação da situação dos alunos IFPI - PICOS




     Figura 14: regra de associação de lentes de contato




                                                                     36
Aplicações




Figura 15: regra de associação de votação




Figura 16: regra de associação de tempo     37
Referências Bibliográficas

• Costa, L. S. (2005). Mineração de padrões frequentes ortogonais e sua
   aplicação em classificação associativa. 108p. Dissertação de mestrado,
   apresentada a Universidade Federal de Minas Gerais.

• Camargo, S. S. (2008). Mineração de regras de associação no problema de
   cesta de compras aplicada ao comércio varejista de confecção. 101p.
   Dissertação de mestrado, apresentada a Universidade Federal do Rio
   grande do Sul.

• Gonçalves, E. C. (2004). Regras de Associação e suas Medidas de Interesse
   Objetivas e Subjetivas. Universidade Federal Fluminense.


                                                                         38
Referências Bibliográficas

• Han, J.; Cheng, H.; Xin, D.; Yan, X. (2008). Frequent pattern mining: current
   status and future directions. Data Min Knowl Disc (2007) 15:55–86. DOI
   10.1007/s10618-006-0059-1.

• Han, J.; Kamber, M. (2000). Data Mining: Concepts and Techniques.
   Morgan Kaufmann.

• Oyama, F. T. (2010). Mineração multirrelacional de regras de associação
   em grandes bases de dados. 140p. Dissertação de mestrado apresentada a
   Universidade Estadual Paulista.




                                                                             39

Weitere ähnliche Inhalte

Was ist angesagt?

Arquitetura da Informação
Arquitetura da InformaçãoArquitetura da Informação
Arquitetura da InformaçãoKarine Drumond
 
Filtragem e recuperação da informação
Filtragem e recuperação da informaçãoFiltragem e recuperação da informação
Filtragem e recuperação da informaçãoVanessa Biff
 
Sistemas de recuperação de informação
Sistemas de recuperação de informação Sistemas de recuperação de informação
Sistemas de recuperação de informação Célia Dias
 
Arquitetura da Informação - Capítulo 9 – Tesauros, Vocabulário Controlado e M...
Arquitetura da Informação - Capítulo 9 – Tesauros, Vocabulário Controlado e M...Arquitetura da Informação - Capítulo 9 – Tesauros, Vocabulário Controlado e M...
Arquitetura da Informação - Capítulo 9 – Tesauros, Vocabulário Controlado e M...Ana Carolina Simionato
 
Isc aula 5 - estrutura e organização da informação
Isc   aula 5 - estrutura e organização da informaçãoIsc   aula 5 - estrutura e organização da informação
Isc aula 5 - estrutura e organização da informaçãoFábio Andrade
 
Arquitetura da informação
Arquitetura da informaçãoArquitetura da informação
Arquitetura da informaçãoCristiane Mendes
 
Infra-estrutura de TI
Infra-estrutura de TIInfra-estrutura de TI
Infra-estrutura de TIemmonks
 
Бібліотечні сайти та блоги
Бібліотечні сайти та блогиБібліотечні сайти та блоги
Бібліотечні сайти та блогиРОМЦ БКР
 
Fichamento sobre as Linguagens Documentárias
Fichamento sobre as Linguagens DocumentáriasFichamento sobre as Linguagens Documentárias
Fichamento sobre as Linguagens DocumentáriasCarla Ferreira
 
Gestão da informação e do conhecimento em unidades e serviços de informação
Gestão da informação e do conhecimento em unidades e serviços de informaçãoGestão da informação e do conhecimento em unidades e serviços de informação
Gestão da informação e do conhecimento em unidades e serviços de informaçãoFEBAB
 
анкета доунб
анкета доунбанкета доунб
анкета доунбLibrary Franko
 
Aula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoAula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoNilton Heck
 
ОРГАНІЗАЦІЯ СІМЕЙНОГО ЧИТАННЯ В БІБЛІОТЕЦІ
ОРГАНІЗАЦІЯ СІМЕЙНОГО ЧИТАННЯ В БІБЛІОТЕЦІОРГАНІЗАЦІЯ СІМЕЙНОГО ЧИТАННЯ В БІБЛІОТЕЦІ
ОРГАНІЗАЦІЯ СІМЕЙНОГО ЧИТАННЯ В БІБЛІОТЕЦІНадвірнянська ЦРБ
 
Gestão de Colecções
Gestão de ColecçõesGestão de Colecções
Gestão de ColecçõesJulia Martins
 
學術傳播與學術圖書館
學術傳播與學術圖書館學術傳播與學術圖書館
學術傳播與學術圖書館皓仁 柯
 
Criação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma bibliotecaCriação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma bibliotecaDavid Canjamba 2D
 
Arquitetura da Informacao
Arquitetura da InformacaoArquitetura da Informacao
Arquitetura da Informacaocarlosremontti
 
Aula 12 - Gestão do Conhecimento
Aula 12 - Gestão do ConhecimentoAula 12 - Gestão do Conhecimento
Aula 12 - Gestão do ConhecimentoFilipo Mór
 

Was ist angesagt? (20)

Arquitetura da Informação
Arquitetura da InformaçãoArquitetura da Informação
Arquitetura da Informação
 
Filtragem e recuperação da informação
Filtragem e recuperação da informaçãoFiltragem e recuperação da informação
Filtragem e recuperação da informação
 
Sistemas de recuperação de informação
Sistemas de recuperação de informação Sistemas de recuperação de informação
Sistemas de recuperação de informação
 
Analise tesauro
Analise tesauroAnalise tesauro
Analise tesauro
 
Arquitetura da Informação - Capítulo 9 – Tesauros, Vocabulário Controlado e M...
Arquitetura da Informação - Capítulo 9 – Tesauros, Vocabulário Controlado e M...Arquitetura da Informação - Capítulo 9 – Tesauros, Vocabulário Controlado e M...
Arquitetura da Informação - Capítulo 9 – Tesauros, Vocabulário Controlado e M...
 
Isc aula 5 - estrutura e organização da informação
Isc   aula 5 - estrutura e organização da informaçãoIsc   aula 5 - estrutura e organização da informação
Isc aula 5 - estrutura e organização da informação
 
Arquitetura da informação
Arquitetura da informaçãoArquitetura da informação
Arquitetura da informação
 
Infra-estrutura de TI
Infra-estrutura de TIInfra-estrutura de TI
Infra-estrutura de TI
 
Бібліотечні сайти та блоги
Бібліотечні сайти та блогиБібліотечні сайти та блоги
Бібліотечні сайти та блоги
 
Fichamento sobre as Linguagens Documentárias
Fichamento sobre as Linguagens DocumentáriasFichamento sobre as Linguagens Documentárias
Fichamento sobre as Linguagens Documentárias
 
Gestão da informação e do conhecimento em unidades e serviços de informação
Gestão da informação e do conhecimento em unidades e serviços de informaçãoGestão da informação e do conhecimento em unidades e serviços de informação
Gestão da informação e do conhecimento em unidades e serviços de informação
 
анкета доунб
анкета доунбанкета доунб
анкета доунб
 
Aula 01 - Recuperação da Informação
Aula 01 - Recuperação da InformaçãoAula 01 - Recuperação da Informação
Aula 01 - Recuperação da Informação
 
ОРГАНІЗАЦІЯ СІМЕЙНОГО ЧИТАННЯ В БІБЛІОТЕЦІ
ОРГАНІЗАЦІЯ СІМЕЙНОГО ЧИТАННЯ В БІБЛІОТЕЦІОРГАНІЗАЦІЯ СІМЕЙНОГО ЧИТАННЯ В БІБЛІОТЕЦІ
ОРГАНІЗАЦІЯ СІМЕЙНОГО ЧИТАННЯ В БІБЛІОТЕЦІ
 
Gestão de Colecções
Gestão de ColecçõesGestão de Colecções
Gestão de Colecções
 
學術傳播與學術圖書館
學術傳播與學術圖書館學術傳播與學術圖書館
學術傳播與學術圖書館
 
Criação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma bibliotecaCriação de uma base de dados para gestão de uma biblioteca
Criação de uma base de dados para gestão de uma biblioteca
 
Arquitetura da Informacao
Arquitetura da InformacaoArquitetura da Informacao
Arquitetura da Informacao
 
CDD
CDDCDD
CDD
 
Aula 12 - Gestão do Conhecimento
Aula 12 - Gestão do ConhecimentoAula 12 - Gestão do Conhecimento
Aula 12 - Gestão do Conhecimento
 

Ähnlich wie Mestrado em Ciência da Computação: Mineração de Padrões Frequentes

Mineração de padrões frequentes - Pós Graduação em Big Data
Mineração de padrões frequentes - Pós Graduação em Big DataMineração de padrões frequentes - Pós Graduação em Big Data
Mineração de padrões frequentes - Pós Graduação em Big DataFabrício Barth
 
Identificação e avaliação de oportunidades
Identificação e avaliação de oportunidadesIdentificação e avaliação de oportunidades
Identificação e avaliação de oportunidadesFelipe Pereira
 
Aula3 pesquisa de_marketing
Aula3 pesquisa de_marketingAula3 pesquisa de_marketing
Aula3 pesquisa de_marketingAngelo Yasui
 
Técnicas de Mineração de Dados Aplicadas a Sistemas de Recomendação
Técnicas de Mineração de Dados Aplicadas a Sistemas de RecomendaçãoTécnicas de Mineração de Dados Aplicadas a Sistemas de Recomendação
Técnicas de Mineração de Dados Aplicadas a Sistemas de Recomendaçãosaspi2
 
Regras de Associação - Mineração de Dados
Regras de Associação - Mineração de DadosRegras de Associação - Mineração de Dados
Regras de Associação - Mineração de DadosNorton Guimarães
 
[Think E-Commerce| Edição Campinas 2020] E-commerce: Fonte de dados para toma...
[Think E-Commerce| Edição Campinas 2020] E-commerce: Fonte de dados para toma...[Think E-Commerce| Edição Campinas 2020] E-commerce: Fonte de dados para toma...
[Think E-Commerce| Edição Campinas 2020] E-commerce: Fonte de dados para toma...E-Commerce Brasil
 
Unidade 2 - Slides 2 - Aquisição de materiais.pdf
Unidade 2 - Slides 2 - Aquisição de materiais.pdfUnidade 2 - Slides 2 - Aquisição de materiais.pdf
Unidade 2 - Slides 2 - Aquisição de materiais.pdfKennya De Lima Ribeiro
 
Analisando fundamentos rc_ago11
Analisando fundamentos rc_ago11Analisando fundamentos rc_ago11
Analisando fundamentos rc_ago11Ricardo Correa
 

Ähnlich wie Mestrado em Ciência da Computação: Mineração de Padrões Frequentes (16)

Mineração de padrões frequentes - Pós Graduação em Big Data
Mineração de padrões frequentes - Pós Graduação em Big DataMineração de padrões frequentes - Pós Graduação em Big Data
Mineração de padrões frequentes - Pós Graduação em Big Data
 
TechDays 2010 DAT202
TechDays 2010 DAT202TechDays 2010 DAT202
TechDays 2010 DAT202
 
Data mining
Data miningData mining
Data mining
 
Identificação e avaliação de oportunidades
Identificação e avaliação de oportunidadesIdentificação e avaliação de oportunidades
Identificação e avaliação de oportunidades
 
Aula 3 - Ética em compras.pptx
Aula 3 - Ética em compras.pptxAula 3 - Ética em compras.pptx
Aula 3 - Ética em compras.pptx
 
Aula3 pesquisa de_marketing
Aula3 pesquisa de_marketingAula3 pesquisa de_marketing
Aula3 pesquisa de_marketing
 
Técnicas de Mineração de Dados Aplicadas a Sistemas de Recomendação
Técnicas de Mineração de Dados Aplicadas a Sistemas de RecomendaçãoTécnicas de Mineração de Dados Aplicadas a Sistemas de Recomendação
Técnicas de Mineração de Dados Aplicadas a Sistemas de Recomendação
 
Regras de Associação - Mineração de Dados
Regras de Associação - Mineração de DadosRegras de Associação - Mineração de Dados
Regras de Associação - Mineração de Dados
 
[Think E-Commerce| Edição Campinas 2020] E-commerce: Fonte de dados para toma...
[Think E-Commerce| Edição Campinas 2020] E-commerce: Fonte de dados para toma...[Think E-Commerce| Edição Campinas 2020] E-commerce: Fonte de dados para toma...
[Think E-Commerce| Edição Campinas 2020] E-commerce: Fonte de dados para toma...
 
Modelagem Revistas
Modelagem RevistasModelagem Revistas
Modelagem Revistas
 
Mineração Livre de Dados
Mineração Livre de DadosMineração Livre de Dados
Mineração Livre de Dados
 
Investindo em Ações
Investindo em AçõesInvestindo em Ações
Investindo em Ações
 
Inteligência de mercado como alavanca de valor para Suprimentos
Inteligência de mercado como alavanca de valor para SuprimentosInteligência de mercado como alavanca de valor para Suprimentos
Inteligência de mercado como alavanca de valor para Suprimentos
 
CRM vem do berço - palestra
CRM vem do berço - palestraCRM vem do berço - palestra
CRM vem do berço - palestra
 
Unidade 2 - Slides 2 - Aquisição de materiais.pdf
Unidade 2 - Slides 2 - Aquisição de materiais.pdfUnidade 2 - Slides 2 - Aquisição de materiais.pdf
Unidade 2 - Slides 2 - Aquisição de materiais.pdf
 
Analisando fundamentos rc_ago11
Analisando fundamentos rc_ago11Analisando fundamentos rc_ago11
Analisando fundamentos rc_ago11
 

Mehr von Thiago Reis da Silva

Apostila de Introdução a Programação
Apostila de Introdução a ProgramaçãoApostila de Introdução a Programação
Apostila de Introdução a ProgramaçãoThiago Reis da Silva
 
The use of games on the teaching of programming: a systematic review
The use of games on the teaching of programming: a systematic reviewThe use of games on the teaching of programming: a systematic review
The use of games on the teaching of programming: a systematic reviewThiago Reis da Silva
 
Desenvolvendo plug-in do Moodle em forma de módulo
Desenvolvendo plug-in do Moodle em forma de móduloDesenvolvendo plug-in do Moodle em forma de módulo
Desenvolvendo plug-in do Moodle em forma de móduloThiago Reis da Silva
 
Facilitando o aprendizado na tv digital interativa com a utilização de mapa d...
Facilitando o aprendizado na tv digital interativa com a utilização de mapa d...Facilitando o aprendizado na tv digital interativa com a utilização de mapa d...
Facilitando o aprendizado na tv digital interativa com a utilização de mapa d...Thiago Reis da Silva
 
O uso de ferramentas pedagógicas no desenvolvimento de objetos de aprendizagem
O uso de ferramentas pedagógicas no desenvolvimento de objetos de aprendizagemO uso de ferramentas pedagógicas no desenvolvimento de objetos de aprendizagem
O uso de ferramentas pedagógicas no desenvolvimento de objetos de aprendizagemThiago Reis da Silva
 
Integrando o network simulator 2.0 a um ambiente virtual de aprendizagem
Integrando o network simulator 2.0 a um ambiente virtual de aprendizagemIntegrando o network simulator 2.0 a um ambiente virtual de aprendizagem
Integrando o network simulator 2.0 a um ambiente virtual de aprendizagemThiago Reis da Silva
 
Ensino de programação utilizando jogos digitais: uma revisão sistemática da l...
Ensino de programação utilizando jogos digitais: uma revisão sistemática da l...Ensino de programação utilizando jogos digitais: uma revisão sistemática da l...
Ensino de programação utilizando jogos digitais: uma revisão sistemática da l...Thiago Reis da Silva
 
Um modelo de objeto de aprendizagem com ênfase no planejamento para o Moodle
Um modelo de objeto de aprendizagem com ênfase no planejamento para o MoodleUm modelo de objeto de aprendizagem com ênfase no planejamento para o Moodle
Um modelo de objeto de aprendizagem com ênfase no planejamento para o MoodleThiago Reis da Silva
 
Aplicação de uma técnica de visualização de dados baseado em árvores para au...
Aplicação de uma técnica de visualização de dados baseado  em árvores para au...Aplicação de uma técnica de visualização de dados baseado  em árvores para au...
Aplicação de uma técnica de visualização de dados baseado em árvores para au...Thiago Reis da Silva
 
OBA-MC: um modelo de objeto de aprendizagem centrado no processo de ensino-ap...
OBA-MC: um modelo de objeto de aprendizagem centrado no processo de ensino-ap...OBA-MC: um modelo de objeto de aprendizagem centrado no processo de ensino-ap...
OBA-MC: um modelo de objeto de aprendizagem centrado no processo de ensino-ap...Thiago Reis da Silva
 
Ferramentas avaliativas disponíveis em um ambiente virtual de aprendizagem us...
Ferramentas avaliativas disponíveis em um ambiente virtual de aprendizagem us...Ferramentas avaliativas disponíveis em um ambiente virtual de aprendizagem us...
Ferramentas avaliativas disponíveis em um ambiente virtual de aprendizagem us...Thiago Reis da Silva
 
Ampliando o aprendizado na TV digital com MCD-TV e ginga
Ampliando o aprendizado na TV digital com MCD-TV e gingaAmpliando o aprendizado na TV digital com MCD-TV e ginga
Ampliando o aprendizado na TV digital com MCD-TV e gingaThiago Reis da Silva
 
MCD-TV - aprendizagem significativa com objeto de aprendizagem OBA-MC na tv d...
MCD-TV - aprendizagem significativa com objeto de aprendizagem OBA-MC na tv d...MCD-TV - aprendizagem significativa com objeto de aprendizagem OBA-MC na tv d...
MCD-TV - aprendizagem significativa com objeto de aprendizagem OBA-MC na tv d...Thiago Reis da Silva
 
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...Thiago Reis da Silva
 
Uma proposta de padronização de objetos de aprendizagem com base em objetivos...
Uma proposta de padronização de objetos de aprendizagem com base em objetivos...Uma proposta de padronização de objetos de aprendizagem com base em objetivos...
Uma proposta de padronização de objetos de aprendizagem com base em objetivos...Thiago Reis da Silva
 
Scrum uma metodologia ágil paragestão e planejamento de projetos de software
Scrum uma metodologia ágil paragestão e planejamento de projetos de softwareScrum uma metodologia ágil paragestão e planejamento de projetos de software
Scrum uma metodologia ágil paragestão e planejamento de projetos de softwareThiago Reis da Silva
 

Mehr von Thiago Reis da Silva (20)

Apostila de Introdução a Programação
Apostila de Introdução a ProgramaçãoApostila de Introdução a Programação
Apostila de Introdução a Programação
 
Introdução a Programação
Introdução a ProgramaçãoIntrodução a Programação
Introdução a Programação
 
The use of games on the teaching of programming: a systematic review
The use of games on the teaching of programming: a systematic reviewThe use of games on the teaching of programming: a systematic review
The use of games on the teaching of programming: a systematic review
 
Desenvolvendo plug-in do Moodle em forma de módulo
Desenvolvendo plug-in do Moodle em forma de móduloDesenvolvendo plug-in do Moodle em forma de módulo
Desenvolvendo plug-in do Moodle em forma de módulo
 
Facilitando o aprendizado na tv digital interativa com a utilização de mapa d...
Facilitando o aprendizado na tv digital interativa com a utilização de mapa d...Facilitando o aprendizado na tv digital interativa com a utilização de mapa d...
Facilitando o aprendizado na tv digital interativa com a utilização de mapa d...
 
O uso de ferramentas pedagógicas no desenvolvimento de objetos de aprendizagem
O uso de ferramentas pedagógicas no desenvolvimento de objetos de aprendizagemO uso de ferramentas pedagógicas no desenvolvimento de objetos de aprendizagem
O uso de ferramentas pedagógicas no desenvolvimento de objetos de aprendizagem
 
Integrando o network simulator 2.0 a um ambiente virtual de aprendizagem
Integrando o network simulator 2.0 a um ambiente virtual de aprendizagemIntegrando o network simulator 2.0 a um ambiente virtual de aprendizagem
Integrando o network simulator 2.0 a um ambiente virtual de aprendizagem
 
Ensino de programação utilizando jogos digitais: uma revisão sistemática da l...
Ensino de programação utilizando jogos digitais: uma revisão sistemática da l...Ensino de programação utilizando jogos digitais: uma revisão sistemática da l...
Ensino de programação utilizando jogos digitais: uma revisão sistemática da l...
 
Survey e Análise Estatística
Survey e Análise Estatística Survey e Análise Estatística
Survey e Análise Estatística
 
Um modelo de objeto de aprendizagem com ênfase no planejamento para o Moodle
Um modelo de objeto de aprendizagem com ênfase no planejamento para o MoodleUm modelo de objeto de aprendizagem com ênfase no planejamento para o Moodle
Um modelo de objeto de aprendizagem com ênfase no planejamento para o Moodle
 
Aplicação de uma técnica de visualização de dados baseado em árvores para au...
Aplicação de uma técnica de visualização de dados baseado  em árvores para au...Aplicação de uma técnica de visualização de dados baseado  em árvores para au...
Aplicação de uma técnica de visualização de dados baseado em árvores para au...
 
OBA-MC: um modelo de objeto de aprendizagem centrado no processo de ensino-ap...
OBA-MC: um modelo de objeto de aprendizagem centrado no processo de ensino-ap...OBA-MC: um modelo de objeto de aprendizagem centrado no processo de ensino-ap...
OBA-MC: um modelo de objeto de aprendizagem centrado no processo de ensino-ap...
 
Ferramentas avaliativas disponíveis em um ambiente virtual de aprendizagem us...
Ferramentas avaliativas disponíveis em um ambiente virtual de aprendizagem us...Ferramentas avaliativas disponíveis em um ambiente virtual de aprendizagem us...
Ferramentas avaliativas disponíveis em um ambiente virtual de aprendizagem us...
 
Ampliando o aprendizado na TV digital com MCD-TV e ginga
Ampliando o aprendizado na TV digital com MCD-TV e gingaAmpliando o aprendizado na TV digital com MCD-TV e ginga
Ampliando o aprendizado na TV digital com MCD-TV e ginga
 
MCD-TV - aprendizagem significativa com objeto de aprendizagem OBA-MC na tv d...
MCD-TV - aprendizagem significativa com objeto de aprendizagem OBA-MC na tv d...MCD-TV - aprendizagem significativa com objeto de aprendizagem OBA-MC na tv d...
MCD-TV - aprendizagem significativa com objeto de aprendizagem OBA-MC na tv d...
 
Minicurso SCRUM
Minicurso SCRUMMinicurso SCRUM
Minicurso SCRUM
 
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...
 
Uma proposta de padronização de objetos de aprendizagem com base em objetivos...
Uma proposta de padronização de objetos de aprendizagem com base em objetivos...Uma proposta de padronização de objetos de aprendizagem com base em objetivos...
Uma proposta de padronização de objetos de aprendizagem com base em objetivos...
 
Scrum uma metodologia ágil paragestão e planejamento de projetos de software
Scrum uma metodologia ágil paragestão e planejamento de projetos de softwareScrum uma metodologia ágil paragestão e planejamento de projetos de software
Scrum uma metodologia ágil paragestão e planejamento de projetos de software
 
Artigo
ArtigoArtigo
Artigo
 

Mestrado em Ciência da Computação: Mineração de Padrões Frequentes

  • 1. Mestrado em Ciência da Computação Universidade do Estado do Rio Grande do Norte – (UERN) Universidade Federal Rural do Semi-Árido – (UFERSA) Mineração de Padrões Frequentes Thiago Reis da Silva
  • 2. Sumário • Introdução; • Conceitos básicos; • Mineração de Padrões Frequentes; • Mineração de Regra de Associação; • Medidas de Interesse Objetivas e Subjetivas; • Mineração de Itemset Frequente; • Outros tipos de mineração de regras de associação; • Restrições baseadas em mineração de exceções; • Estado da arte; • Aplicação; 2
  • 3. Introdução • Padrões de Mineração Frequente (PRF) aparecem repetidas vezes no BD; • Ex.: par de itens, como, café e leite – Sequência de como comprar uma câmera fotográfica e logo depois um cartão de memória; • Padrões frequentes (PF) assumem papel essência em tarefas de Mineração de Dados (MD); • Objetivo: encontrar padrões de determinado interesse em uma base de dados: – Ex.: regras de associação, agrupamentos e outras; 3
  • 4. Introdução • PF = suporte maior que um dado limite inferior; – Interesse não apenas no conjunto de PF; • A MPF respondem perguntas do tipo: – Que regras de associação são mais interessante; – Como podemos tirar proveito de preferências do usuário ou restrições para acelerar o processo de mineração? 4
  • 5. Conceitos Básicos • Mineração de Itemset Frequente; – Descoberta de associação e correlações; • Ajuda no processo decisório; – Ex.: análise de cesta de compra; • Analisa hábitos de compra dos clientes; • Design de estratégia de marketing; 5
  • 6. Conceitos Básicos • Ex.: “Clientes que compram Leite. Qual a probabilidade de comprarem pão?”; • Análise de cesta básica pode ajudar a criar layouts diferentes; • Ex.: – Itens comprados juntos podem ser colocados próximos; – Itens comprados juntos podem ser colocados em seções diferentes; 6
  • 7. Mineração de Padrões Frequente • Análise de cesta básica; • Existem vários tipos; • A MPF podem ser classificados de diversas maneiras: – Com base nos níveis de abstração envolvidos na regra: – Diferentes níveis de aplicação; • Ex.: – Compra (X, “Computador”) → Compra (X, “Impressora HP”) – Compra (X, “Notebook”) → Compra (X, “Impressora HP”) 7
  • 8. Mineração de Padrões Frequente • Com base na dimensão de dados envolvidos na regra: • Dimensão única: – Ex.: – Compra (X, “Computador”) → Compra (X, “Antivírus”); • Multidimensional: – Ex.: – Idade (X, “30..39”)^Renda(X, “2000..35000”) → Compra(X, “HDTV”) 8
  • 9. Mineração de Padrões Frequente • Com base nos tipos de valores tratados na regra: • Booleana: – Ex.: – Compra (X, “Computador”) → Compra (X, “Impressora HP”); • Quantitativo: – Ex.: – Idade (X, “30..39”)^Renda(X, “2000..35000”) → Compra(X, “HDTV”) 9
  • 10. Mineração de Regra de Associação • Importante tarefa de MD; • Ex.: análise de cesta compra; • As Regras de associação representam padrões onde a ocorrência de eventos em conjunto em alta; • Ex.: 75% que A e B → C; • Objetivo: encontrar todos os conjuntos de itens que frequentemente ocorre na base de dados; 10
  • 11. Mineração de Regra de Associação • RA = X → Y; • (X) antecedente e (Y) consequente; • Medidas de interesse: suporte e confiança; • Suporte: indica a porcentagem de ocorrência concomitante dos conjuntos X e Y na base de dados; Figura 1: Regra de suporte 11
  • 12. Mineração de Regra de Associação • Confiança: indica a frequência em que a ocorrência do conjunto de itens X implica na ocorrência do conjunto Y. Figura 2: Regra de confiança 12
  • 13. Mineração de Regra de Associação • Exemplo prático: • Itemset, X e Y, {Pão} e {Leite}; • Suporte: é comprado o nº de linha na qual Figura 3: Análise de cesta de Ocorrem os 2 itemset compras Suporte = 3/5 = 0,6 • Confiança: frequência em que o item consequente Y ocorre dado o itemset antecedente X; Confiança = ¾ = 0,75 Pão → Leite [suporte = 60%; confiança = 75%] 13
  • 14. Mineração de Regra de Associação • Problema: • Será que o fato de uma certa regra de associação grau de confiança alto é o suficiente para considerar a uma “boa regra”? Figura 5: banco de dados de transações de clientes Figura 4: Representação numérica de cada artigo do 14 supermercado
  • 15. Mineração de Regra de Associação • {Cerveja}, {Manteiga} só acontece juntos apenas em uma única transação; • Confiança de 100%; • Regra não é boa (suporte 0,1666%); • Boa: conf (r) > α e sup (r) ≥ β 15
  • 16. Mineração de Regra de Associação • As regras de associação surgiram como opção para responder questões como: – Encontre todas as regras que possuem “café” como termo consequente; – Encontre todas as regras que possuem “café” como termo antecedente; – Encontre todas as regras que possuem “café” como antecedente e “leite” como consequente; 16
  • 17. Medidas de Interesse Subjetiva e Objetiva • Críticas ao modelo suporte/confiança; • Problema: – Geração excessiva de regras; • Outras medidas foram proposta com o intuito de identificar as regras que são de fato relevante e úteis; • Medidas: objetivas e subjetivas; 17
  • 18. Medidas de Interesse Subjetiva e Objetiva • Medidas de Interesse Objetivas (MIO): • Índices estatísticos para avaliar a força da regra; • Regra interessante (valor do suporte > valor esperado); • Tipos: – Lift: regra de associação A → B, esta medida indica o quanto mais frequente torna-se B quando A ocorre; – Regra: Lift (A → B ) = conf (A → B)/sup(B) 18
  • 19. Medidas de Interesse Subjetiva e Objetiva • Medidas de Interesse Objetivas (MIO): • Tipos: – Rule Interest – Regra: RI (A → B ) = sup (A → B) – supesp(A → B) 19
  • 20. Medidas de Interesse Subjetiva e Objetiva • Medidas de Interesse Subjetiva (MIS): • Considera a opinião do analista; • As MIO identificam estatisticamente a força da regra; • Possui valores altos para a MIO e não subjetivas interessantes; • Fatores para tornar a regra de associação subjetivamente interessante: utilidade e a inesperabilidade; 20
  • 21. Medidas de Interesse Subjetiva e Objetiva • Medidas de Interesse Subjetiva (MIS): • Medida de utilidade: se o usuário pode fazer algo a partir dela; • Medida de inesperabilidade: considera que uma regra tem grande chance de ser interessante se contradiz as expectativas; • Ex.: associação entre fraldas e cervejas em um supermercado quando os consumidores são casais jovens; – É útil e inesperada; 21
  • 22. Mineração de Itemset Frequente • É uma tarefa normalmente executada sobre dados de transação de clientes; • O processo de descobrir itemset frequente pode ser decomposta em 2 etapas: – Encontrar todos os conjuntos de itemset frequente; – Utilizar os itemset frequentes obtidos para gerar de associações; 22
  • 23. Mineração de Itemset Frequente • Algoritmos para a descoberta de itemset frequente: – Apriori, FPGrowth, Max-miner, outros; • Apriori: – Mais utilizado; – Baseado no fato de usar conhecimento já obtidos nos itens anteriores; – Fases: geração, poda e validação; 23
  • 24. Outros tipos de Mineração de Regras de Associação • Regras de associação envolve conceitos de diferentes níveis: • Regras de Associação Multinível: • Pode ser extraído de forma eficiente usando hierarquias (generalização) Figura 6: Hierarquia de classificação 24
  • 25. Outros tipos de Mineração de Regras de Associação • Regras de Associação Multidimensional: • Capacidade de minerar regras com atributos categóricos ou quantitativos; • Ex.: data warehouse; • Considerando uma base de dados de um supermercado • Ex.: – (Sexo = “F”)^(30 < idade ≤ 35)→Forma de pagamento = “cartão de crédito”; 25
  • 26. Outros tipos de Mineração de Regras de Associação • Regras de Associação Hibrída: • Uma dimensão pode aparecer repetidas vezes; • Ex.: – (Sexo=“M”)^(Casado=“N”)^(Produto=“Cerveja”)→ (Produto=“Salaminho”) • É útil pois envolve dados pessoais e quantitativos; 26
  • 27. Outros tipos de Mineração de Regras de Associação • Regras de Associação Quantitativas: • Dados categóricos estão associados a algum tipo de classificação; • Dados quantitativos podem ser divididos em 2 classes: – Indicativo e real; • Dados quantitativos indicativos são dados numéricos que pertence ao conjunto dos números reais; – Ex.: 4 pães, 3 leites; 27
  • 28. Outros tipos de Mineração de Regras de Associação • Regras de Associação Quantitativas: • Dados quantitativos reais são dados numéricos que pertencem ao conjunto dos números reais e estão associados a um item específico; • Ex.: notas de provas; • Nos BD de aplicações é comum a ocorrência de dados quantitativos; 28
  • 29. Outros tipos de Mineração de Regras de Associação • Regras de Associação Quantitativas: • X → Y, itemset contém valores quantitativos; • Os itens são considerados como uma dupla (x, v); • Ex.: (Pães(cinco) → (Leite(dois); 29
  • 30. Restrições baseadas em mineração de exceções • É uma tarefa complicada; • Tipos de restrições: – Restrições do tipo de conhecimento; – Restrições de dados; – Restrições de padrões interessantes; – Restrições de regras; 30
  • 31. Restrições baseadas em mineração de exceções • Ex.: • “As famílias que compram couve e linguiça, não costumam compra brócolis”; • Identificação de clientes com diferentes perfis de compra; • {couve}→ {brócolis} 31
  • 32. Estado da Arte • Diversas áreas, tais como: Figura 7: compras no cartão de créditos Figura 8: serviços bancários 32
  • 33. Estado da Arte Figura 10: combinações incomuns Figura 9: históricos de pacientes de resgate de seguro 33
  • 34. Estado da Arte Figura 11: serviços de telecomunicações 34
  • 36. Aplicações Figura 13: regra de associação da situação dos alunos IFPI - PICOS Figura 14: regra de associação de lentes de contato 36
  • 37. Aplicações Figura 15: regra de associação de votação Figura 16: regra de associação de tempo 37
  • 38. Referências Bibliográficas • Costa, L. S. (2005). Mineração de padrões frequentes ortogonais e sua aplicação em classificação associativa. 108p. Dissertação de mestrado, apresentada a Universidade Federal de Minas Gerais. • Camargo, S. S. (2008). Mineração de regras de associação no problema de cesta de compras aplicada ao comércio varejista de confecção. 101p. Dissertação de mestrado, apresentada a Universidade Federal do Rio grande do Sul. • Gonçalves, E. C. (2004). Regras de Associação e suas Medidas de Interesse Objetivas e Subjetivas. Universidade Federal Fluminense. 38
  • 39. Referências Bibliográficas • Han, J.; Cheng, H.; Xin, D.; Yan, X. (2008). Frequent pattern mining: current status and future directions. Data Min Knowl Disc (2007) 15:55–86. DOI 10.1007/s10618-006-0059-1. • Han, J.; Kamber, M. (2000). Data Mining: Concepts and Techniques. Morgan Kaufmann. • Oyama, F. T. (2010). Mineração multirrelacional de regras de associação em grandes bases de dados. 140p. Dissertação de mestrado apresentada a Universidade Estadual Paulista. 39