SlideShare ist ein Scribd-Unternehmen logo
1 von 38
Les algorithmes de 
génération des règles 
d’association 
Hajer Trabelsi 
Hana Romdhane 
2014 
1
Plan 
 Introduction 
 Description du domaine 
 Règle d’association 
 Recherche de règle d’association 
 Génération des ensembles d’items fréquents 
1- Algorithme Apriori 
2- Algorithme Close 
 Génération des règles 
1- Algorithme GEN-REGLES 
 Conclusion et perspective 
 Références 
2
Introduction(1) 
 Nous présentons une approche assez récente de fouille de donnée qui est 
fondé sur la découverte de règles d’association à partir d’un ensemble de 
données qu’on appellera transaction (Agrawal et al. 1993). 
 Ce thème est considéré aujourd’hui comme faisant parti des approches 
d’apprentissage symbolique non supervisé, utilisé dans le domaine de fouille 
de données (data mining) et d’extraction de connaissances. 
 Un exemple d’application assez courant est l’analyse des logs web sur un 
serveur web afin de découvrir de comportements utilisateur (web usage 
mining) dans le but d’adapter ou de personnaliser le site ou de découvrir des 
comportements types sur certains sites (E-commerce par exemple). 
3
Introduction(2) 
 Un exemple classique de l’utilité de cette approche est le panier du 
ménagère qui décrit un ensemble d’achats effectué au supermarché ; les 
règles d’association permet de découvrir de régularités dans l’ensemble de 
transactions comme par exemple : Si fromage alors vin rouge, etc. 
 Ces règles permettent par exemple au gérant de proposer des bons de 
réductions significatifs sur les achats futurs des clients ! ! 
4
Description du domaine(1) 
 Un domaine d’application donné doit être décrit par une liste limitée 
d’atomes qu’on appelle items. Par exemple, pour l’application du panier de 
ménagère la liste des items correspond à l’ensemble d’articles disponibles 
dans le supermarché [vin; fromage; chocolat; etc]. 
 Un ensemble d’items est une succession d’items exprimée dans un ordre 
donné et prédéfini. 
 Une transaction est un ensemble d’items I {i1, i2,i3, etc} . Un ensemble de 
transactions T {t1,t2,t3,t4, etc} correspond à un ensemble d’apprentissage 
qu’on va utiliser dans la suite pour déterminer les règles d’associations. 
Par exemple, deux transactions possibles qui décrivent les achats dans un 
supermarché Sont : 
t1 = {Vin Fromage Viande} et t2 = {Vin Fromage Chocolat} 
5
Description du domaine(2) 
 Remarquer bien qu’un ordre doit être défini sur l’ensemble d’items, 
autrement dit, dans toutes les transactions qui contiennent Vin et Fromage, 
Vin doit figurer avant Fromage. 
 Le volume de la transaction est le nombre d’items contenu dans la 
transaction. 
 Une notion importante pour un ensemble d’items est son support qui fait 
référence au nombre de transactions observées qui le contiennent. 
6
Description du domaine(3) 
 Exemple : 
TID Items 
{Vin, Fromage, Chocolat} 
{Vin, Fromage, Viande} 
{Fromage, Chocolat, Viande} 
{Vin, Fromage, Chocolat} 
{Vin, Coca, Chips} 
Panier de la ménagère 
1 
2 
3 
4 
5 
Le support {Vin, Fromage, Chocolat} égale à 2 7
Règle d’association 
 Une règle d’association est une application sous la forme X  Y ou X et Y 
sont des ensembles d’items disjoints. 
 La force d’une règle d’association peut être mesurée en utilisant son support 
et sa confiance 
8
Règle d’association(2) 
Exemple: 
 Considérons la règle {vin , fromage}  {chocolat} 
 Le support du l’ensemble {vin , fromage, chocolat} étant égal à 2 et le 
nombre total du transaction est égal à 5, le support de la règle est égal 2/5 = 
0.4 
 La confiance est obtenue en divisant le support de l’ensemble {vin , 
fromage, chocolat} par le support de l’ensemble {vin , fromage} et comme il 
y’a 3 transactions contenant {vin , fromage} la confiance de cette règle 
est 2/3=0.67 
9
Règle d’association(3) 
 Le support est important parce qu’une règle qui à un 
support faible peut être observé seulement par hasard. 
 La confiance mesure la pertinence de l’inférence fait 
par une règle. 
10
Règle d’association: Recherche de règle 
d’association(1) 
 Le problème de la recherche de règle d’association peut se formuler comme 
suit : 
 Etant donnée un ensemble de transaction T, trouvé toute les règles 
d’association ayant un support ≥ minsup et une confiance ≥ minconf où 
minsup et minconf sont des seuils pour le support et la confiance . 
 Il n’est pas envisageable de chercher toute les règles d’association pour 
ensuite sélectionné celle qui ont un support et une confiance suffisante, les 
coûts de calcule serait prohibitifs . 
 Un premier pas permettant d’améliorer les performances d’un algorithme 
de recherche de règle consiste à découpler les exigences sur le support et la 
confiance. 
11
Règle d’association: Recherche de règle 
d’association(2) 
 La définition du support montre que le support d’une règle X  Y ne dépend 
que de X ⋃ Y 
Exemple: 
{Vin, Fromage}{Chocolat} 
{Vin, Chocolat}{Fromage} 
{Vin} {Chocolat , Fromage} 
 les règles suivantes ont le même support car elles sont toute 
construites à partir du même ensemble {Vin, Fromage, Chocolat} . 
12
Règle d’association: Recherche de règle 
d’association(3) 
 Une stratégie adoptée par la plupart des algorithmes de 
recherche de règle d’association consiste à décomposer le 
problème en deux étapes: 
 Génération des ensembles d’items fréquents 
 Génération des règles 
13
Règle d’association: Génération des ensembles 
d’items fréquents 
 L’objectif est de trouver tous les ensembles 
d’items qui satisfont le seuil minsup. 
14
Algorithmes d'extraction des items 
fréquents 
 APRIORI (Agrawal & Srikant, 1994) 
 Close (Pasquier et al, 1998 ) 
 OCD (Mannila & al, 1994) qui réalisent un nombre de balayages du 
contexte égal à la taille des plus longs itemsets fréquents 
 Partition (Savasere, 1995) qui autorise la parallélisation du processus 
d'extraction 
 DIC - Dynamic Itemset Counting (Brin, 1997) qui réduit le nombre de 
balayages du contexte en considérant les itemsets de plusieurs tailles 
différentes lors de chaque itération 
15
1- Algorithme APRIORI 
 Principe de l’algorithme A Priori: 
 Génération d’ensembles d’items 
 Calcul des fréquences des ensembles d’items 
 On garde les ensembles d’items avec un support 
minimum: les ensembles d’items fréquents 
16
17
Exemple avec minsup=2 
18 
TID Items 
100 1 3 4 
200 2 3 5 
300 1 2 3 5 
400 2 5 
itemset sup. 
{1} 2 
{2} 3 
{3} 3 
{4} 1 
{5} 3 
itemset sup. 
{1} 2 
{2} 3 
{3} 3 
{5} 3 
C1 
Parcours D 
F1 
itemset 
{1 2} 
{1 3} 
{1 5} 
{2 3} 
{2 5} 
{3 5} 
itemset sup 
{1 2} 1 
{1 3} 2 
{1 5} 1 
{2 3} 2 
{2 5} 3 
{3 5} 2 
itemset sup 
{1 3} 2 
{2 3} 2 
{2 5} 3 
{3 5} 2 
F2 
C2 C2 
Parcours D 
C3 itemset F3 
{2 3 5} 
Parcours D itemset sup 
{2 3 5} 2
 Points faibles (algorithme apriori) ! 
 Le calcul des supports est coûteux 
 La générations des règles est coûteuse 
 Le parcours des données initiales est récurrent 
19
2- Algorithme Close 
 repose sur l'extraction de générateurs d'ensemble de mots 
fermés fréquents 
 La fermeture d'un ensemble de mots A est un ensemble de 
mots B tel que B apparait dans les mêmes textes que A. 
 Pour la calculer on utilise deux fonctions : 
f : associe à un ensemble de mots les textes où il apparait 
g : associe à un ensemble de textes les mots qu'ils ont en 
commun 
20
Exemple: 
 f({D}) = {1,5} 
 g({1,5}) = {B,D} 
 fermeture({D}) = {B,D} 
 {D} est un générateur de {B,D} 
21
 Principe de l’algorithme Close: 
 Initialisation de l'ensemble des générateurs avec 
l'ensemble des singletons formés par les mots du corpus 
 Calcul de la fermeture des générateurs de niveau k et 
de leur support 
 Ajout des fermetures des générateurs à l'ensemble des 
ensembles de mots fermes fréquents 
 Génération des générateurs de niveau k + 1 
22
23
Exemple : 
24
Exemple : 
25
Exemple : 
26
Exemple : 
27
Exemple : 
28
Exemple : 
29
Exemple : 
30 
 On ajoute {B}, {C} et {B, D} à l'ensemble de mots fréquents 
 On conserve {B}, {C} et {D} pour calculer les générateurs de niveau supérieur
Exemple : 
 À partir de {{B}, {C} et {D} }, on génère les ensembles {BC}; {BD}; {CD} 
 Pas de nouvel ensemble de mots fréquents 
31
Règle d’association: Génération des 
règles 
 L’objectif est d’extraire toutes les règles de grande 
confiance à partir des ensembles d’items fréquents 
trouvés dans l’étape précédente. Ces règles sont appelées 
règles fortes. 
32
Algorithmes d'extraction des règles 
 GEN-REGLES (Agrawal & Al, 1994) 
 OPUS (Webb, G.I. (1995) ) 
 GEN_RULES, Eclat, GUHA,Tertius… 
33
Algorithme GEN-REGLES 
34
Exemple avec minconf=1/2 
35
Conclusion et perspective 
 Cette approche est très importante dans plusieurs domaines tel que le 
domaine médical, commercial,… 
 Plusieurs algorithmes sont également utilisé pour l’extraction d items 
fréquents la base de la génération des règles d'association et la 
réduction transitive de la base 
 Les perspectives de travaux ultérieurs concernent l'étude des diverses 
techniques d'implémentation et structures de données afin d'améliorer 
les processus d'extraction de connaissances dans les bases de données 
selon leurs propriétés et les différents types de données. 
36
Références 
 [AS94] : R. Agrawal, R. Srikant. Fast algorithms for mining association rules in large 
databases. Proc. VLDB conf., pp 478−499, September 1994. 
 [BMUT97] : S. Brin, R. Motwani, J. D. Ullman, S. Tsur. Dynamic itemset counting and 
implication rules for market basket data. Proc. SIGMOD conf., pp 255−264, May 1997. 
 [MTV94] : H. Mannila, H. Toivonen, A. I. Verkamo. Efficient algorithms for discovering 
association rules. AAAI KDD workshop, pp 181−192, July 1994. 
 [SON95] : A. Savasere, E. Omiecinski, S. Navathe. An efficient algorithm for mining 
association rules in large databases. Proc. VLDB conf., pp 432−444, September 1995. 
 Data Mining. Algorithmes d’extraction et de reduction des regles d’association dans les 
bases de donnees (PhDThesis Pasquier 2000) 
 Extraction de regles d'association - Thierry Lecroq (Univ. Rouen) 
 GÉNÉRATION DES RÈGLES D'ASSOCIATION: TREILLIS DE CONCEPTS DENSES (ALAlN 
BOULANGER) 
37
Questions ? 
38

Weitere ähnliche Inhalte

Was ist angesagt?

Cours des bases de données
Cours des bases de données Cours des bases de données
Cours des bases de données yassine kchiri
 
AI Apprentissage Automatique, Machine Learnig
AI Apprentissage Automatique, Machine LearnigAI Apprentissage Automatique, Machine Learnig
AI Apprentissage Automatique, Machine LearnigFelipe Sanchez Garzon
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-miningSawsen Larbi
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdfOuailChoukhairi
 
Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionMohamed Heny SELMI
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data miningDonia Hammami
 
Regression lineaire simple
Regression lineaire simpleRegression lineaire simple
Regression lineaire simpleMehdi Rajawi
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIsmail CHAIB
 
Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningHakim Nasaoui
 
Diaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdfDiaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdfEST-UMI de Meknès
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite completChahrawoods Dmz
 
methode echantillonnage
methode echantillonnagemethode echantillonnage
methode echantillonnageMouhcine Rabi
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_amanMehdi Aman
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Mohamed Heny SELMI
 
Ontologie concept applications
Ontologie concept applicationsOntologie concept applications
Ontologie concept applicationsbenouini rachid
 
Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de donnéesAbdoulaye Dieng
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreGroupe ARTICQUE
 

Was ist angesagt? (20)

Cours des bases de données
Cours des bases de données Cours des bases de données
Cours des bases de données
 
AI Apprentissage Automatique, Machine Learnig
AI Apprentissage Automatique, Machine LearnigAI Apprentissage Automatique, Machine Learnig
AI Apprentissage Automatique, Machine Learnig
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-mining
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
 
Data mining - Associativité
Data mining - AssociativitéData mining - Associativité
Data mining - Associativité
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décision
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Techniques du data mining
Techniques du data miningTechniques du data mining
Techniques du data mining
 
Regression lineaire simple
Regression lineaire simpleRegression lineaire simple
Regression lineaire simple
 
Introduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniquesIntroduction au datamining, concepts et techniques
Introduction au datamining, concepts et techniques
 
Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learning
 
Diaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdfDiaporamas-Bases de données.pdf
Diaporamas-Bases de données.pdf
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
 
methode echantillonnage
methode echantillonnagemethode echantillonnage
methode echantillonnage
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)
 
Ontologie concept applications
Ontologie concept applicationsOntologie concept applications
Ontologie concept applications
 
Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de données
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritère
 

Ähnlich wie Les algorithmes de génération des règles d association

Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association ARIJ BenHarrath
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaIlan Malka
 
[DAF 2015] Atelier API AT internet
[DAF 2015] Atelier API AT internet[DAF 2015] Atelier API AT internet
[DAF 2015] Atelier API AT internetAT Internet
 
Design Pattern introduction
Design Pattern introductionDesign Pattern introduction
Design Pattern introductionneuros
 
Cours ML et Deep Learning M2 2022-2023.pdf
Cours ML et Deep Learning M2 2022-2023.pdfCours ML et Deep Learning M2 2022-2023.pdf
Cours ML et Deep Learning M2 2022-2023.pdfUrbainNgatoua
 
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v160 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16CERTyou Formation
 
TP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineTP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineBoubaker KHMILI
 
De 20 000 à 4 millions d'utilisateurs : mode d'emploi
De 20 000 à 4 millions d'utilisateurs : mode d'emploiDe 20 000 à 4 millions d'utilisateurs : mode d'emploi
De 20 000 à 4 millions d'utilisateurs : mode d'emploiKhanh Maudoux
 
Génération automatique de texte
Génération automatique de texteGénération automatique de texte
Génération automatique de texteEstelle Delpech
 
analysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfanalysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfLeonLovensky
 
Initiation à l'algorithmique
Initiation à l'algorithmiqueInitiation à l'algorithmique
Initiation à l'algorithmiqueAbdoulaye Dieng
 
resume-theorique-m102-0311-6182a97340fbc.pdf
resume-theorique-m102-0311-6182a97340fbc.pdfresume-theorique-m102-0311-6182a97340fbc.pdf
resume-theorique-m102-0311-6182a97340fbc.pdfFootballLovers9
 
Machine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptxMachine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptxbely26
 

Ähnlich wie Les algorithmes de génération des règles d association (20)

associations5.ppt
associations5.pptassociations5.ppt
associations5.ppt
 
arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
 
Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association Ben harrath arijtp3 les règles d'association
Ben harrath arijtp3 les règles d'association
 
Data Mining
Data MiningData Mining
Data Mining
 
cm-bd.pdf
cm-bd.pdfcm-bd.pdf
cm-bd.pdf
 
algo-imsi-2.pdf
algo-imsi-2.pdfalgo-imsi-2.pdf
algo-imsi-2.pdf
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
 
[DAF 2015] Atelier API AT internet
[DAF 2015] Atelier API AT internet[DAF 2015] Atelier API AT internet
[DAF 2015] Atelier API AT internet
 
Design Pattern introduction
Design Pattern introductionDesign Pattern introduction
Design Pattern introduction
 
Cours ML et Deep Learning M2 2022-2023.pdf
Cours ML et Deep Learning M2 2022-2023.pdfCours ML et Deep Learning M2 2022-2023.pdf
Cours ML et Deep Learning M2 2022-2023.pdf
 
HTML5
HTML5HTML5
HTML5
 
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v160 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
0 a005g formation-introduction-a-ibm-spss-modeler-et-au-data-mining-v16
 
TP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineTP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage Machine
 
De 20 000 à 4 millions d'utilisateurs : mode d'emploi
De 20 000 à 4 millions d'utilisateurs : mode d'emploiDe 20 000 à 4 millions d'utilisateurs : mode d'emploi
De 20 000 à 4 millions d'utilisateurs : mode d'emploi
 
Génération automatique de texte
Génération automatique de texteGénération automatique de texte
Génération automatique de texte
 
analysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdfanalysez-des-donnees-avec-excel documen.pdf
analysez-des-donnees-avec-excel documen.pdf
 
Initiation à l'algorithmique
Initiation à l'algorithmiqueInitiation à l'algorithmique
Initiation à l'algorithmique
 
resume-theorique-m102-0311-6182a97340fbc.pdf
resume-theorique-m102-0311-6182a97340fbc.pdfresume-theorique-m102-0311-6182a97340fbc.pdf
resume-theorique-m102-0311-6182a97340fbc.pdf
 
Formation cakephp
Formation cakephpFormation cakephp
Formation cakephp
 
Machine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptxMachine Leargning_supérvisé.pptx
Machine Leargning_supérvisé.pptx
 

Kürzlich hochgeladen

Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxrajaakiass01
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxikospam0
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLElebaobabbleu
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesMohammedAmineHatoch
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetJeanYvesMoine
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesUnidad de Espiritualidad Eudista
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxabdououanighd
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKNassimaMdh
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcourshalima98ahlmohamed
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxhamzagame
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfAmgdoulHatim
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkRefRama
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxShinyaHilalYamanaka
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...Universidad Complutense de Madrid
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdftrendingv83
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Technologia Formation
 

Kürzlich hochgeladen (19)

Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcours
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdf
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 

Les algorithmes de génération des règles d association

  • 1. Les algorithmes de génération des règles d’association Hajer Trabelsi Hana Romdhane 2014 1
  • 2. Plan  Introduction  Description du domaine  Règle d’association  Recherche de règle d’association  Génération des ensembles d’items fréquents 1- Algorithme Apriori 2- Algorithme Close  Génération des règles 1- Algorithme GEN-REGLES  Conclusion et perspective  Références 2
  • 3. Introduction(1)  Nous présentons une approche assez récente de fouille de donnée qui est fondé sur la découverte de règles d’association à partir d’un ensemble de données qu’on appellera transaction (Agrawal et al. 1993).  Ce thème est considéré aujourd’hui comme faisant parti des approches d’apprentissage symbolique non supervisé, utilisé dans le domaine de fouille de données (data mining) et d’extraction de connaissances.  Un exemple d’application assez courant est l’analyse des logs web sur un serveur web afin de découvrir de comportements utilisateur (web usage mining) dans le but d’adapter ou de personnaliser le site ou de découvrir des comportements types sur certains sites (E-commerce par exemple). 3
  • 4. Introduction(2)  Un exemple classique de l’utilité de cette approche est le panier du ménagère qui décrit un ensemble d’achats effectué au supermarché ; les règles d’association permet de découvrir de régularités dans l’ensemble de transactions comme par exemple : Si fromage alors vin rouge, etc.  Ces règles permettent par exemple au gérant de proposer des bons de réductions significatifs sur les achats futurs des clients ! ! 4
  • 5. Description du domaine(1)  Un domaine d’application donné doit être décrit par une liste limitée d’atomes qu’on appelle items. Par exemple, pour l’application du panier de ménagère la liste des items correspond à l’ensemble d’articles disponibles dans le supermarché [vin; fromage; chocolat; etc].  Un ensemble d’items est une succession d’items exprimée dans un ordre donné et prédéfini.  Une transaction est un ensemble d’items I {i1, i2,i3, etc} . Un ensemble de transactions T {t1,t2,t3,t4, etc} correspond à un ensemble d’apprentissage qu’on va utiliser dans la suite pour déterminer les règles d’associations. Par exemple, deux transactions possibles qui décrivent les achats dans un supermarché Sont : t1 = {Vin Fromage Viande} et t2 = {Vin Fromage Chocolat} 5
  • 6. Description du domaine(2)  Remarquer bien qu’un ordre doit être défini sur l’ensemble d’items, autrement dit, dans toutes les transactions qui contiennent Vin et Fromage, Vin doit figurer avant Fromage.  Le volume de la transaction est le nombre d’items contenu dans la transaction.  Une notion importante pour un ensemble d’items est son support qui fait référence au nombre de transactions observées qui le contiennent. 6
  • 7. Description du domaine(3)  Exemple : TID Items {Vin, Fromage, Chocolat} {Vin, Fromage, Viande} {Fromage, Chocolat, Viande} {Vin, Fromage, Chocolat} {Vin, Coca, Chips} Panier de la ménagère 1 2 3 4 5 Le support {Vin, Fromage, Chocolat} égale à 2 7
  • 8. Règle d’association  Une règle d’association est une application sous la forme X  Y ou X et Y sont des ensembles d’items disjoints.  La force d’une règle d’association peut être mesurée en utilisant son support et sa confiance 8
  • 9. Règle d’association(2) Exemple:  Considérons la règle {vin , fromage}  {chocolat}  Le support du l’ensemble {vin , fromage, chocolat} étant égal à 2 et le nombre total du transaction est égal à 5, le support de la règle est égal 2/5 = 0.4  La confiance est obtenue en divisant le support de l’ensemble {vin , fromage, chocolat} par le support de l’ensemble {vin , fromage} et comme il y’a 3 transactions contenant {vin , fromage} la confiance de cette règle est 2/3=0.67 9
  • 10. Règle d’association(3)  Le support est important parce qu’une règle qui à un support faible peut être observé seulement par hasard.  La confiance mesure la pertinence de l’inférence fait par une règle. 10
  • 11. Règle d’association: Recherche de règle d’association(1)  Le problème de la recherche de règle d’association peut se formuler comme suit :  Etant donnée un ensemble de transaction T, trouvé toute les règles d’association ayant un support ≥ minsup et une confiance ≥ minconf où minsup et minconf sont des seuils pour le support et la confiance .  Il n’est pas envisageable de chercher toute les règles d’association pour ensuite sélectionné celle qui ont un support et une confiance suffisante, les coûts de calcule serait prohibitifs .  Un premier pas permettant d’améliorer les performances d’un algorithme de recherche de règle consiste à découpler les exigences sur le support et la confiance. 11
  • 12. Règle d’association: Recherche de règle d’association(2)  La définition du support montre que le support d’une règle X  Y ne dépend que de X ⋃ Y Exemple: {Vin, Fromage}{Chocolat} {Vin, Chocolat}{Fromage} {Vin} {Chocolat , Fromage}  les règles suivantes ont le même support car elles sont toute construites à partir du même ensemble {Vin, Fromage, Chocolat} . 12
  • 13. Règle d’association: Recherche de règle d’association(3)  Une stratégie adoptée par la plupart des algorithmes de recherche de règle d’association consiste à décomposer le problème en deux étapes:  Génération des ensembles d’items fréquents  Génération des règles 13
  • 14. Règle d’association: Génération des ensembles d’items fréquents  L’objectif est de trouver tous les ensembles d’items qui satisfont le seuil minsup. 14
  • 15. Algorithmes d'extraction des items fréquents  APRIORI (Agrawal & Srikant, 1994)  Close (Pasquier et al, 1998 )  OCD (Mannila & al, 1994) qui réalisent un nombre de balayages du contexte égal à la taille des plus longs itemsets fréquents  Partition (Savasere, 1995) qui autorise la parallélisation du processus d'extraction  DIC - Dynamic Itemset Counting (Brin, 1997) qui réduit le nombre de balayages du contexte en considérant les itemsets de plusieurs tailles différentes lors de chaque itération 15
  • 16. 1- Algorithme APRIORI  Principe de l’algorithme A Priori:  Génération d’ensembles d’items  Calcul des fréquences des ensembles d’items  On garde les ensembles d’items avec un support minimum: les ensembles d’items fréquents 16
  • 17. 17
  • 18. Exemple avec minsup=2 18 TID Items 100 1 3 4 200 2 3 5 300 1 2 3 5 400 2 5 itemset sup. {1} 2 {2} 3 {3} 3 {4} 1 {5} 3 itemset sup. {1} 2 {2} 3 {3} 3 {5} 3 C1 Parcours D F1 itemset {1 2} {1 3} {1 5} {2 3} {2 5} {3 5} itemset sup {1 2} 1 {1 3} 2 {1 5} 1 {2 3} 2 {2 5} 3 {3 5} 2 itemset sup {1 3} 2 {2 3} 2 {2 5} 3 {3 5} 2 F2 C2 C2 Parcours D C3 itemset F3 {2 3 5} Parcours D itemset sup {2 3 5} 2
  • 19.  Points faibles (algorithme apriori) !  Le calcul des supports est coûteux  La générations des règles est coûteuse  Le parcours des données initiales est récurrent 19
  • 20. 2- Algorithme Close  repose sur l'extraction de générateurs d'ensemble de mots fermés fréquents  La fermeture d'un ensemble de mots A est un ensemble de mots B tel que B apparait dans les mêmes textes que A.  Pour la calculer on utilise deux fonctions : f : associe à un ensemble de mots les textes où il apparait g : associe à un ensemble de textes les mots qu'ils ont en commun 20
  • 21. Exemple:  f({D}) = {1,5}  g({1,5}) = {B,D}  fermeture({D}) = {B,D}  {D} est un générateur de {B,D} 21
  • 22.  Principe de l’algorithme Close:  Initialisation de l'ensemble des générateurs avec l'ensemble des singletons formés par les mots du corpus  Calcul de la fermeture des générateurs de niveau k et de leur support  Ajout des fermetures des générateurs à l'ensemble des ensembles de mots fermes fréquents  Génération des générateurs de niveau k + 1 22
  • 23. 23
  • 30. Exemple : 30  On ajoute {B}, {C} et {B, D} à l'ensemble de mots fréquents  On conserve {B}, {C} et {D} pour calculer les générateurs de niveau supérieur
  • 31. Exemple :  À partir de {{B}, {C} et {D} }, on génère les ensembles {BC}; {BD}; {CD}  Pas de nouvel ensemble de mots fréquents 31
  • 32. Règle d’association: Génération des règles  L’objectif est d’extraire toutes les règles de grande confiance à partir des ensembles d’items fréquents trouvés dans l’étape précédente. Ces règles sont appelées règles fortes. 32
  • 33. Algorithmes d'extraction des règles  GEN-REGLES (Agrawal & Al, 1994)  OPUS (Webb, G.I. (1995) )  GEN_RULES, Eclat, GUHA,Tertius… 33
  • 36. Conclusion et perspective  Cette approche est très importante dans plusieurs domaines tel que le domaine médical, commercial,…  Plusieurs algorithmes sont également utilisé pour l’extraction d items fréquents la base de la génération des règles d'association et la réduction transitive de la base  Les perspectives de travaux ultérieurs concernent l'étude des diverses techniques d'implémentation et structures de données afin d'améliorer les processus d'extraction de connaissances dans les bases de données selon leurs propriétés et les différents types de données. 36
  • 37. Références  [AS94] : R. Agrawal, R. Srikant. Fast algorithms for mining association rules in large databases. Proc. VLDB conf., pp 478−499, September 1994.  [BMUT97] : S. Brin, R. Motwani, J. D. Ullman, S. Tsur. Dynamic itemset counting and implication rules for market basket data. Proc. SIGMOD conf., pp 255−264, May 1997.  [MTV94] : H. Mannila, H. Toivonen, A. I. Verkamo. Efficient algorithms for discovering association rules. AAAI KDD workshop, pp 181−192, July 1994.  [SON95] : A. Savasere, E. Omiecinski, S. Navathe. An efficient algorithm for mining association rules in large databases. Proc. VLDB conf., pp 432−444, September 1995.  Data Mining. Algorithmes d’extraction et de reduction des regles d’association dans les bases de donnees (PhDThesis Pasquier 2000)  Extraction de regles d'association - Thierry Lecroq (Univ. Rouen)  GÉNÉRATION DES RÈGLES D'ASSOCIATION: TREILLIS DE CONCEPTS DENSES (ALAlN BOULANGER) 37