SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
TP n°3 : Règles d’associations
Ben harrath arij 4infini
Note
Ce TP est à rendre en fin de séance.
Objectifs généraux
Dans ce TP, nous allons appliquer la méthode des règles associatives sur des échantillons de données, afin d’extraire
des dépendances entre des profils, des articles, des produits…en se basant sur les critères de pertinence étudiés
dans le cours (support, confidence, lift)
I. Etude des profils de demandes de Crédits
library : arules
//voir la description du dataset en pièce jointe (credit-german.doc)
1. Chargement du package :
2. Importation des données :
3. Transformation des données :
library(arules)
credit<-read.table(file="credit-german.txt",sep="t",header=T)
#transformer les données attributs-variables en données transactionnelles
cerdit1=as(credit,"transactions")
cerdit1
On Doit FAIRE DES transactions pour les transformer les données en tableau binaire
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
4. Extraction des règles :
Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums :
- support 0.25
- confiance 0.75
5. Affichage des dix premières règles :
#extraction des règles
rules <- apriori(credit, parameter = list(supp = 0.25, conf =0.75,target ="rule"))
inspect(head(sort(rules ),10))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
6. Affichages des cinq premiers lift :
#afficher les 5 règles avec le lift le + élevé
inspect(head(sort(rules,by="lift"),5))
On remarque que tous les valeurs varient si lift=1 donc on peut rien remarquer si lift<1 alors il s’agit d’une
coloration négative
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
II. Etude des relations entre les produits vendus dans une épicerie
library : arules, arulesViz
Groceries est un dataset de format transactions contenant 9835 opérations de ventes agrégées avec
169 catégories de produits, prises durant un mois.
1. Chargement du package :
2. Importation des données :
3. Extraction des règles :
Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums :
- support 0.001
- confiance 0.5
#charger les packages
library(arulesViz)
data("Groceries")
#affichage des transactions
LIST(Groceries)
#statistiques descriptives
…
rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.5,target ="rules"))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
5668 règles :Dont les supports varient de 0.001017 et 0.2267, les confiances de 0.5 à 1, et les valeurs de lift
de 1.957 à 18.996
On constate que les valeurs de lift sont tous supérieurs à 1 donc il s’agit d’une corrélation positive
Tester des différentes valeurs de supports et de confiance, ainsi que le paramétrage de la longueur des règles
Interpréter les résultats :
rules <- apriori(Groceries, parameter = list(supp = 0.01, conf = 0.025,target ="rules"))
on a changé les valeurs de support et de confiance
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Si on change les valeurs de support et de confiance les règles diminuent plus précisément :
Quand la confiance diminue le nombre de règles augmente, si le support diminue le nombre de règles
augmente.
Quand la confiance augmente le nombre de règles diminue, si le support augmente le nombre de règles
diminue.
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Aussi on a remarqué que le nombre des règles a diminué donc on constate que on changeant l’intervalle le
nombre des règles varient .
4. Affichages des dix premiers lift :
On remarque que lift est toujours positive donc il s’agit une forte corrélation
5. Interprétation
Proposer un nouveau rangement des produits dans l’épicerie.
Quand la confiance augmente le nombre de règles diminue ,si le support augmente le nombre de règles
diminue.
inspect(head(sort(rules, by="lift"),10))
On peut associer les instants food et les sodas et les popcorns et les hamburgers doivent être associé
ensemble ensemble.
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
6. Visualisation des Règles d’Association :
plot(rules)
#Paramétrage avancé de la visualisation
sel <- plot(rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
Le résultat de l'interaction. En utilisant une sélection de boîte les règles
avec la plus grande portance sont sélectionnés. En utilisant le bouton inspecter, les règles sont affichées
dans la borne-dessous du dispositif de traçage
plot(rules, method="matrix", measure=c("lift", "confidence"))
plot(rules, method="matrix", measure=c("lift", "confidence"),
control=list(reorder=TRUE))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
plot(rules, method="grouped")
Pour visualiser la matrice regroupés, nous utilisons un terrain de ballon avec des groupes antécédents.
La visualisation résultante est représentée sur la figure. Le groupe de la plupart des règles intéressantes
selon ascenseur sont présentés dans le coin supérieur gauche de l'intrigue. Il y a 3 règles qui contiennent
des produits alimentaires instantanée 2 autres items en antécédent et la conséquence est
hamburger meat
plot(rules, method="matrix", measure=c("lift", "confidence"))
La figures représente des tracés avec deux mesures d'intérêt. La légende est ici une matrice de couleurs.
En faisant correspondre un carré avec la couleur fermée dans la légende, nous pouvons déterminer à la
fois, le support et la confidence
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
III. Market Basket Analyse
Importation des données :
market_basket<- read.transactions(file='market_basket.csv', rm.duplicates=F, format='single', sep=',', cols=c(1,2));
market_basket<-read.table(file="market_basket.txt",sep="t",header=T)
market <- as(as.matrix(market_basket), "transactions")
basket_rules <- apriori(market, parameter = list(sup = 0.005, conf = 0.01, target="rules"))
summary(basket_rules )
On Remarque que le nombre deS règles est 23058938
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
basket_rules <- apriori(market, parameter = list(sup = 0.01, conf = 0.01, target="rules"))
summary(rules)
inspect(head(sort(basket_rules),10))
Les valeurs de lift sont égaux a 1 donc on peut rien remarquer
On va varier les valeurs de confiance et de support
Après la variance on remarque que le nombre des règles est 50
plot(basket_rules, method="graph", control=list(type="items"))
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
. Cette représentation se concentre sur la façon dont les règles sont composées des éléments individuels et des
spectacles qui partagent les règles.
plot(basket_rules, method="matrix3D", measure="lift")
Une représentation alternative est d'utiliser des barres 3D au lieu de rectangles de couleur pour modéliser les
antécédents en fonction des lifts
Data Mining
Data-mining@esprit.tn ESPRIT©2013-2014
sel <- plot(basket_rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)

Contenu connexe

Tendances

Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehousekhlifi z
 
Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionMohamed Heny SELMI
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
TP2 Big Data HBase
TP2 Big Data HBaseTP2 Big Data HBase
TP2 Big Data HBaseAmal Abid
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETLLilia Sfaxi
 
Association rule mining and Apriori algorithm
Association rule mining and Apriori algorithmAssociation rule mining and Apriori algorithm
Association rule mining and Apriori algorithmhina firdaus
 
Conception datawarehouse
Conception datawarehouseConception datawarehouse
Conception datawarehouseHassane Dkhissi
 
5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoiresBoris Guarisma
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisionsMariem Chaaben
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learningQuentin Ambard
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & SparkAlexia Audevart
 

Tendances (20)

Data Mining
Data MiningData Mining
Data Mining
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
 
Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décision
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
TP2 Big Data HBase
TP2 Big Data HBaseTP2 Big Data HBase
TP2 Big Data HBase
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETL
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 
Association rule mining and Apriori algorithm
Association rule mining and Apriori algorithmAssociation rule mining and Apriori algorithm
Association rule mining and Apriori algorithm
 
Conception datawarehouse
Conception datawarehouseConception datawarehouse
Conception datawarehouse
 
arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
 
5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires5.4 Arbres et forêts aléatoires
5.4 Arbres et forêts aléatoires
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisions
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
FP Growth Algorithm
FP Growth AlgorithmFP Growth Algorithm
FP Growth Algorithm
 
Cours php
Cours php Cours php
Cours php
 
Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)Le processus ETL (Extraction, Transformation, Chargement)
Le processus ETL (Extraction, Transformation, Chargement)
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learning
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
 
Theses Soutenues sous Direction et Co-Direction du Pr YOUSSFI
Theses Soutenues sous Direction et Co-Direction du Pr YOUSSFITheses Soutenues sous Direction et Co-Direction du Pr YOUSSFI
Theses Soutenues sous Direction et Co-Direction du Pr YOUSSFI
 

En vedette

Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013CollectifEtc
 
Aparato locomotor erika
Aparato locomotor erikaAparato locomotor erika
Aparato locomotor erikaErikaHorcajo
 
Vida y obra de charles baudelaire
Vida y obra de charles baudelaireVida y obra de charles baudelaire
Vida y obra de charles baudelairemanubusta03
 
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingMit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingConnected-Blog
 
Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Françoise Grave
 
Vivre en France
Vivre en France Vivre en France
Vivre en France Denis Papy
 
Brecha d. pirateria
Brecha d. pirateriaBrecha d. pirateria
Brecha d. pirateriayulissalizz
 
Dadaísmo
DadaísmoDadaísmo
Dadaísmokss23
 
0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje0.4 estrategias de aprendizaje
0.4 estrategias de aprendizajeramirez34
 
Cultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivaCultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivakportilla
 
Resultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaaResultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaadaniela4562
 
Kundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenKundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenConnected-Blog
 
Les ponts prestigieux du monde
Les ponts prestigieux du mondeLes ponts prestigieux du monde
Les ponts prestigieux du mondeVictor REIBEL
 
Abwasserförderschnecken
AbwasserförderschneckenAbwasserförderschnecken
AbwasserförderschneckenBittorf
 
Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Nicolas Gillet
 
Lugares del mundo
Lugares del mundoLugares del mundo
Lugares del mundoAngelitaNR
 

En vedette (20)

Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013Collectif Etc - SuperVille-1-2-3-feb-2013
Collectif Etc - SuperVille-1-2-3-feb-2013
 
Aparato locomotor erika
Aparato locomotor erikaAparato locomotor erika
Aparato locomotor erika
 
Vida y obra de charles baudelaire
Vida y obra de charles baudelaireVida y obra de charles baudelaire
Vida y obra de charles baudelaire
 
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail MarketingMit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
Mit E-Mail Intelligence zu mehr Erfolg im E-Mail Marketing
 
Presentación1
Presentación1Presentación1
Presentación1
 
Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015Bulletin de veille 15 du 5 au 12 janvier 2015
Bulletin de veille 15 du 5 au 12 janvier 2015
 
Vivre en France
Vivre en France Vivre en France
Vivre en France
 
Brecha d. pirateria
Brecha d. pirateriaBrecha d. pirateria
Brecha d. pirateria
 
Dadaísmo
DadaísmoDadaísmo
Dadaísmo
 
0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje0.4 estrategias de aprendizaje
0.4 estrategias de aprendizaje
 
Cultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectivaCultura, Ciudad y acción colectiva
Cultura, Ciudad y acción colectiva
 
Resultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaaResultados de la encuesta karime y danielaa
Resultados de la encuesta karime y danielaa
 
Hecho bebes
Hecho bebesHecho bebes
Hecho bebes
 
Kundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-SystemenKundenbindung mit digitalen Wallet-Systemen
Kundenbindung mit digitalen Wallet-Systemen
 
Lync Conference France – avril 2014
Lync Conference France – avril 2014Lync Conference France – avril 2014
Lync Conference France – avril 2014
 
Les ponts prestigieux du monde
Les ponts prestigieux du mondeLes ponts prestigieux du monde
Les ponts prestigieux du monde
 
Abwasserförderschnecken
AbwasserförderschneckenAbwasserförderschnecken
Abwasserförderschnecken
 
eReserve Produktpräsentation
eReserve ProduktpräsentationeReserve Produktpräsentation
eReserve Produktpräsentation
 
Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?Artisans : comment utiliser le web pour augmenter votre CA ?
Artisans : comment utiliser le web pour augmenter votre CA ?
 
Lugares del mundo
Lugares del mundoLugares del mundo
Lugares del mundo
 

Similaire à Ben harrath arijtp3 les règles d'association

Les algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationLes algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationHajer Trabelsi
 
TP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineTP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineBoubaker KHMILI
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaIlan Malka
 
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Aichétou Djimé Gallédou
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdfOuailChoukhairi
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertChristianMbip
 

Similaire à Ben harrath arijtp3 les règles d'association (8)

Analyzing a churn data set
Analyzing a churn data set Analyzing a churn data set
Analyzing a churn data set
 
Les algorithmes de génération des règles d association
Les algorithmes de génération des règles d associationLes algorithmes de génération des règles d association
Les algorithmes de génération des règles d association
 
TP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage MachineTP Fouille de données (Data Mining) et Apprentissage Machine
TP Fouille de données (Data Mining) et Apprentissage Machine
 
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalkaSalesforce Einstein analytics - Formation sur les-bases - By iMalka
Salesforce Einstein analytics - Formation sur les-bases - By iMalka
 
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
 
P15 Eda05 V D
P15 Eda05 V DP15 Eda05 V D
P15 Eda05 V D
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expert
 

Dernier

pdfcoffee.com_4-production-fond-des-puits-completion-pdf-free.pdf
pdfcoffee.com_4-production-fond-des-puits-completion-pdf-free.pdfpdfcoffee.com_4-production-fond-des-puits-completion-pdf-free.pdf
pdfcoffee.com_4-production-fond-des-puits-completion-pdf-free.pdfMedAbdelhayeSidiAhme
 
le probleme de la planification JSP exposee (2) (2).pptx
le probleme de la planification JSP exposee (2) (2).pptxle probleme de la planification JSP exposee (2) (2).pptx
le probleme de la planification JSP exposee (2) (2).pptximaneeaouattahee
 
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Ville de Châteauguay
 
mémoire genie civil presenté lors de la soutenance de mémoire
mémoire genie civil presenté lors de la soutenance de mémoiremémoire genie civil presenté lors de la soutenance de mémoire
mémoire genie civil presenté lors de la soutenance de mémoireEzechiasSteel
 
Algo II: les files cours + exercices corrigés
Algo II: les files cours + exercices corrigésAlgo II: les files cours + exercices corrigés
Algo II: les files cours + exercices corrigésSana REFAI
 

Dernier (6)

pdfcoffee.com_4-production-fond-des-puits-completion-pdf-free.pdf
pdfcoffee.com_4-production-fond-des-puits-completion-pdf-free.pdfpdfcoffee.com_4-production-fond-des-puits-completion-pdf-free.pdf
pdfcoffee.com_4-production-fond-des-puits-completion-pdf-free.pdf
 
le probleme de la planification JSP exposee (2) (2).pptx
le probleme de la planification JSP exposee (2) (2).pptxle probleme de la planification JSP exposee (2) (2).pptx
le probleme de la planification JSP exposee (2) (2).pptx
 
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
 
mémoire genie civil presenté lors de la soutenance de mémoire
mémoire genie civil presenté lors de la soutenance de mémoiremémoire genie civil presenté lors de la soutenance de mémoire
mémoire genie civil presenté lors de la soutenance de mémoire
 
JTC 2024 Bâtiment et Photovoltaïque.pdf
JTC 2024  Bâtiment et Photovoltaïque.pdfJTC 2024  Bâtiment et Photovoltaïque.pdf
JTC 2024 Bâtiment et Photovoltaïque.pdf
 
Algo II: les files cours + exercices corrigés
Algo II: les files cours + exercices corrigésAlgo II: les files cours + exercices corrigés
Algo II: les files cours + exercices corrigés
 

Ben harrath arijtp3 les règles d'association

  • 1. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 TP n°3 : Règles d’associations Ben harrath arij 4infini Note Ce TP est à rendre en fin de séance. Objectifs généraux Dans ce TP, nous allons appliquer la méthode des règles associatives sur des échantillons de données, afin d’extraire des dépendances entre des profils, des articles, des produits…en se basant sur les critères de pertinence étudiés dans le cours (support, confidence, lift) I. Etude des profils de demandes de Crédits library : arules //voir la description du dataset en pièce jointe (credit-german.doc) 1. Chargement du package : 2. Importation des données : 3. Transformation des données : library(arules) credit<-read.table(file="credit-german.txt",sep="t",header=T) #transformer les données attributs-variables en données transactionnelles cerdit1=as(credit,"transactions") cerdit1 On Doit FAIRE DES transactions pour les transformer les données en tableau binaire
  • 2. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 4. Extraction des règles : Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums : - support 0.25 - confiance 0.75 5. Affichage des dix premières règles : #extraction des règles rules <- apriori(credit, parameter = list(supp = 0.25, conf =0.75,target ="rule")) inspect(head(sort(rules ),10))
  • 3. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 6. Affichages des cinq premiers lift : #afficher les 5 règles avec le lift le + élevé inspect(head(sort(rules,by="lift"),5)) On remarque que tous les valeurs varient si lift=1 donc on peut rien remarquer si lift<1 alors il s’agit d’une coloration négative
  • 4. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 II. Etude des relations entre les produits vendus dans une épicerie library : arules, arulesViz Groceries est un dataset de format transactions contenant 9835 opérations de ventes agrégées avec 169 catégories de produits, prises durant un mois. 1. Chargement du package : 2. Importation des données : 3. Extraction des règles : Appliquer l’algorithme Apriori, en prenant en considération les seuils minimums : - support 0.001 - confiance 0.5 #charger les packages library(arulesViz) data("Groceries") #affichage des transactions LIST(Groceries) #statistiques descriptives … rules <- apriori(Groceries, parameter = list(supp = 0.001, conf = 0.5,target ="rules"))
  • 5. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 5668 règles :Dont les supports varient de 0.001017 et 0.2267, les confiances de 0.5 à 1, et les valeurs de lift de 1.957 à 18.996 On constate que les valeurs de lift sont tous supérieurs à 1 donc il s’agit d’une corrélation positive Tester des différentes valeurs de supports et de confiance, ainsi que le paramétrage de la longueur des règles Interpréter les résultats : rules <- apriori(Groceries, parameter = list(supp = 0.01, conf = 0.025,target ="rules")) on a changé les valeurs de support et de confiance
  • 6. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Si on change les valeurs de support et de confiance les règles diminuent plus précisément : Quand la confiance diminue le nombre de règles augmente, si le support diminue le nombre de règles augmente. Quand la confiance augmente le nombre de règles diminue, si le support augmente le nombre de règles diminue.
  • 7. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Aussi on a remarqué que le nombre des règles a diminué donc on constate que on changeant l’intervalle le nombre des règles varient . 4. Affichages des dix premiers lift : On remarque que lift est toujours positive donc il s’agit une forte corrélation 5. Interprétation Proposer un nouveau rangement des produits dans l’épicerie. Quand la confiance augmente le nombre de règles diminue ,si le support augmente le nombre de règles diminue. inspect(head(sort(rules, by="lift"),10)) On peut associer les instants food et les sodas et les popcorns et les hamburgers doivent être associé ensemble ensemble.
  • 8. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 6. Visualisation des Règles d’Association : plot(rules) #Paramétrage avancé de la visualisation sel <- plot(rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)
  • 9. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 Le résultat de l'interaction. En utilisant une sélection de boîte les règles avec la plus grande portance sont sélectionnés. En utilisant le bouton inspecter, les règles sont affichées dans la borne-dessous du dispositif de traçage plot(rules, method="matrix", measure=c("lift", "confidence")) plot(rules, method="matrix", measure=c("lift", "confidence"), control=list(reorder=TRUE))
  • 10. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 plot(rules, method="grouped") Pour visualiser la matrice regroupés, nous utilisons un terrain de ballon avec des groupes antécédents. La visualisation résultante est représentée sur la figure. Le groupe de la plupart des règles intéressantes selon ascenseur sont présentés dans le coin supérieur gauche de l'intrigue. Il y a 3 règles qui contiennent des produits alimentaires instantanée 2 autres items en antécédent et la conséquence est hamburger meat plot(rules, method="matrix", measure=c("lift", "confidence")) La figures représente des tracés avec deux mesures d'intérêt. La légende est ici une matrice de couleurs. En faisant correspondre un carré avec la couleur fermée dans la légende, nous pouvons déterminer à la fois, le support et la confidence
  • 11. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 III. Market Basket Analyse Importation des données : market_basket<- read.transactions(file='market_basket.csv', rm.duplicates=F, format='single', sep=',', cols=c(1,2)); market_basket<-read.table(file="market_basket.txt",sep="t",header=T) market <- as(as.matrix(market_basket), "transactions") basket_rules <- apriori(market, parameter = list(sup = 0.005, conf = 0.01, target="rules")) summary(basket_rules ) On Remarque que le nombre deS règles est 23058938
  • 12. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 basket_rules <- apriori(market, parameter = list(sup = 0.01, conf = 0.01, target="rules")) summary(rules) inspect(head(sort(basket_rules),10)) Les valeurs de lift sont égaux a 1 donc on peut rien remarquer On va varier les valeurs de confiance et de support Après la variance on remarque que le nombre des règles est 50 plot(basket_rules, method="graph", control=list(type="items"))
  • 13. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 . Cette représentation se concentre sur la façon dont les règles sont composées des éléments individuels et des spectacles qui partagent les règles. plot(basket_rules, method="matrix3D", measure="lift") Une représentation alternative est d'utiliser des barres 3D au lieu de rectangles de couleur pour modéliser les antécédents en fonction des lifts
  • 14. Data Mining Data-mining@esprit.tn ESPRIT©2013-2014 sel <- plot(basket_rules, measure=c("support", "lift"), shading="confidence", interactive=TRUE)