SlideShare ist ein Scribd-Unternehmen logo
1 von 23
Downloaden Sie, um offline zu lesen
Exploitation de signaux sociaux pour estimer la pertinence apriori d’une ressource 
Ismaël BADACHE 
Mohand BOUGHANEM 
2013/2014 
CORIA’14
Plan de la présentation 
Introduction 
État de l’art 
Modèle de RI sociale 
Evaluation expérimentale 
4 
1 
3 
Conclusion 
2 
5
1.1 Émergence du Web social 
1 
Nombre d’utilisateurs actifs2013 
1,2 
1,4 
1,7 
2,4 
2011 
2012 
2013 
2014 
Nombre d’internautes 
Contenu social par 1 minute 
41000 Publications 
1,8 Millions J’aime 
~350 GO de données 
Facebook 
Source: 
blogdumoderateur.com 
quantcast.com 
semiocast.com 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
Vidéo 
Photo 
Page Web 
Ressources Web 
Ressource. . . 
Réseaux sociaux 
Marques 
Commentaires/Avis 
Partages/Recommandes 
Mentions/Votes 
Like/+1 
Interactions 
Extraction et quantification des propriétés sociales 
Modèle de RIIncorporationRequêteRéputation 
2Résultats 
Fig1. Schéma de la RI sociale par rapport à notre approche 
Signaux Sociaux 
(Source d’évidence) Popularité. . etc.
1.2 Questions de recherche 
Quellessontlespropriétéssocialesutilespourévaluerlapertinenceapriorid’uneressource? 
2 
Commenttraduirelessignauxsociauxenpropriétéssociales? 
1 
Quelmodèlethéoriquepourcombinerlapertinenceapriorid’uneressourceetsapertinencethématique? 
3 
3 
Quelestl’impactdecespropriétéssocialessurlesperformancesd’unsystèmedeRI? 
4 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
2.1 Synthèse des travaux 
4 
Sources d’évidence 
Propriétés 
Modèles 
Auteurs 
Caractéristiquesstructurelles du document 
•Liens entrants, sortants (PageRank, HITS). 
Popularité 
Autorité 
Modèle de langue 
(Brin et Page, 1998) 
(Kleinberg, 1999) 
•Types d'URL. 
Importance 
(Kraaijet al.,2002) 
Caractéristiques sociales du document 
•Nombrede:clicks,votes,enregistrementet recommandation. 
Popularité 
Importance 
Combinaison Linéaire 
(Karweget al., 2011) 
•Nombrede:j’aime,j’aimepas, commentairesurYouTubeetnombrede lectured’untitresurLast.fm. 
Importance 
Techniqued’apprentissage 
et 
Combinaison linéaire 
(Chelaruet al., 2012) 
(Khodaeiet al.2012) 
•Présenced'unlienURLdansuntweet. 
(Alonso et al., 2010) 
•Nombrederetweet. 
Popularité 
Techniqued’apprentissage 
(Yang et al., 2012) 
(Hong et al., 2011) 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
3.1 Modèle de langue 
•UndocumentDpeutêtrereprésentéàlafoisparunensembledemots- clés퐷푚={푚1,푚2,…푚푛}etdescaractéristiquesnon-textuelles. 
•푃(퐷)estuneprobabilitéestimantlapertinenceapriorid’undocumentindépendammentdesoncontenutextuel. 
•Dansnotreapproche:undocument(ressource)estreprésentéparunensembledemots-clés퐷푚etunensembledecaractéristiquessociales 퐷푠={푎1,푎2,…푎푚}. 
Probabilité a priori du document D 
Modèle textuel Requête/Contenu 
푃퐷푄=푟푎푛푘푷푫∙푃푄퐷) 
5 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale 
푃퐷푄=푟푎푛푘푷푫풔∙푃푄퐷)
3.2 Propriétés sociales utilisées 
Lapopularité푷푺풐풄 
Phénomènesocialquidictequelestleplusconnudanslepublic, estiméeenfonctiondel’intensitédepartaged’uneressourcedanslesréseauxsociaux. 
La réputation 푹푺풐풄 
Uneopinionsurcetteressource,estiméeàpartirdesactionsrelevantd’activitéssocialesquiportentunsenspositiftelquelej’aimedeFacebook. 
Lafraîcheur푭푺풐풄 
Ladated’uneaction(ex.commentaire,mention,etc.)effectuéesuruneressourcedanslesréseauxsociaux,peutêtreutiliséepourmesurerlafraîcheurdel’information. 
6 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
3.3 Estimation de P(푫풔): La combinaison 
•Laformuledelacombinaisondes3propriétéssociales: 
•푃퐹푆표푐(퐷푠),푃푃푆표푐(퐷푠)et푃푅푆표푐(퐷푠)sontlesprobabilitésapriori d’uneressourcerelativeà푭푺풐풄(Fraîcheur),푷푺풐풄(Popularité)et 푹푺풐풄(Réputation),respectivement. 
•푃퐹푆표푐⊕푃푆표푐⊕푅푆표푐퐷푠estlaprobabilitédelacombinaisondestroisprobabilitésapriori. 
7 
푃퐷푠=푃퐹푆표푐⊕푃푆표푐⊕푅푆표푐퐷푠 
=푃퐹푆표푐(퐷푠)∙푃푃푆표푐(퐷푠)∙푃푅푆표푐(퐷푠) 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
Laprobabilitéapriorirelativeàlapopularité/réputation: 
•푥∈{푃푆표푐,푅푆표푐}.cuneconstantepermettantdetraduirelesimplecomptageCount()endistributiondeprobabilité. 
•퐶표푢푛푡(푎푖 푥,퐷푠)représentelenombred’apparitiond’uneactionspécifique푎푖 푥danslaressource퐷푠.푎푖 푥désignel’action푎푖exploitéepourmesurerlapropriétéx. 
83.4 Estimation de P(푫풔): Popularité et Réputation 
푃푥(퐷)=푃푥(퐷푠)= 푎푖 푥∈퐴 푃푥(푎푖 푥)= 푎푖 푥∈퐴 푐∙퐶표푢푛푡(푎푖 푥,퐷푠) 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
•푇={푡푎1,푡푎2,…푡푎푘}ensembledekmoments(date)àlaquelleuneaction aiaétéproduite.Uninstantdetempstreprésenteladateetl’heure(datetime)del’actioneffectuéeparunutilisateursuruneressource퐷푠. 
•푇푖푚푒푡푎푖,퐷푠=푡퐴푐푡푢푒푙−푡푎푖estimeletempsécoulédepuisladernièreaction푡푎푖pouruneressource퐷푠. 
93.5 Estimation de P(푫풔): Fraîcheur 
푃퐹푆표푐(퐷푠)= 푎푖∈퐴 푃퐹푆표푐(푡푎푖)= 푎푖∈퐴 1 푇푖푚푒(푡푎푖,퐷푠) 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
4.1Objectifs de l’evaluation 
10 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale 
1)Etudierl’impactd’intégrationindividuelledechacundessignauxsociauxsurlaperformancedumodèleproposé. 
2)Etudierl’impactdelacombinaisoncessignauxsociauxregroupéssousformedepropriétéssociales. 
•Cadred’évaluation: 
-Absenced’uncadrestandardpourl’évaluationdanslaRIsociale. 
-Collecterdessignauxsociauxetmonterl’expérimentation.
4.2Dataset : Contenu textuel 
11 
Champ 
Description 
Statut 
ID 
identifiant du film (le document). 
- 
Title 
le titre du film. 
indexé 
Year 
l’année de sortie du film. 
indexé 
Rated 
classement des films selon le type du contenu. 
- 
Released 
date de réalisation du film. 
indexé 
Runtime 
durée du film. 
indexé 
Genre 
genre de film (Action, Drame, etc.). 
indexé 
Director 
le directeur du projet du film. 
indexé 
Writer 
les écrivains et les scénaristes du film. 
indexé 
Actors 
les acteurs principaux du film. 
indexé 
Plot 
résumé textuel du film. 
indexé 
Poster 
le lien URL de l’affiche du film. 
- 
url 
le lien URL qui mène à la source originale du document. 
- 
UGC 
Les différents signaux sociaux récupérés. 
- 
•32706Documents Film en anglais extrait du site IMDb.com 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
4.3Dataset : Contenu social 
12 
ACEBOOK 
J’aime 
Partage 
Commentaire 
Date de la mention 
WITTER 
Tweet 
GOOGLE+ 
Mention +1 
Partage 
LINKED 
DELICIOUS 
Marquer 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
4.3Dataset : Contenu social 
13 
•LechampUGCcontientlesdifférentssignauxsociaux. 
Réseausocial 
Signaux sociaux 
Somme 
Min 
Max 
Moyenne 
Facebook 
J’aime 
5056517 
0 
79693 
154 
Partage 
5778414 
0 
41618 
176 
Commentaire 
6717573 
0 
60081 
205 
Twitter 
Tweet 
1097204 
0 
22954 
33 
Google+ 
+1 
139189 
0 
1368 
4 
Delicious 
Marque 
32810 
0 
1033 
1 
LinkedIn 
Partage 
57545 
0 
25215 
1 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
4.4Requêtes et jugement de pertinence 
14 
•Requêtes 
-20 requêtes issues d’INEX IMDb. 
-5 requêtes crées par nous-même. 
•Jugement de pertinence 
-12 évaluateurs (23-31 ans). 
-Jugement des 100 premiers documents retournés. 
-Echelle d’évaluation à 3 points de pertinence. 
-Chaque requête est jugée par 3 utilisateurs. 
-Bon accord Kappa entre les évaluateurs (81,24%). 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
4.5 Quantification des propriétés sociales 
15 
Propriétés sociales 
Signaux sociaux 
Réseaux sociaux 
Popularité (PSoc) 
Nombre de «Commentaire» 
Facebook 
Nombre de «Tweet» 
Twitter 
Nombre de «Partage» 
LinkedIn, Facebook 
Réputation (RSoc) 
Nombre de « +1» 
Google+ 
Nombre de «J’aime» 
Facebook 
Nombre de «Marque» 
Delicious 
Fraîcheur (FSoc) 
Datede la dernière action 
Facebook 
•Chaquepropriétéestquantifiéepardessignauxsociauxspécifiques, selonleursnatureetsignification. 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
4.6 Résultats : Signaux sociaux 
16 
0,6414 
0,6586 
0,6507 
0,6048 
0,5979 
0,5965 
0,5921 
0,5866 
0,5748 
0,52 
0,54 
0,56 
0,58 
0,6 
0,62 
0,64 
0,66 
0,68 
nDCG@20 
J'aime 
Partage 
Commentaire 
Tweet 
PlusOne 
Marque 
Partage (Lin) 
ML.Hiemstra 
BM25 
0,3155 
0,3126 
0,2912 
0,2844 
0,267 
0,2697 
0,2701 
0,2666 
0,2601 
0 
0,1 
0,2 
0,3 
0,4 
MAP 
Baselines 
Baselines 
Fig2. Intégration individuelle des signaux sociaux dans ML.Hiemstra 
J’aime 
Partage 
Commentaire 
Comment 
Partage 
J’aime 
Tweet 
+1 
Partage 
Hiemstra 
BM25 
Marque 
Tweet 
+1 
Marque 
Partage 
Hiemstra 
BM25 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
4.7 Résultats : Propriétés sociales 
17 
0,6951 
0,3333 
0,6661 
0,3219 
0,6229 
0,2902 
0,7438 
0,3882 
0,5866 
0,2666 
0,5748 
0,2601 
0 
0,1 
0,2 
0,3 
0,4 
0,5 
0,6 
0,7 
0,8 
nDCG@20 
MAP 
Popularité 
Réputation 
Fraîcheur 
Toutes les propriétés 
ML.Hiemstra 
BM25 
Baselines 
Baselines 
Fig3. Intégration de propriétés sociales dans ML.Hiemstra 
Popularité 
Réputation 
Fraîcheur 
Globale 
BM25 
Hemstra 
Popularité 
Réputation 
Fraîcheur 
BM25 
Globale 
Hemstra 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
4.8 Résultats : Comparaison 
18 
Fig4. Comparaison des résultats 
0,3155 
0,3126 
0,2912 
0,2844 
0,267 
0,2697 
0,2701 
0,24 
0,26 
0,28 
0,3 
0,32 
MAP 
J'aime 
Partage 
Commentaire 
Tweet 
PlusOne 
Marque 
Partage (Lin) 
0,3333 
0,3219 
0,2902 
0,3882 
0 
0,1 
0,2 
0,3 
0,4 
0,5 
MAP 
Popularité 
Réputation 
Fraîcheur 
Toutes les propriétés 
Popularité 
Réputation 
Fraîcheur 
Globale 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
4.9 Analyse de corrélation des rangs 
19 
0,1675 
0,1760 
0,2158 
0,2322 
0,2701 
0,2858 
0,2986 
Google +1 
Marque 
Partages (Lin) 
Tweet 
Partage (FB) 
Commentaire 
J'aime 
0,22 
0,52 
0,6431 
Fraîcheur 
Réputation 
Popularité 
Fig6. Corrélation des propriétés sociales 
Fig5. Corrélation des signaux sociaux 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
5. Conclusion 
20 
•Modèle de recherche d’information sociale 
-Evidence thématique (Modèle de langue) 
-Evidence sociale (Propriétés sociales). 
•Expérimentation sur une collection IMDb 
-Amélioration significative par rapport aux modèles textuels. 
•Perspectives 
-Evaluation sur d’autres collections. 
-Intégration d’autres propriétés sociales 
-Etude approfondie sur l’impact de la propriété temporelle. 
-Comparer le modèle proposé avec d’autres modèles sociaux. 
1. Introduction 
2. Etat de l’art 
5. Conclusion 
3. Modèle de RI sociale 
4. Evaluation expérimentale
http://www.irit.fr/~Ismail.Badache/

Weitere ähnliche Inhalte

Ähnlich wie Exploitation de signaux sociaux pour estimer la pertinence a priori d’une ressource

Poster Recherche d'Information Sociale
Poster Recherche d'Information SocialePoster Recherche d'Information Sociale
Poster Recherche d'Information SocialeIsmail BADACHE
 
Leveraging social relevance: Using social networks to enhance literature acce...
Leveraging social relevance: Using social networks to enhance literature acce...Leveraging social relevance: Using social networks to enhance literature acce...
Leveraging social relevance: Using social networks to enhance literature acce...Lamjed Ben Jabeur
 
Veille et eréputation des collectivités
Veille et  eréputation des collectivitésVeille et  eréputation des collectivités
Veille et eréputation des collectivitésArdesi Midi-Pyrénées
 
SharePoint : Déploiement d'un projet de Réseau Social d'Entreprise
SharePoint : Déploiement d'un projet de Réseau Social d'EntrepriseSharePoint : Déploiement d'un projet de Réseau Social d'Entreprise
SharePoint : Déploiement d'un projet de Réseau Social d'EntrepriseMicrosoft Technet France
 
La modelisation systemique en ux.pptx
La modelisation systemique en ux.pptxLa modelisation systemique en ux.pptx
La modelisation systemique en ux.pptxMarion Dragée
 
Cours réseaux sociaux et community management
Cours réseaux sociaux et community managementCours réseaux sociaux et community management
Cours réseaux sociaux et community managementChristophe Benavent
 
Jamespot - mis2011 - nouveautes produit et socialready
Jamespot -  mis2011 - nouveautes produit et socialreadyJamespot -  mis2011 - nouveautes produit et socialready
Jamespot - mis2011 - nouveautes produit et socialreadyAlain GARNIER
 
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...The Metrics Factory
 
Communication & Médias sociaux
Communication & Médias sociauxCommunication & Médias sociaux
Communication & Médias sociauxat Backbook
 
Composthon ensemble : un hackathon pour imaginer une appli pour le compostage...
Composthon ensemble : un hackathon pour imaginer une appli pour le compostage...Composthon ensemble : un hackathon pour imaginer une appli pour le compostage...
Composthon ensemble : un hackathon pour imaginer une appli pour le compostage...Forum Education Science Culture
 
Panorama des réseaux sociaux d'entreprise
Panorama des réseaux sociaux d'entreprisePanorama des réseaux sociaux d'entreprise
Panorama des réseaux sociaux d'entrepriseLecko (Ex USEO)
 
La visibilité des enseignants-chercheurs sur internet
La visibilité des enseignants-chercheurs sur internetLa visibilité des enseignants-chercheurs sur internet
La visibilité des enseignants-chercheurs sur internetCedric Manara
 

Ähnlich wie Exploitation de signaux sociaux pour estimer la pertinence a priori d’une ressource (20)

Poster Recherche d'Information Sociale
Poster Recherche d'Information SocialePoster Recherche d'Information Sociale
Poster Recherche d'Information Sociale
 
Leveraging social relevance: Using social networks to enhance literature acce...
Leveraging social relevance: Using social networks to enhance literature acce...Leveraging social relevance: Using social networks to enhance literature acce...
Leveraging social relevance: Using social networks to enhance literature acce...
 
Veille et eréputation des collectivités
Veille et  eréputation des collectivitésVeille et  eréputation des collectivités
Veille et eréputation des collectivités
 
SharePoint : Déploiement d'un projet de Réseau Social d'Entreprise
SharePoint : Déploiement d'un projet de Réseau Social d'EntrepriseSharePoint : Déploiement d'un projet de Réseau Social d'Entreprise
SharePoint : Déploiement d'un projet de Réseau Social d'Entreprise
 
La modelisation systemique en ux.pptx
La modelisation systemique en ux.pptxLa modelisation systemique en ux.pptx
La modelisation systemique en ux.pptx
 
Cours réseaux sociaux et community management
Cours réseaux sociaux et community managementCours réseaux sociaux et community management
Cours réseaux sociaux et community management
 
Intro rep2400 a12
Intro rep2400 a12Intro rep2400 a12
Intro rep2400 a12
 
Jamespot - mis2011 - nouveautes produit et socialready
Jamespot -  mis2011 - nouveautes produit et socialreadyJamespot -  mis2011 - nouveautes produit et socialready
Jamespot - mis2011 - nouveautes produit et socialready
 
Guide LINKEDIN 2022
Guide LINKEDIN 2022Guide LINKEDIN 2022
Guide LINKEDIN 2022
 
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
 
LINKEDIN, grand nettoyage de Pâques
LINKEDIN, grand nettoyage de PâquesLINKEDIN, grand nettoyage de Pâques
LINKEDIN, grand nettoyage de Pâques
 
L'usager numérique : quels outils pour quels usages ?
L'usager numérique : quels outils pour quels usages ?L'usager numérique : quels outils pour quels usages ?
L'usager numérique : quels outils pour quels usages ?
 
GUIDE Linkedin novembre 2023
GUIDE Linkedin  novembre 2023GUIDE Linkedin  novembre 2023
GUIDE Linkedin novembre 2023
 
Communication & Médias sociaux
Communication & Médias sociauxCommunication & Médias sociaux
Communication & Médias sociaux
 
FOF Spécial Webinaire.pdf
FOF Spécial Webinaire.pdfFOF Spécial Webinaire.pdf
FOF Spécial Webinaire.pdf
 
Composthon ensemble : un hackathon pour imaginer une appli pour le compostage...
Composthon ensemble : un hackathon pour imaginer une appli pour le compostage...Composthon ensemble : un hackathon pour imaginer une appli pour le compostage...
Composthon ensemble : un hackathon pour imaginer une appli pour le compostage...
 
Intro1 rep2400
Intro1 rep2400 Intro1 rep2400
Intro1 rep2400
 
Guide pratique INSTAGRAM 2022
Guide pratique INSTAGRAM 2022Guide pratique INSTAGRAM 2022
Guide pratique INSTAGRAM 2022
 
Panorama des réseaux sociaux d'entreprise
Panorama des réseaux sociaux d'entreprisePanorama des réseaux sociaux d'entreprise
Panorama des réseaux sociaux d'entreprise
 
La visibilité des enseignants-chercheurs sur internet
La visibilité des enseignants-chercheurs sur internetLa visibilité des enseignants-chercheurs sur internet
La visibilité des enseignants-chercheurs sur internet
 

Mehr von Ismail BADACHE

Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?Ismail BADACHE
 
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...Ismail BADACHE
 
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...Ismail BADACHE
 
Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?Ismail BADACHE
 
Emotional Social Signals for Search Ranking
Emotional Social Signals for Search RankingEmotional Social Signals for Search Ranking
Emotional Social Signals for Search RankingIsmail BADACHE
 
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Ismail BADACHE
 
Finding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsFinding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsIsmail BADACHE
 
Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?Ismail BADACHE
 
Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?Ismail BADACHE
 
Multimodal Social Book Search
Multimodal Social Book SearchMultimodal Social Book Search
Multimodal Social Book SearchIsmail BADACHE
 
Priors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social SignalsPriors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social SignalsIsmail BADACHE
 
Social Networks Statistics 2014
Social Networks Statistics 2014Social Networks Statistics 2014
Social Networks Statistics 2014Ismail BADACHE
 

Mehr von Ismail BADACHE (12)

Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?Predicting Contradiction Intensity: Low, Strong or Very Strong?
Predicting Contradiction Intensity: Low, Strong or Very Strong?
 
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...
Prédire l’intensité de contradiction dans les commentaires : faible, forte ou...
 
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...
Intensité de contradiction dans les commentaires (Séminaire à l'EHESS 04 avri...
 
Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?Contradiction in Reviews: is it Strong or Low?
Contradiction in Reviews: is it Strong or Low?
 
Emotional Social Signals for Search Ranking
Emotional Social Signals for Search RankingEmotional Social Signals for Search Ranking
Emotional Social Signals for Search Ranking
 
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
Harnessing Ratings and Aspect-Sentiment to Estimate Contradiction Intensity i...
 
Finding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in ReviewsFinding and Quantifying Temporal-Aware Contradiction in Reviews
Finding and Quantifying Temporal-Aware Contradiction in Reviews
 
Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?Fresh and Diverse Social Signals: Any Impacts on Search?
Fresh and Diverse Social Signals: Any Impacts on Search?
 
Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?Social Signals: Any Impacts in Search?
Social Signals: Any Impacts in Search?
 
Multimodal Social Book Search
Multimodal Social Book SearchMultimodal Social Book Search
Multimodal Social Book Search
 
Priors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social SignalsPriors Based On Time-Sensitive Social Signals
Priors Based On Time-Sensitive Social Signals
 
Social Networks Statistics 2014
Social Networks Statistics 2014Social Networks Statistics 2014
Social Networks Statistics 2014
 

Exploitation de signaux sociaux pour estimer la pertinence a priori d’une ressource

  • 1. Exploitation de signaux sociaux pour estimer la pertinence apriori d’une ressource Ismaël BADACHE Mohand BOUGHANEM 2013/2014 CORIA’14
  • 2. Plan de la présentation Introduction État de l’art Modèle de RI sociale Evaluation expérimentale 4 1 3 Conclusion 2 5
  • 3. 1.1 Émergence du Web social 1 Nombre d’utilisateurs actifs2013 1,2 1,4 1,7 2,4 2011 2012 2013 2014 Nombre d’internautes Contenu social par 1 minute 41000 Publications 1,8 Millions J’aime ~350 GO de données Facebook Source: blogdumoderateur.com quantcast.com semiocast.com 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 4. Vidéo Photo Page Web Ressources Web Ressource. . . Réseaux sociaux Marques Commentaires/Avis Partages/Recommandes Mentions/Votes Like/+1 Interactions Extraction et quantification des propriétés sociales Modèle de RIIncorporationRequêteRéputation 2Résultats Fig1. Schéma de la RI sociale par rapport à notre approche Signaux Sociaux (Source d’évidence) Popularité. . etc.
  • 5. 1.2 Questions de recherche Quellessontlespropriétéssocialesutilespourévaluerlapertinenceapriorid’uneressource? 2 Commenttraduirelessignauxsociauxenpropriétéssociales? 1 Quelmodèlethéoriquepourcombinerlapertinenceapriorid’uneressourceetsapertinencethématique? 3 3 Quelestl’impactdecespropriétéssocialessurlesperformancesd’unsystèmedeRI? 4 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 6. 2.1 Synthèse des travaux 4 Sources d’évidence Propriétés Modèles Auteurs Caractéristiquesstructurelles du document •Liens entrants, sortants (PageRank, HITS). Popularité Autorité Modèle de langue (Brin et Page, 1998) (Kleinberg, 1999) •Types d'URL. Importance (Kraaijet al.,2002) Caractéristiques sociales du document •Nombrede:clicks,votes,enregistrementet recommandation. Popularité Importance Combinaison Linéaire (Karweget al., 2011) •Nombrede:j’aime,j’aimepas, commentairesurYouTubeetnombrede lectured’untitresurLast.fm. Importance Techniqued’apprentissage et Combinaison linéaire (Chelaruet al., 2012) (Khodaeiet al.2012) •Présenced'unlienURLdansuntweet. (Alonso et al., 2010) •Nombrederetweet. Popularité Techniqued’apprentissage (Yang et al., 2012) (Hong et al., 2011) 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 7. 3.1 Modèle de langue •UndocumentDpeutêtrereprésentéàlafoisparunensembledemots- clés퐷푚={푚1,푚2,…푚푛}etdescaractéristiquesnon-textuelles. •푃(퐷)estuneprobabilitéestimantlapertinenceapriorid’undocumentindépendammentdesoncontenutextuel. •Dansnotreapproche:undocument(ressource)estreprésentéparunensembledemots-clés퐷푚etunensembledecaractéristiquessociales 퐷푠={푎1,푎2,…푎푚}. Probabilité a priori du document D Modèle textuel Requête/Contenu 푃퐷푄=푟푎푛푘푷푫∙푃푄퐷) 5 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale 푃퐷푄=푟푎푛푘푷푫풔∙푃푄퐷)
  • 8. 3.2 Propriétés sociales utilisées Lapopularité푷푺풐풄 Phénomènesocialquidictequelestleplusconnudanslepublic, estiméeenfonctiondel’intensitédepartaged’uneressourcedanslesréseauxsociaux. La réputation 푹푺풐풄 Uneopinionsurcetteressource,estiméeàpartirdesactionsrelevantd’activitéssocialesquiportentunsenspositiftelquelej’aimedeFacebook. Lafraîcheur푭푺풐풄 Ladated’uneaction(ex.commentaire,mention,etc.)effectuéesuruneressourcedanslesréseauxsociaux,peutêtreutiliséepourmesurerlafraîcheurdel’information. 6 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 9. 3.3 Estimation de P(푫풔): La combinaison •Laformuledelacombinaisondes3propriétéssociales: •푃퐹푆표푐(퐷푠),푃푃푆표푐(퐷푠)et푃푅푆표푐(퐷푠)sontlesprobabilitésapriori d’uneressourcerelativeà푭푺풐풄(Fraîcheur),푷푺풐풄(Popularité)et 푹푺풐풄(Réputation),respectivement. •푃퐹푆표푐⊕푃푆표푐⊕푅푆표푐퐷푠estlaprobabilitédelacombinaisondestroisprobabilitésapriori. 7 푃퐷푠=푃퐹푆표푐⊕푃푆표푐⊕푅푆표푐퐷푠 =푃퐹푆표푐(퐷푠)∙푃푃푆표푐(퐷푠)∙푃푅푆표푐(퐷푠) 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 10. Laprobabilitéapriorirelativeàlapopularité/réputation: •푥∈{푃푆표푐,푅푆표푐}.cuneconstantepermettantdetraduirelesimplecomptageCount()endistributiondeprobabilité. •퐶표푢푛푡(푎푖 푥,퐷푠)représentelenombred’apparitiond’uneactionspécifique푎푖 푥danslaressource퐷푠.푎푖 푥désignel’action푎푖exploitéepourmesurerlapropriétéx. 83.4 Estimation de P(푫풔): Popularité et Réputation 푃푥(퐷)=푃푥(퐷푠)= 푎푖 푥∈퐴 푃푥(푎푖 푥)= 푎푖 푥∈퐴 푐∙퐶표푢푛푡(푎푖 푥,퐷푠) 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 11. •푇={푡푎1,푡푎2,…푡푎푘}ensembledekmoments(date)àlaquelleuneaction aiaétéproduite.Uninstantdetempstreprésenteladateetl’heure(datetime)del’actioneffectuéeparunutilisateursuruneressource퐷푠. •푇푖푚푒푡푎푖,퐷푠=푡퐴푐푡푢푒푙−푡푎푖estimeletempsécoulédepuisladernièreaction푡푎푖pouruneressource퐷푠. 93.5 Estimation de P(푫풔): Fraîcheur 푃퐹푆표푐(퐷푠)= 푎푖∈퐴 푃퐹푆표푐(푡푎푖)= 푎푖∈퐴 1 푇푖푚푒(푡푎푖,퐷푠) 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 12. 4.1Objectifs de l’evaluation 10 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale 1)Etudierl’impactd’intégrationindividuelledechacundessignauxsociauxsurlaperformancedumodèleproposé. 2)Etudierl’impactdelacombinaisoncessignauxsociauxregroupéssousformedepropriétéssociales. •Cadred’évaluation: -Absenced’uncadrestandardpourl’évaluationdanslaRIsociale. -Collecterdessignauxsociauxetmonterl’expérimentation.
  • 13. 4.2Dataset : Contenu textuel 11 Champ Description Statut ID identifiant du film (le document). - Title le titre du film. indexé Year l’année de sortie du film. indexé Rated classement des films selon le type du contenu. - Released date de réalisation du film. indexé Runtime durée du film. indexé Genre genre de film (Action, Drame, etc.). indexé Director le directeur du projet du film. indexé Writer les écrivains et les scénaristes du film. indexé Actors les acteurs principaux du film. indexé Plot résumé textuel du film. indexé Poster le lien URL de l’affiche du film. - url le lien URL qui mène à la source originale du document. - UGC Les différents signaux sociaux récupérés. - •32706Documents Film en anglais extrait du site IMDb.com 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 14. 4.3Dataset : Contenu social 12 ACEBOOK J’aime Partage Commentaire Date de la mention WITTER Tweet GOOGLE+ Mention +1 Partage LINKED DELICIOUS Marquer 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 15. 4.3Dataset : Contenu social 13 •LechampUGCcontientlesdifférentssignauxsociaux. Réseausocial Signaux sociaux Somme Min Max Moyenne Facebook J’aime 5056517 0 79693 154 Partage 5778414 0 41618 176 Commentaire 6717573 0 60081 205 Twitter Tweet 1097204 0 22954 33 Google+ +1 139189 0 1368 4 Delicious Marque 32810 0 1033 1 LinkedIn Partage 57545 0 25215 1 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 16. 4.4Requêtes et jugement de pertinence 14 •Requêtes -20 requêtes issues d’INEX IMDb. -5 requêtes crées par nous-même. •Jugement de pertinence -12 évaluateurs (23-31 ans). -Jugement des 100 premiers documents retournés. -Echelle d’évaluation à 3 points de pertinence. -Chaque requête est jugée par 3 utilisateurs. -Bon accord Kappa entre les évaluateurs (81,24%). 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 17. 4.5 Quantification des propriétés sociales 15 Propriétés sociales Signaux sociaux Réseaux sociaux Popularité (PSoc) Nombre de «Commentaire» Facebook Nombre de «Tweet» Twitter Nombre de «Partage» LinkedIn, Facebook Réputation (RSoc) Nombre de « +1» Google+ Nombre de «J’aime» Facebook Nombre de «Marque» Delicious Fraîcheur (FSoc) Datede la dernière action Facebook •Chaquepropriétéestquantifiéepardessignauxsociauxspécifiques, selonleursnatureetsignification. 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 18. 4.6 Résultats : Signaux sociaux 16 0,6414 0,6586 0,6507 0,6048 0,5979 0,5965 0,5921 0,5866 0,5748 0,52 0,54 0,56 0,58 0,6 0,62 0,64 0,66 0,68 nDCG@20 J'aime Partage Commentaire Tweet PlusOne Marque Partage (Lin) ML.Hiemstra BM25 0,3155 0,3126 0,2912 0,2844 0,267 0,2697 0,2701 0,2666 0,2601 0 0,1 0,2 0,3 0,4 MAP Baselines Baselines Fig2. Intégration individuelle des signaux sociaux dans ML.Hiemstra J’aime Partage Commentaire Comment Partage J’aime Tweet +1 Partage Hiemstra BM25 Marque Tweet +1 Marque Partage Hiemstra BM25 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 19. 4.7 Résultats : Propriétés sociales 17 0,6951 0,3333 0,6661 0,3219 0,6229 0,2902 0,7438 0,3882 0,5866 0,2666 0,5748 0,2601 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 nDCG@20 MAP Popularité Réputation Fraîcheur Toutes les propriétés ML.Hiemstra BM25 Baselines Baselines Fig3. Intégration de propriétés sociales dans ML.Hiemstra Popularité Réputation Fraîcheur Globale BM25 Hemstra Popularité Réputation Fraîcheur BM25 Globale Hemstra 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 20. 4.8 Résultats : Comparaison 18 Fig4. Comparaison des résultats 0,3155 0,3126 0,2912 0,2844 0,267 0,2697 0,2701 0,24 0,26 0,28 0,3 0,32 MAP J'aime Partage Commentaire Tweet PlusOne Marque Partage (Lin) 0,3333 0,3219 0,2902 0,3882 0 0,1 0,2 0,3 0,4 0,5 MAP Popularité Réputation Fraîcheur Toutes les propriétés Popularité Réputation Fraîcheur Globale 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 21. 4.9 Analyse de corrélation des rangs 19 0,1675 0,1760 0,2158 0,2322 0,2701 0,2858 0,2986 Google +1 Marque Partages (Lin) Tweet Partage (FB) Commentaire J'aime 0,22 0,52 0,6431 Fraîcheur Réputation Popularité Fig6. Corrélation des propriétés sociales Fig5. Corrélation des signaux sociaux 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale
  • 22. 5. Conclusion 20 •Modèle de recherche d’information sociale -Evidence thématique (Modèle de langue) -Evidence sociale (Propriétés sociales). •Expérimentation sur une collection IMDb -Amélioration significative par rapport aux modèles textuels. •Perspectives -Evaluation sur d’autres collections. -Intégration d’autres propriétés sociales -Etude approfondie sur l’impact de la propriété temporelle. -Comparer le modèle proposé avec d’autres modèles sociaux. 1. Introduction 2. Etat de l’art 5. Conclusion 3. Modèle de RI sociale 4. Evaluation expérimentale