SlideShare ist ein Scribd-Unternehmen logo
1 von 46
Downloaden Sie, um offline zu lesen
Google Hummingbird 
le point de vue d’un linguiste 
Sébastien Monnier 
Ex- Googler, fondateur de Woptimo
Sommaire 
1. Approche syntaxique vs Approche sémantique 
2. Hummingbird : un nouvel oiseau? 
3. Freebase et la notion de concept 
4. Extractions des concepts 
5. Exemples dans les SERP 
6. Conséquences sur le SEO
Au commencement...
Le web, cette masse informe 
Du texte, des tableaux, des images, des ressources ... 
Décentralisés. 
Comment structurer l’information 
pour organiser une recherche?
Indexation des mots 
“lieu de naissance Jules Verne” = lieu + naissance + Jules + Verne 
Bing en 2014 
Voila en 2014
Et même les résultats peu probables... 
Quelle est la probabilité qu’en cherchant “lieu de naissance Jules Verne”, je 
recherche des informations sur 
La maternité de la clinique Jules Verne...
Approche sémantique 
Propriété biographique Personnalité 
lieu de naissance Jules Verne
Approche sémantique 
Google en 2014
Google Hummingbird : qu’est-ce 
donc?
Qu’est-ce qu’Hummingbird 
● Annoncé fin septembre 2013 pour le 15e annniversaire 
de Google 
● Déjà présent depuis un mois 
● Impacte 90% des requêtes 
● Aussi important pour l’infrastructure de Google que 
Google Caffeine
Pourquoi un colibri? 
Précis et rapide 
(... et peut faire marche arrière)
Le web a évolué
La recherche évolue ...
Anticiper les évolutions 
● Boom du trafic mobile, du trafic connecté et géolocalisé 
1 requête = + que des mots 
➔ 1 contexte spatial 
➔ 1 contexte humain 
➔ 1 contexte d’historique de recherche 
➔ Google cherche à comprendre l’intention, plus que l’assemblage des mots 
dans la requête
Processus de Hummingbird
Moteur: Algorithme général 
● Le moteur de recherche de Google est basé sur des algorithmes 
mathématiques (probabilités) 
● Le comportement de ces algorithmes est conditionné par de multiples 
paramètres linguistiques et statistiques 
● Ces paramètres sont calculés grâce à une batterie de “classifiers”
Qu’est-ce qu’un classifier? 
Un classifier est un algorithme de catégorisation 
○ Entrée: requêtes, pages web, domaines... 
○ Sortie: Nature diverse des informations (texte, score, liste,...) 
● Classifier de requête : 
○ Ex : requête géolocalisée (bureau Paris), requête navigationelle (Youtube, 
Facebook...) 
● Classifier de pages web : 
○ Ex : bourrage de mots-clés, texte caché, “in-depth article”... 
● Classifier d’élements sur une page web : 
○ Ex : fil d’Ariane, listing d’éléments... 
● ... Et de nombreux autres types de classifiers...
Moteur: Algorithme général - Schéma 
Requête (“photo de Paris”) 
➢ Analyse lexicale: “photo”:nom... 
➢ Analyse syntaxique: groupe nominal 
➢ Typologie, Intention 
➢ ... 
Page Web 
➢ PageRank 
➢ Typologie, Intention 
➢ Potentiel de spam 
➢ Auteur de la page 
➢ ... 
Domaine 
Sous-domaine 
Auteur 
... 
MOTEUR 
Résultats 
Universal 
Knowledge 
Graph 
URL 1 
URL 2 
URL 3 
… 
URL X
Algorithme HummingBird 
Requête (“photo de Paris”) 
➢ Analyse lexicale: “photo”:nom... 
➢ Analyse syntaxique: groupe nominal 
➢ Typologie, Intention 
➢ Concepts 
➢ ... 
Page Web 
➢ PageRank 
➢ Typologie, Intention 
➢ Potentiel de spam 
➢ Auteur de la page 
➢ Concepts 
➢ ... 
Domaine 
Sous Domaine 
Auteur 
... 
MOTEUR 
Résultats 
Universal 
Knowledge 
Graph 
URL 1 
URL 2 
URL 3 
… 
URL X
Freebase et la notion de concept
Freebase 
Freebase est une base de données de connaissances structurées libre et contributive. 
● Créée en 2007 
● Rachetée par Google en 2010 
Tout le monde peut contribuer
Notion de Concept 
➢ Objet concret ou abstrait représenté par une séquence de mots 
➢ Concepts interconnectés d’après des relations plus ou moins éloignées
Sujet, prédicat, objet 
Liaison de 2 concepts : 
Sujet 
Ressource à décrire 
Objet 
Valeur de la propriété 
Prédicat 
Type de propriété
Sujet, prédicat, objet 
Liaison de 2 concepts : 
Sujet 
Jules Verne 
Objet 
Nantes 
Prédicat 
Lieu de naissance
Sujet, prédicat, objet 
Liaison de 2 concepts : 
Sujet 
FC Nantes 
Objet 
Stade de la Beaujoire 
Prédicat 
Stade
Extraction des concepts
Les données sûres 
Ressources modérées et surveillées 
+ 
Grande fréquence de reprises de la même information 
● Jules Verne</p><p>Né à Nantes le 08/02/1828 ; Mort à Amiens le 24/03/1905 
● <td>1828</td><td>Jules Verne est né à Nantes le 8 février 1828 </td> 
● 1828 - Naissance (8 février) de Jules Verne à Nantes. 
● Jules Verne<br>1828 - 1905 Nationalité : française.<BR>(lieu de naissance : Nantes) 
● Jules Verne (Nantes, 1828 - Amiens, 1905) 
● <tr><td>Ecrivain</td><td>Naissance</td><tr> 
<tr><td>Jules Verne</td><td>Nantes</td><tr>
Extraction des entités 
Indices linguistiques pour repérer la propriété Lieu Naissance 
● SUJET “</p><p>Né à” OBJET 
● SUJET est né à OBET 
● 1828 - Naissance (DATE) de SUJET à OBJET 
● SUJET<br>DATE - 1905 Nationalité : française.<BR>(lieu de naissance : OBJET) 
● SUJET (OBJET, DATE - Amiens, 1905) 
● <tr><td>Ecrivain</td><td>Naissance</td><tr> 
<tr><td>SUJET</td><td>OBJET</td><tr>
Compréhension des données floues 
Comment avoir des informations sur quelqu’un/quelque chose qui n’est pas 
dans une base sémantique? 
➔ Extraction des données web en s’inspirant des structures linguistiques 
identifiées 
Exemple
Knowledge Vault 
Google a repéré et stocké plus d’un milliard de faits hors bases 
sémantiques
Concrètement
Concepts et intention de l’utilisateur 
[Représentation Graphique] --> Paris [ville] 
Interaction directe 
[Evénement] Expo photo au Grand Palais 
Informationnel 
[Marque] Maison de la photographie 
Navigationnel
Répartition des concepts 
Concepts Résultats 
Photos/Images 
[Représentation graphique] 
Exposition 
[Evénement] 
Studio photo 
[Lieu] 
Stage photo 
[Enseignement] 
Location studio 
[Commerce]
Termes manquants : 
● L’ajout de “termes manquants” est un vrai indice de l’utilisation d’ 
Hummingbird
Et les 10% non impactés par 
Hummingbird? 
Info présente ici : bravo Google, ... mais 
ouch...
Hummingbird : un complément à l’ 
existant? 
Quand Google ne trouve pas assez de résultat concluant avec Hummingbird, l’ 
ancien algorithme de recherche de co-occurrence rentre en jeu. 
Quelques indices (?): 
➢ Snippet de 4 lignes 
➢ Pas le “termes manquants”
Qu’est-ce que cela change pour 
le SEO?
Du mot-clé à l’intention 
Oublions la simple “expression-clé” 
Pensons à l’intention de l’utilisateur
Analysez les SERP 
Au-delà de la position, il faut essayer de comprendre 
● L’INTENTION de la requête interprétée par Google. 
● La réponse comprise par Google 
● La diversité des résultats 
● Google ne classe pas 10 pages web en fonction de leur PageRank. 
● Google organise la présentation d’informations permettant de répondre, au 
mieux, au besoin supposé de l’internaute.
Pensez aux mentions 
“SuperMutuellePro m’a aidé à comparer des mutuelles” 
SUJET 
Entité : Marque 
OBJET 
Entité : Type de société 
PREDICAT 
Propriété : Comparaison
Adieu contenu SEO... 
● Oubliez les consignes comme : 
Je veux un texte de 300 mots optimisés pour mot-clé1, mot-clé2 et mot-clé3 
Donnez plutôt : 
Je veux du contenu pour une page qui va donner cette information avec 2 
arguments, 2 exemples et en citant ses sources. 
➔ Soyez concis, clair et factuel 
➔ Pensez présentation et lisibilité du texte 
➔ Pensez mots-clés, champ lexical et synonymes dans un 2e temps
Véracité du contenu 
Si vous possédez du contenu vérifiable (date de naissance/décès de célébrité, 
adresses d’entreprise, ...), pensez à les mettre à jour. 
Google peut extraire votre contenu et les comparer avec sa base de 
connaissance. 
Trop de mauvaises informations = MAUVAIS SIGNAL
Marquage sémantique 
Utilisation des données structurées / microdonnées devient un standard 
➔ permet aux moteurs une meilleure compréhension des concepts de votre 
site 
➔ L’absence de données structurées n’entraîne pas de pénalités, mais vous 
risquez une moins bonne interprétation par Google
1 rue Albert Einstein, 
Champs-sur-Marne, 
77447 Marne-la-Vallée Cedex 2 
France 
Tél : +33 (0)1 83 64 24 11 
Fax : +33 (0)1 83 64 38 15 
Twitter : @woptimo 
www.woptimo.com 
Merci

Weitere ähnliche Inhalte

Was ist angesagt?

ppt sur le Référencement
ppt sur le Référencementppt sur le Référencement
ppt sur le Référencement
3Market
 

Was ist angesagt? (20)

Les 10 commandements du référencement durable - Devcom Toulouse, decembre 2014
Les 10 commandements du référencement durable - Devcom Toulouse, decembre 2014Les 10 commandements du référencement durable - Devcom Toulouse, decembre 2014
Les 10 commandements du référencement durable - Devcom Toulouse, decembre 2014
 
Formation SEO & PCC - Agadir Maroc
Formation SEO & PCC - Agadir MarocFormation SEO & PCC - Agadir Maroc
Formation SEO & PCC - Agadir Maroc
 
Synodiance > SEO Post-Panda - SMX Paris 2012 - 06/06/2012
Synodiance > SEO Post-Panda - SMX Paris 2012 - 06/06/2012Synodiance > SEO Post-Panda - SMX Paris 2012 - 06/06/2012
Synodiance > SEO Post-Panda - SMX Paris 2012 - 06/06/2012
 
Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013
 
ppt sur le Référencement
ppt sur le Référencementppt sur le Référencement
ppt sur le Référencement
 
Plus de contenu pour plus de trafic - SMX Paris
Plus de contenu pour plus de trafic - SMX ParisPlus de contenu pour plus de trafic - SMX Paris
Plus de contenu pour plus de trafic - SMX Paris
 
Importance du contenu redactionnel pour le referencement : par AxeNet
Importance du contenu redactionnel pour le referencement : par AxeNetImportance du contenu redactionnel pour le referencement : par AxeNet
Importance du contenu redactionnel pour le referencement : par AxeNet
 
Atelier le référencement 2016
Atelier le référencement 2016Atelier le référencement 2016
Atelier le référencement 2016
 
Comprendre le Référencement Naturel et améliorer sa visibilité - La Team Web
Comprendre le Référencement Naturel et améliorer sa visibilité - La Team WebComprendre le Référencement Naturel et améliorer sa visibilité - La Team Web
Comprendre le Référencement Naturel et améliorer sa visibilité - La Team Web
 
[UPLIX] - Emmanuel de Vauxmoret - SEO garden party septembre 2021
[UPLIX] - Emmanuel de Vauxmoret - SEO garden party septembre 2021[UPLIX] - Emmanuel de Vauxmoret - SEO garden party septembre 2021
[UPLIX] - Emmanuel de Vauxmoret - SEO garden party septembre 2021
 
Fondamentaux du Référencement naturel
Fondamentaux du Référencement naturelFondamentaux du Référencement naturel
Fondamentaux du Référencement naturel
 
Le 10 Commandements du Référencement durable
Le 10 Commandements du Référencement durableLe 10 Commandements du Référencement durable
Le 10 Commandements du Référencement durable
 
Synodiance > SEO - Référencement - Le modèle 10/30/60 - 16-11-2011
Synodiance > SEO - Référencement - Le modèle 10/30/60 - 16-11-2011Synodiance > SEO - Référencement - Le modèle 10/30/60 - 16-11-2011
Synodiance > SEO - Référencement - Le modèle 10/30/60 - 16-11-2011
 
Tendances SEO 2015
Tendances SEO 2015Tendances SEO 2015
Tendances SEO 2015
 
Le référencement
Le référencementLe référencement
Le référencement
 
Référencement naturel (SEO), Référencement payant (SEM) à BEM Bordeaux Manage...
Référencement naturel (SEO), Référencement payant (SEM) à BEM Bordeaux Manage...Référencement naturel (SEO), Référencement payant (SEM) à BEM Bordeaux Manage...
Référencement naturel (SEO), Référencement payant (SEM) à BEM Bordeaux Manage...
 
SEO principes - referencement seo - version 2010
SEO   principes - referencement seo - version 2010SEO   principes - referencement seo - version 2010
SEO principes - referencement seo - version 2010
 
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
 
Un rappel sur les bases du référencement naturel en 2017
Un rappel sur les bases du référencement naturel en 2017Un rappel sur les bases du référencement naturel en 2017
Un rappel sur les bases du référencement naturel en 2017
 
Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?
Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?
Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?
 

Andere mochten auch

Les stratégie TV & Mobile (double-écran) et l'engagement
Les stratégie TV & Mobile (double-écran) et l'engagementLes stratégie TV & Mobile (double-écran) et l'engagement
Les stratégie TV & Mobile (double-écran) et l'engagement
Laura Blanchard - Agence KHOSI
 

Andere mochten auch (6)

#Wearetravel15 présentation blogueurs woptimo
#Wearetravel15 présentation blogueurs woptimo #Wearetravel15 présentation blogueurs woptimo
#Wearetravel15 présentation blogueurs woptimo
 
#Wearetravel15 présentation blogueurs woptimo expert
#Wearetravel15 présentation blogueurs woptimo expert#Wearetravel15 présentation blogueurs woptimo expert
#Wearetravel15 présentation blogueurs woptimo expert
 
6 idées pour booster votre linking - Search in the city Sept. 2016
6 idées pour booster votre linking - Search in the city Sept. 20166 idées pour booster votre linking - Search in the city Sept. 2016
6 idées pour booster votre linking - Search in the city Sept. 2016
 
Les stratégie TV & Mobile (double-écran) et l'engagement
Les stratégie TV & Mobile (double-écran) et l'engagementLes stratégie TV & Mobile (double-écran) et l'engagement
Les stratégie TV & Mobile (double-écran) et l'engagement
 
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
 
What is Content Analytics - MeasureCamp London 2016
What is Content Analytics - MeasureCamp London 2016What is Content Analytics - MeasureCamp London 2016
What is Content Analytics - MeasureCamp London 2016
 

Ähnlich wie Google Humming et Knoweldge Vault : la recherche sémantique de Google expliquée

Expospierre 1229514527066080-2
Expospierre 1229514527066080-2Expospierre 1229514527066080-2
Expospierre 1229514527066080-2
tomasone
 

Ähnlich wie Google Humming et Knoweldge Vault : la recherche sémantique de Google expliquée (20)

Erepday 2013-rich-snippets
Erepday 2013-rich-snippetsErepday 2013-rich-snippets
Erepday 2013-rich-snippets
 
Synodiance > SEO - Le Search de demain - Table Ronde EBG - 19/06/2014
Synodiance > SEO - Le Search de demain - Table Ronde EBG - 19/06/2014Synodiance > SEO - Le Search de demain - Table Ronde EBG - 19/06/2014
Synodiance > SEO - Le Search de demain - Table Ronde EBG - 19/06/2014
 
Google : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Google : trucs et astuces pour les pros de l'infodoc, BFR ConsultantsGoogle : trucs et astuces pour les pros de l'infodoc, BFR Consultants
Google : trucs et astuces pour les pros de l'infodoc, BFR Consultants
 
Recheche d'info sur Internet
Recheche d'info sur InternetRecheche d'info sur Internet
Recheche d'info sur Internet
 
Synodiance > SEO, vocal et sémantique - Performance Digitale Expo - 06/11/2014
Synodiance > SEO, vocal et sémantique - Performance Digitale Expo - 06/11/2014Synodiance > SEO, vocal et sémantique - Performance Digitale Expo - 06/11/2014
Synodiance > SEO, vocal et sémantique - Performance Digitale Expo - 06/11/2014
 
Introduction à l'exploration du Web
Introduction à l'exploration du WebIntroduction à l'exploration du Web
Introduction à l'exploration du Web
 
Expospierre 1229514527066080-2
Expospierre 1229514527066080-2Expospierre 1229514527066080-2
Expospierre 1229514527066080-2
 
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
 
Séance d’ ird en troisième
Séance d’ ird en troisièmeSéance d’ ird en troisième
Séance d’ ird en troisième
 
#ET11 - A20-Agrégation de contenus et web sémantique
#ET11 - A20-Agrégation de contenus et web sémantique#ET11 - A20-Agrégation de contenus et web sémantique
#ET11 - A20-Agrégation de contenus et web sémantique
 
Utiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet DanimationUtiliser Le MultiméDia Dans Un Projet Danimation
Utiliser Le MultiméDia Dans Un Projet Danimation
 
Initiation la rechercher sur le web
Initiation la rechercher sur le webInitiation la rechercher sur le web
Initiation la rechercher sur le web
 
Les clés du référencement
Les clés du référencementLes clés du référencement
Les clés du référencement
 
Publiciser ses travaux de recherche : être (re)connu
Publiciser ses travaux de recherche : être (re)connuPubliciser ses travaux de recherche : être (re)connu
Publiciser ses travaux de recherche : être (re)connu
 
Introduction au web sémantique
Introduction au web sémantiqueIntroduction au web sémantique
Introduction au web sémantique
 
Outils de veille
Outils de veilleOutils de veille
Outils de veille
 
Infographies playainbound : Génération de trafic
Infographies playainbound : Génération de traficInfographies playainbound : Génération de trafic
Infographies playainbound : Génération de trafic
 
Référencement et Web Sémantique SMX Paris 2013
Référencement et Web Sémantique SMX Paris 2013Référencement et Web Sémantique SMX Paris 2013
Référencement et Web Sémantique SMX Paris 2013
 
Referencement semantique-smx-paris-2013 Par David Degrelle
Referencement semantique-smx-paris-2013 Par David Degrelle Referencement semantique-smx-paris-2013 Par David Degrelle
Referencement semantique-smx-paris-2013 Par David Degrelle
 
Google
Google Google
Google
 

Mehr von Woptimo

Wop 2011 - presentation smx
Wop    2011 - presentation smxWop    2011 - presentation smx
Wop 2011 - presentation smx
Woptimo
 
Quels sont les indicateurs SEO performants ?
Quels sont les indicateurs SEO performants ?Quels sont les indicateurs SEO performants ?
Quels sont les indicateurs SEO performants ?
Woptimo
 

Mehr von Woptimo (20)

Évaluer la lisibilité et la pertinence de son contenu, étape indispensable po...
Évaluer la lisibilité et la pertinence de son contenu, étape indispensable po...Évaluer la lisibilité et la pertinence de son contenu, étape indispensable po...
Évaluer la lisibilité et la pertinence de son contenu, étape indispensable po...
 
Tout savoir sur les sources de trafic dans Google Analytics
Tout savoir sur les sources de trafic dans Google AnalyticsTout savoir sur les sources de trafic dans Google Analytics
Tout savoir sur les sources de trafic dans Google Analytics
 
Google Data Studio et Google Search Console : l'intégration via le data blending
Google Data Studio et Google Search Console : l'intégration via le data blendingGoogle Data Studio et Google Search Console : l'intégration via le data blending
Google Data Studio et Google Search Console : l'intégration via le data blending
 
Comment modifier le sens d’un message de marque sans perdre en visibilité ?
Comment modifier le sens d’un message de marque sans perdre en visibilité ?Comment modifier le sens d’un message de marque sans perdre en visibilité ?
Comment modifier le sens d’un message de marque sans perdre en visibilité ?
 
Comment mesurer l'efficacité marketing de son contenu ?
Comment mesurer l'efficacité marketing de son contenu ? Comment mesurer l'efficacité marketing de son contenu ?
Comment mesurer l'efficacité marketing de son contenu ?
 
How Google Tag Manager can save your seo ? - Talk for Brighton SEO 2017
How Google Tag Manager can save your seo ? - Talk for Brighton SEO 2017How Google Tag Manager can save your seo ? - Talk for Brighton SEO 2017
How Google Tag Manager can save your seo ? - Talk for Brighton SEO 2017
 
10 erreurs fréquentes sur Google Analytics
10 erreurs fréquentes sur Google Analytics10 erreurs fréquentes sur Google Analytics
10 erreurs fréquentes sur Google Analytics
 
#Wearetravel15 présentation exposant woptimo
#Wearetravel15  présentation exposant woptimo #Wearetravel15  présentation exposant woptimo
#Wearetravel15 présentation exposant woptimo
 
Du linkbuilding au Content Marketing
Du linkbuilding au Content MarketingDu linkbuilding au Content Marketing
Du linkbuilding au Content Marketing
 
Google venice update : Le SEO local expliqué
Google venice update : Le SEO local expliquéGoogle venice update : Le SEO local expliqué
Google venice update : Le SEO local expliqué
 
Universal Analytics and SEO: How to improve your SEM strategy with Analytics'...
Universal Analytics and SEO: How to improve your SEM strategy with Analytics'...Universal Analytics and SEO: How to improve your SEM strategy with Analytics'...
Universal Analytics and SEO: How to improve your SEM strategy with Analytics'...
 
Google Penguin and Panda - Algorithm explanation
Google Penguin and Panda - Algorithm explanationGoogle Penguin and Panda - Algorithm explanation
Google Penguin and Panda - Algorithm explanation
 
Techniques de netlinking après Google Penguin - SEO Campus 2013
Techniques de netlinking après Google Penguin - SEO Campus 2013Techniques de netlinking après Google Penguin - SEO Campus 2013
Techniques de netlinking après Google Penguin - SEO Campus 2013
 
Most frequent mistakes in Web Analytics : Don't trust your Analytics
Most frequent mistakes in Web Analytics : Don't trust your AnalyticsMost frequent mistakes in Web Analytics : Don't trust your Analytics
Most frequent mistakes in Web Analytics : Don't trust your Analytics
 
How to escape from a Google penalty
How to escape from a Google penaltyHow to escape from a Google penalty
How to escape from a Google penalty
 
JCW2012 - Référencement en 2012
JCW2012 - Référencement en 2012JCW2012 - Référencement en 2012
JCW2012 - Référencement en 2012
 
Les penalites de Google : SEO Camp'us 2012
Les penalites de Google : SEO Camp'us 2012Les penalites de Google : SEO Camp'us 2012
Les penalites de Google : SEO Camp'us 2012
 
Wop 2011 - presentation smx
Wop    2011 - presentation smxWop    2011 - presentation smx
Wop 2011 - presentation smx
 
Quels sont les indicateurs SEO performants ?
Quels sont les indicateurs SEO performants ?Quels sont les indicateurs SEO performants ?
Quels sont les indicateurs SEO performants ?
 
Mesurer ses sources de trafic avec Google Analytics
Mesurer ses sources de trafic avec Google AnalyticsMesurer ses sources de trafic avec Google Analytics
Mesurer ses sources de trafic avec Google Analytics
 

Google Humming et Knoweldge Vault : la recherche sémantique de Google expliquée

  • 1. Google Hummingbird le point de vue d’un linguiste Sébastien Monnier Ex- Googler, fondateur de Woptimo
  • 2. Sommaire 1. Approche syntaxique vs Approche sémantique 2. Hummingbird : un nouvel oiseau? 3. Freebase et la notion de concept 4. Extractions des concepts 5. Exemples dans les SERP 6. Conséquences sur le SEO
  • 4. Le web, cette masse informe Du texte, des tableaux, des images, des ressources ... Décentralisés. Comment structurer l’information pour organiser une recherche?
  • 5. Indexation des mots “lieu de naissance Jules Verne” = lieu + naissance + Jules + Verne Bing en 2014 Voila en 2014
  • 6. Et même les résultats peu probables... Quelle est la probabilité qu’en cherchant “lieu de naissance Jules Verne”, je recherche des informations sur La maternité de la clinique Jules Verne...
  • 7. Approche sémantique Propriété biographique Personnalité lieu de naissance Jules Verne
  • 9. Google Hummingbird : qu’est-ce donc?
  • 10. Qu’est-ce qu’Hummingbird ● Annoncé fin septembre 2013 pour le 15e annniversaire de Google ● Déjà présent depuis un mois ● Impacte 90% des requêtes ● Aussi important pour l’infrastructure de Google que Google Caffeine
  • 11. Pourquoi un colibri? Précis et rapide (... et peut faire marche arrière)
  • 12. Le web a évolué
  • 14. Anticiper les évolutions ● Boom du trafic mobile, du trafic connecté et géolocalisé 1 requête = + que des mots ➔ 1 contexte spatial ➔ 1 contexte humain ➔ 1 contexte d’historique de recherche ➔ Google cherche à comprendre l’intention, plus que l’assemblage des mots dans la requête
  • 16. Moteur: Algorithme général ● Le moteur de recherche de Google est basé sur des algorithmes mathématiques (probabilités) ● Le comportement de ces algorithmes est conditionné par de multiples paramètres linguistiques et statistiques ● Ces paramètres sont calculés grâce à une batterie de “classifiers”
  • 17. Qu’est-ce qu’un classifier? Un classifier est un algorithme de catégorisation ○ Entrée: requêtes, pages web, domaines... ○ Sortie: Nature diverse des informations (texte, score, liste,...) ● Classifier de requête : ○ Ex : requête géolocalisée (bureau Paris), requête navigationelle (Youtube, Facebook...) ● Classifier de pages web : ○ Ex : bourrage de mots-clés, texte caché, “in-depth article”... ● Classifier d’élements sur une page web : ○ Ex : fil d’Ariane, listing d’éléments... ● ... Et de nombreux autres types de classifiers...
  • 18. Moteur: Algorithme général - Schéma Requête (“photo de Paris”) ➢ Analyse lexicale: “photo”:nom... ➢ Analyse syntaxique: groupe nominal ➢ Typologie, Intention ➢ ... Page Web ➢ PageRank ➢ Typologie, Intention ➢ Potentiel de spam ➢ Auteur de la page ➢ ... Domaine Sous-domaine Auteur ... MOTEUR Résultats Universal Knowledge Graph URL 1 URL 2 URL 3 … URL X
  • 19. Algorithme HummingBird Requête (“photo de Paris”) ➢ Analyse lexicale: “photo”:nom... ➢ Analyse syntaxique: groupe nominal ➢ Typologie, Intention ➢ Concepts ➢ ... Page Web ➢ PageRank ➢ Typologie, Intention ➢ Potentiel de spam ➢ Auteur de la page ➢ Concepts ➢ ... Domaine Sous Domaine Auteur ... MOTEUR Résultats Universal Knowledge Graph URL 1 URL 2 URL 3 … URL X
  • 20. Freebase et la notion de concept
  • 21. Freebase Freebase est une base de données de connaissances structurées libre et contributive. ● Créée en 2007 ● Rachetée par Google en 2010 Tout le monde peut contribuer
  • 22. Notion de Concept ➢ Objet concret ou abstrait représenté par une séquence de mots ➢ Concepts interconnectés d’après des relations plus ou moins éloignées
  • 23. Sujet, prédicat, objet Liaison de 2 concepts : Sujet Ressource à décrire Objet Valeur de la propriété Prédicat Type de propriété
  • 24. Sujet, prédicat, objet Liaison de 2 concepts : Sujet Jules Verne Objet Nantes Prédicat Lieu de naissance
  • 25. Sujet, prédicat, objet Liaison de 2 concepts : Sujet FC Nantes Objet Stade de la Beaujoire Prédicat Stade
  • 27. Les données sûres Ressources modérées et surveillées + Grande fréquence de reprises de la même information ● Jules Verne</p><p>Né à Nantes le 08/02/1828 ; Mort à Amiens le 24/03/1905 ● <td>1828</td><td>Jules Verne est né à Nantes le 8 février 1828 </td> ● 1828 - Naissance (8 février) de Jules Verne à Nantes. ● Jules Verne<br>1828 - 1905 Nationalité : française.<BR>(lieu de naissance : Nantes) ● Jules Verne (Nantes, 1828 - Amiens, 1905) ● <tr><td>Ecrivain</td><td>Naissance</td><tr> <tr><td>Jules Verne</td><td>Nantes</td><tr>
  • 28. Extraction des entités Indices linguistiques pour repérer la propriété Lieu Naissance ● SUJET “</p><p>Né à” OBJET ● SUJET est né à OBET ● 1828 - Naissance (DATE) de SUJET à OBJET ● SUJET<br>DATE - 1905 Nationalité : française.<BR>(lieu de naissance : OBJET) ● SUJET (OBJET, DATE - Amiens, 1905) ● <tr><td>Ecrivain</td><td>Naissance</td><tr> <tr><td>SUJET</td><td>OBJET</td><tr>
  • 29. Compréhension des données floues Comment avoir des informations sur quelqu’un/quelque chose qui n’est pas dans une base sémantique? ➔ Extraction des données web en s’inspirant des structures linguistiques identifiées Exemple
  • 30. Knowledge Vault Google a repéré et stocké plus d’un milliard de faits hors bases sémantiques
  • 32. Concepts et intention de l’utilisateur [Représentation Graphique] --> Paris [ville] Interaction directe [Evénement] Expo photo au Grand Palais Informationnel [Marque] Maison de la photographie Navigationnel
  • 33. Répartition des concepts Concepts Résultats Photos/Images [Représentation graphique] Exposition [Evénement] Studio photo [Lieu] Stage photo [Enseignement] Location studio [Commerce]
  • 34. Termes manquants : ● L’ajout de “termes manquants” est un vrai indice de l’utilisation d’ Hummingbird
  • 35. Et les 10% non impactés par Hummingbird? Info présente ici : bravo Google, ... mais ouch...
  • 36. Hummingbird : un complément à l’ existant? Quand Google ne trouve pas assez de résultat concluant avec Hummingbird, l’ ancien algorithme de recherche de co-occurrence rentre en jeu. Quelques indices (?): ➢ Snippet de 4 lignes ➢ Pas le “termes manquants”
  • 37.
  • 38.
  • 39. Qu’est-ce que cela change pour le SEO?
  • 40. Du mot-clé à l’intention Oublions la simple “expression-clé” Pensons à l’intention de l’utilisateur
  • 41. Analysez les SERP Au-delà de la position, il faut essayer de comprendre ● L’INTENTION de la requête interprétée par Google. ● La réponse comprise par Google ● La diversité des résultats ● Google ne classe pas 10 pages web en fonction de leur PageRank. ● Google organise la présentation d’informations permettant de répondre, au mieux, au besoin supposé de l’internaute.
  • 42. Pensez aux mentions “SuperMutuellePro m’a aidé à comparer des mutuelles” SUJET Entité : Marque OBJET Entité : Type de société PREDICAT Propriété : Comparaison
  • 43. Adieu contenu SEO... ● Oubliez les consignes comme : Je veux un texte de 300 mots optimisés pour mot-clé1, mot-clé2 et mot-clé3 Donnez plutôt : Je veux du contenu pour une page qui va donner cette information avec 2 arguments, 2 exemples et en citant ses sources. ➔ Soyez concis, clair et factuel ➔ Pensez présentation et lisibilité du texte ➔ Pensez mots-clés, champ lexical et synonymes dans un 2e temps
  • 44. Véracité du contenu Si vous possédez du contenu vérifiable (date de naissance/décès de célébrité, adresses d’entreprise, ...), pensez à les mettre à jour. Google peut extraire votre contenu et les comparer avec sa base de connaissance. Trop de mauvaises informations = MAUVAIS SIGNAL
  • 45. Marquage sémantique Utilisation des données structurées / microdonnées devient un standard ➔ permet aux moteurs une meilleure compréhension des concepts de votre site ➔ L’absence de données structurées n’entraîne pas de pénalités, mais vous risquez une moins bonne interprétation par Google
  • 46. 1 rue Albert Einstein, Champs-sur-Marne, 77447 Marne-la-Vallée Cedex 2 France Tél : +33 (0)1 83 64 24 11 Fax : +33 (0)1 83 64 38 15 Twitter : @woptimo www.woptimo.com Merci