SlideShare ist ein Scribd-Unternehmen logo
1 von 12
Downloaden Sie, um offline zu lesen
LES OUTILS DE RECHERCHE
TYPOLOGIE DES OUTILS DE RECHERCHE : MOTEURS ET ANNUAIRES




  Moteurs                                  Annuaires
  - Gestion automatisée                    - Gestion humaine
  - Entrée par indexation                  - Entrée par soumission
  - Tout le web a vocation à être indexé   - Des choix éditoriaux sont faits
  - Tout le contenu des pages est indexé   - Seules les références aux sites sont indexées
  - Navigation par requêtes                - Navigation arborescente (recherche possible)
FONCTIONNEMENT D'UN MOTEUR DE RECHERCHE (VERSION SIMPLE)




     Web                Indexeur
                                          Index




                                          Moteur
                                       de recherche
FONCTIONNEMENT D'UN MOTEUR (VERSION MOINS SIMPLE)
                                                                                            (Schema basé sur l'article « The Anatomy
                                                            Web                             of a Large-Scale Hypertextual Web
                                                                                            Search Engine », par Sergey Brin et
                                                                                            Lawrence Page)


                Serveur d'URLs                               Crawlers                           Serveur tampon
                Dicte les URLs à crawler                  Indexent, envoient le               Compresse, numérote et envoie
                                                          contenu des pages



                                                     Ancres
         Résolveur d'URLs                        Stocke les liens et
                                                 ancres associées
                                                                                                        Dépôt
      Convertit les URLs en URLs absolues,                               Indexeur
      et lie les documents entre eux
                                                                       Décompresse, parse      Contient une copie de chaque
                                                                                               page HTML indexée (cache)



                                                             Silos
                                                               Silos
                                                                 Silos                Trieur                     Lexique
   Liens              Index des documents                   Maintient une         Trie le contenu des silos et
                                                            correspondance        produit un index inversé
Stocke une              Répertories l'ensemble des          mots / documents
cartographie du web     documents indexés                   (index inversé)
                        (index direct)


                                                                                         Moteur de recherche
     Pagerank                                                                            Répond aux requêtes des utilisateurs
COMMENT PENSE UN MOTEUR ?

Juger de la pertinence d'une page web, c'est un peu comme juger du contenu d'un livre
dans une bibliothèque :




  Contenu                 Titre                            Balise <title>
                          4ème de couverture               Balise <meta> description
                          Table des matière                Titraille (balises <h1> à <h6>)
                          Contenu général                  Ensemble des textes

  Structure               Lisibilité                       Accessibilité technique et
                                                           structuration



  Popularité              Recommandations                  Quantité, qualité et teneur des
                                                           liens entrants
ANATOMIE GENERALE D'UNE PAGE DE RESULTATS




                     Résultats « Onebox »




                                                 Liens sponsorisés


                            Résultats naturels
ELEMENTS D'INTERFACE GOOGLE

Sitelinks



                                 Résultats indentés


- Déterminés algorithmiquement
- Jusque 8 éléments

Classic sitelinks


                                 - Contextuels

- Déterminés algorithmiquement
- Jusque 4 éléments              Hiérarchie de site

 Jumplinks

                                 - Basées sur les fils d'ariane des sites

- Contextuels
- Basés sur les ancres
RECHERCHE UNIVERSELLE


                                      Objectif : « faire tomber les silos de
                     Actualités       l'information qui existent sur le web »
                                      (Marissa Mayer, 16/05/07)


         Pages web




              Billets de blogs



                       Images


                             Vidéos
PERSONNALISATION DES RESULTATS DE RECHERCHE

Plusieurs critères concourent la personnalisation des résultats :




 Localisation de l'utilisateur                                      Interface utilisée
 (IP, langue du navigateur)                                         (.com, .fr...)




 Comportement de                                                     Personnalisations
 l'utilisateur                                                       par l'utilisateur
 (loggé ou non)                                                      (Searchwiki)
PERSONNALISATION POUR TOUT LE MONDE !
LES OPERATEURS UTILES AU REFERENCEUR : GOOGLE

Guillemets "
Pour rechercher une chaine de mots

Tiret -

Pour exclure des mots ou sites

Site:

Pour rechercher sur un domaine, un sous-domaine, un répertoire

Filetype:

Pour rechercher un type de fichier donné

Inurl: et allinurl:

Pour rechercher les pages dont l'URL contient une expression

Intitle: et allintitle:

Pour rechercher les pages dont le <title> contient une expression

Link:

Pour recherche des pages pointant vers une URL donnée
LES OPERATEURS UTILES AU REFERENCEUR : BING

Linkfromdomain:
Pour rechercher les liens sortants d'un domaine

Ip:

Pour rechercher les sites hébergés sur une IP

Inanchor:

Pour rechercher les sites liés avec une ancre donnée

Weitere ähnliche Inhalte

Ähnlich wie Les outils de recherche internet

Master IDEMM - Fonctionnement des moteurs de recherche
Master IDEMM - Fonctionnement des moteurs de rechercheMaster IDEMM - Fonctionnement des moteurs de recherche
Master IDEMM - Fonctionnement des moteurs de rechercheSébastien Billard
 
Introduction au referencement naturel
Introduction au referencement naturelIntroduction au referencement naturel
Introduction au referencement naturelAbdoulaye Dieng
 
Workshop/referencement naturel
Workshop/referencement naturelWorkshop/referencement naturel
Workshop/referencement naturelJean-Louis Kalala
 
Entreprise search (1).ppt
Entreprise search (1).pptEntreprise search (1).ppt
Entreprise search (1).pptilyhel
 
Entreprise search (1).ppt
Entreprise search (1).pptEntreprise search (1).ppt
Entreprise search (1).pptilyhel
 
Criteres référencement
Criteres référencementCriteres référencement
Criteres référencementMiss Seo Girl
 
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...Franck Cornu
 
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...Fabien Gandon
 
Accessibilité et SEO - Sébastien Delorme - SEO Campus 2010
Accessibilité et SEO - Sébastien Delorme - SEO Campus 2010Accessibilité et SEO - Sébastien Delorme - SEO Campus 2010
Accessibilité et SEO - Sébastien Delorme - SEO Campus 2010SEO CAMP
 
Concilier accessibilité et SEO
Concilier accessibilité et SEOConcilier accessibilité et SEO
Concilier accessibilité et SEOSébastien Delorme
 
Cours référencement naturel supdeco techonologie avril-15
Cours référencement naturel supdeco techonologie avril-15Cours référencement naturel supdeco techonologie avril-15
Cours référencement naturel supdeco techonologie avril-15Abdoulaye Dieng
 
Fondamentaux du Référencement naturel
Fondamentaux du Référencement naturelFondamentaux du Référencement naturel
Fondamentaux du Référencement naturelAbdoulaye Dieng
 
Redaction web - M2MV 2015
Redaction web - M2MV 2015Redaction web - M2MV 2015
Redaction web - M2MV 2015Tube2Com
 
Hesso valais - referencement naturel
Hesso valais - referencement naturelHesso valais - referencement naturel
Hesso valais - referencement naturelPhilippe Barman
 
Drupal SEO - Optimiser son site
Drupal SEO - Optimiser son siteDrupal SEO - Optimiser son site
Drupal SEO - Optimiser son siteStéphane ARRAMI
 
Référencement naturel - SEO - Points principaux
Référencement naturel - SEO - Points principauxRéférencement naturel - SEO - Points principaux
Référencement naturel - SEO - Points principauxNadège tétaz
 
Les évolutions de HAL : présentation du 20 septembre 2017
Les évolutions de HAL : présentation du 20 septembre 2017Les évolutions de HAL : présentation du 20 septembre 2017
Les évolutions de HAL : présentation du 20 septembre 2017OAccsd
 
Sharepoint 2010 pour les administrateurs
Sharepoint 2010 pour les administrateursSharepoint 2010 pour les administrateurs
Sharepoint 2010 pour les administrateursMario Leblond
 

Ähnlich wie Les outils de recherche internet (20)

Master IDEMM - Fonctionnement des moteurs de recherche
Master IDEMM - Fonctionnement des moteurs de rechercheMaster IDEMM - Fonctionnement des moteurs de recherche
Master IDEMM - Fonctionnement des moteurs de recherche
 
Introduction au referencement naturel
Introduction au referencement naturelIntroduction au referencement naturel
Introduction au referencement naturel
 
Workshop/referencement naturel
Workshop/referencement naturelWorkshop/referencement naturel
Workshop/referencement naturel
 
Entreprise search (1).ppt
Entreprise search (1).pptEntreprise search (1).ppt
Entreprise search (1).ppt
 
Entreprise search (1).ppt
Entreprise search (1).pptEntreprise search (1).ppt
Entreprise search (1).ppt
 
Criteres référencement
Criteres référencementCriteres référencement
Criteres référencement
 
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
Mettre en place un intranet ou un site web public en SharePoint 2013 autour d...
 
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
 
Seo
SeoSeo
Seo
 
Accessibilité et SEO - Sébastien Delorme - SEO Campus 2010
Accessibilité et SEO - Sébastien Delorme - SEO Campus 2010Accessibilité et SEO - Sébastien Delorme - SEO Campus 2010
Accessibilité et SEO - Sébastien Delorme - SEO Campus 2010
 
Concilier accessibilité et SEO
Concilier accessibilité et SEOConcilier accessibilité et SEO
Concilier accessibilité et SEO
 
Cours référencement naturel supdeco techonologie avril-15
Cours référencement naturel supdeco techonologie avril-15Cours référencement naturel supdeco techonologie avril-15
Cours référencement naturel supdeco techonologie avril-15
 
Fondamentaux du Référencement naturel
Fondamentaux du Référencement naturelFondamentaux du Référencement naturel
Fondamentaux du Référencement naturel
 
Redaction web - M2MV 2015
Redaction web - M2MV 2015Redaction web - M2MV 2015
Redaction web - M2MV 2015
 
Hesso valais - referencement naturel
Hesso valais - referencement naturelHesso valais - referencement naturel
Hesso valais - referencement naturel
 
referencement en image
referencement en imagereferencement en image
referencement en image
 
Drupal SEO - Optimiser son site
Drupal SEO - Optimiser son siteDrupal SEO - Optimiser son site
Drupal SEO - Optimiser son site
 
Référencement naturel - SEO - Points principaux
Référencement naturel - SEO - Points principauxRéférencement naturel - SEO - Points principaux
Référencement naturel - SEO - Points principaux
 
Les évolutions de HAL : présentation du 20 septembre 2017
Les évolutions de HAL : présentation du 20 septembre 2017Les évolutions de HAL : présentation du 20 septembre 2017
Les évolutions de HAL : présentation du 20 septembre 2017
 
Sharepoint 2010 pour les administrateurs
Sharepoint 2010 pour les administrateursSharepoint 2010 pour les administrateurs
Sharepoint 2010 pour les administrateurs
 

Kürzlich hochgeladen

Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxRayane619450
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxssuserbd075f
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 

Kürzlich hochgeladen (10)

Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 

Les outils de recherche internet

  • 1. LES OUTILS DE RECHERCHE
  • 2. TYPOLOGIE DES OUTILS DE RECHERCHE : MOTEURS ET ANNUAIRES Moteurs Annuaires - Gestion automatisée - Gestion humaine - Entrée par indexation - Entrée par soumission - Tout le web a vocation à être indexé - Des choix éditoriaux sont faits - Tout le contenu des pages est indexé - Seules les références aux sites sont indexées - Navigation par requêtes - Navigation arborescente (recherche possible)
  • 3. FONCTIONNEMENT D'UN MOTEUR DE RECHERCHE (VERSION SIMPLE) Web Indexeur Index Moteur de recherche
  • 4. FONCTIONNEMENT D'UN MOTEUR (VERSION MOINS SIMPLE) (Schema basé sur l'article « The Anatomy Web of a Large-Scale Hypertextual Web Search Engine », par Sergey Brin et Lawrence Page) Serveur d'URLs Crawlers Serveur tampon Dicte les URLs à crawler Indexent, envoient le Compresse, numérote et envoie contenu des pages Ancres Résolveur d'URLs Stocke les liens et ancres associées Dépôt Convertit les URLs en URLs absolues, Indexeur et lie les documents entre eux Décompresse, parse Contient une copie de chaque page HTML indexée (cache) Silos Silos Silos Trieur Lexique Liens Index des documents Maintient une Trie le contenu des silos et correspondance produit un index inversé Stocke une Répertories l'ensemble des mots / documents cartographie du web documents indexés (index inversé) (index direct) Moteur de recherche Pagerank Répond aux requêtes des utilisateurs
  • 5. COMMENT PENSE UN MOTEUR ? Juger de la pertinence d'une page web, c'est un peu comme juger du contenu d'un livre dans une bibliothèque : Contenu Titre Balise <title> 4ème de couverture Balise <meta> description Table des matière Titraille (balises <h1> à <h6>) Contenu général Ensemble des textes Structure Lisibilité Accessibilité technique et structuration Popularité Recommandations Quantité, qualité et teneur des liens entrants
  • 6. ANATOMIE GENERALE D'UNE PAGE DE RESULTATS Résultats « Onebox » Liens sponsorisés Résultats naturels
  • 7. ELEMENTS D'INTERFACE GOOGLE Sitelinks Résultats indentés - Déterminés algorithmiquement - Jusque 8 éléments Classic sitelinks - Contextuels - Déterminés algorithmiquement - Jusque 4 éléments Hiérarchie de site Jumplinks - Basées sur les fils d'ariane des sites - Contextuels - Basés sur les ancres
  • 8. RECHERCHE UNIVERSELLE Objectif : « faire tomber les silos de Actualités l'information qui existent sur le web » (Marissa Mayer, 16/05/07) Pages web Billets de blogs Images Vidéos
  • 9. PERSONNALISATION DES RESULTATS DE RECHERCHE Plusieurs critères concourent la personnalisation des résultats : Localisation de l'utilisateur Interface utilisée (IP, langue du navigateur) (.com, .fr...) Comportement de Personnalisations l'utilisateur par l'utilisateur (loggé ou non) (Searchwiki)
  • 11. LES OPERATEURS UTILES AU REFERENCEUR : GOOGLE Guillemets " Pour rechercher une chaine de mots Tiret - Pour exclure des mots ou sites Site: Pour rechercher sur un domaine, un sous-domaine, un répertoire Filetype: Pour rechercher un type de fichier donné Inurl: et allinurl: Pour rechercher les pages dont l'URL contient une expression Intitle: et allintitle: Pour rechercher les pages dont le <title> contient une expression Link: Pour recherche des pages pointant vers une URL donnée
  • 12. LES OPERATEURS UTILES AU REFERENCEUR : BING Linkfromdomain: Pour rechercher les liens sortants d'un domaine Ip: Pour rechercher les sites hébergés sur une IP Inanchor: Pour rechercher les sites liés avec une ancre donnée