SlideShare une entreprise Scribd logo
1  sur  10
Les moteurs de recherche
• Aperçu général
• Les différentes technologie
• Et plus en détail : les spiders
Comment fonctionne un moteur
de recherche ?
•La collecte d’information
•L’indexation des données collectées
•Classement des résultats en fonction de
leurs pertinences
•Affichage des résultats les uns en-dessous
des autres
Fonctionnement
Technologie utilisée
Donnée valable pour 2009
La collecte d’information
avec les spiders
Les spiders qu’est ce que c’est ?
• Les spiders (bots) sont des programmes de navigation
visitant en permanence les pages web et leurs liens en
vue d’indexer leurs contenus.
• Il détecte les liens des pages est les visites 24h/24h.
Les différents bots
• Les bots les plus connu : Googlebot de Google, Yahoo! Slurp de
Yahoo!, MSNBot de Microsoft Bing, Exabot d’Exalead.
• https://support.google.com/webmasters/answer/182072?hl=fr
Les spiders ou crawler
Qu’est ce qui font ?
• Contrôles des différentes versions enregistrer dans les
bases de données du spider.
• Avant la visite était mensuel, maintenant les bots visites
des sites plusieurs fois par jour.
Les spiders
Politique de sélection
• Une étude de 2009 a montré que seulement 40% à 70% du web est
indexé.
• 1999 : Un moteur de recherche indexe pas plus de 16% du web.
Le web profond ou le deep web
• Le web profond : les robots sont incapables de trouver les
pages qui n’ont aucun lien qui pointe vers eux.
• Google a développé les Sitemaps et mod_oai pour
permettre la découverte des ces ressources.
• TOR :
http://fr.wikipedia.org/wiki/Tor_%28r%C3%A9seau%29
Source
• Olivier Andrieu - Reussir son referencement
web
• http://en.wikipedia.org/wiki/Web_crawler/
• http://roxors.pbworks.com/w/page/87922261/Lu
cas%20Roche

Contenu connexe

En vedette

Que es el plagio, como se reconoce y como evitarlo
Que es el plagio, como se reconoce y como evitarloQue es el plagio, como se reconoce y como evitarlo
Que es el plagio, como se reconoce y como evitarloJohan Aceros
 
Falla amistat 2013
Falla amistat 2013Falla amistat 2013
Falla amistat 2013manelvil
 
Olfanews Parfums Septembre 2015
Olfanews Parfums Septembre 2015Olfanews Parfums Septembre 2015
Olfanews Parfums Septembre 2015Cinquième Sens
 
Robin mascotte ambassadeur de l'Ardenne - Dossier de presse 2013
Robin mascotte ambassadeur de l'Ardenne - Dossier de presse 2013Robin mascotte ambassadeur de l'Ardenne - Dossier de presse 2013
Robin mascotte ambassadeur de l'Ardenne - Dossier de presse 2013Robin Ardenne
 
Monflanquin en 4 l 4x014
Monflanquin en 4 l 4x014Monflanquin en 4 l 4x014
Monflanquin en 4 l 4x014Karen de Graaff
 
Los pueblos indígenas y el derecho a la educación: Situación socioeducativa d...
Los pueblos indígenas y el derecho a la educación: Situación socioeducativa d...Los pueblos indígenas y el derecho a la educación: Situación socioeducativa d...
Los pueblos indígenas y el derecho a la educación: Situación socioeducativa d...maugenocioni
 
140331 adbs lr-innovations-search-v3
140331 adbs lr-innovations-search-v3140331 adbs lr-innovations-search-v3
140331 adbs lr-innovations-search-v3ADBSDP
 
Brochure Mactac 2013 - Solutions adhésives applications
Brochure Mactac 2013 - Solutions adhésives applicationsBrochure Mactac 2013 - Solutions adhésives applications
Brochure Mactac 2013 - Solutions adhésives applicationsMactac Europe
 
Unidad 1 pai
Unidad 1  paiUnidad 1  pai
Unidad 1 paiaimorales
 
Eripm wd bgt0000 nbk
Eripm wd bgt0000 nbkEripm wd bgt0000 nbk
Eripm wd bgt0000 nbkSprl Eripm
 
La contabilidad de costos
La contabilidad de costosLa contabilidad de costos
La contabilidad de costosCadenaTania
 

En vedette (19)

Pedag social
Pedag socialPedag social
Pedag social
 
U2 drive2
U2 drive2U2 drive2
U2 drive2
 
Que es el plagio, como se reconoce y como evitarlo
Que es el plagio, como se reconoce y como evitarloQue es el plagio, como se reconoce y como evitarlo
Que es el plagio, como se reconoce y como evitarlo
 
Crónica nº 19
Crónica nº 19Crónica nº 19
Crónica nº 19
 
Falla amistat 2013
Falla amistat 2013Falla amistat 2013
Falla amistat 2013
 
Guía impress 3
Guía impress 3Guía impress 3
Guía impress 3
 
Le liège au portugal
Le liège au portugalLe liège au portugal
Le liège au portugal
 
Olfanews Parfums Septembre 2015
Olfanews Parfums Septembre 2015Olfanews Parfums Septembre 2015
Olfanews Parfums Septembre 2015
 
Robin mascotte ambassadeur de l'Ardenne - Dossier de presse 2013
Robin mascotte ambassadeur de l'Ardenne - Dossier de presse 2013Robin mascotte ambassadeur de l'Ardenne - Dossier de presse 2013
Robin mascotte ambassadeur de l'Ardenne - Dossier de presse 2013
 
Monflanquin en 4 l 4x014
Monflanquin en 4 l 4x014Monflanquin en 4 l 4x014
Monflanquin en 4 l 4x014
 
Los pueblos indígenas y el derecho a la educación: Situación socioeducativa d...
Los pueblos indígenas y el derecho a la educación: Situación socioeducativa d...Los pueblos indígenas y el derecho a la educación: Situación socioeducativa d...
Los pueblos indígenas y el derecho a la educación: Situación socioeducativa d...
 
140331 adbs lr-innovations-search-v3
140331 adbs lr-innovations-search-v3140331 adbs lr-innovations-search-v3
140331 adbs lr-innovations-search-v3
 
Brochure Mactac 2013 - Solutions adhésives applications
Brochure Mactac 2013 - Solutions adhésives applicationsBrochure Mactac 2013 - Solutions adhésives applications
Brochure Mactac 2013 - Solutions adhésives applications
 
Defile 8 mai
Defile 8 maiDefile 8 mai
Defile 8 mai
 
T1 adaptación de cursos with audio
T1 adaptación de cursos with audioT1 adaptación de cursos with audio
T1 adaptación de cursos with audio
 
Présentation JCL 2017
Présentation JCL 2017Présentation JCL 2017
Présentation JCL 2017
 
Unidad 1 pai
Unidad 1  paiUnidad 1  pai
Unidad 1 pai
 
Eripm wd bgt0000 nbk
Eripm wd bgt0000 nbkEripm wd bgt0000 nbk
Eripm wd bgt0000 nbk
 
La contabilidad de costos
La contabilidad de costosLa contabilidad de costos
La contabilidad de costos
 

Fonctionnement des moteurs de recherche

  • 1. Les moteurs de recherche • Aperçu général • Les différentes technologie • Et plus en détail : les spiders
  • 2. Comment fonctionne un moteur de recherche ? •La collecte d’information •L’indexation des données collectées •Classement des résultats en fonction de leurs pertinences •Affichage des résultats les uns en-dessous des autres
  • 5. La collecte d’information avec les spiders Les spiders qu’est ce que c’est ? • Les spiders (bots) sont des programmes de navigation visitant en permanence les pages web et leurs liens en vue d’indexer leurs contenus. • Il détecte les liens des pages est les visites 24h/24h.
  • 6. Les différents bots • Les bots les plus connu : Googlebot de Google, Yahoo! Slurp de Yahoo!, MSNBot de Microsoft Bing, Exabot d’Exalead. • https://support.google.com/webmasters/answer/182072?hl=fr
  • 7. Les spiders ou crawler Qu’est ce qui font ? • Contrôles des différentes versions enregistrer dans les bases de données du spider. • Avant la visite était mensuel, maintenant les bots visites des sites plusieurs fois par jour.
  • 8. Les spiders Politique de sélection • Une étude de 2009 a montré que seulement 40% à 70% du web est indexé. • 1999 : Un moteur de recherche indexe pas plus de 16% du web.
  • 9. Le web profond ou le deep web • Le web profond : les robots sont incapables de trouver les pages qui n’ont aucun lien qui pointe vers eux. • Google a développé les Sitemaps et mod_oai pour permettre la découverte des ces ressources. • TOR : http://fr.wikipedia.org/wiki/Tor_%28r%C3%A9seau%29
  • 10. Source • Olivier Andrieu - Reussir son referencement web • http://en.wikipedia.org/wiki/Web_crawler/ • http://roxors.pbworks.com/w/page/87922261/Lu cas%20Roche