Erläuterung der Suchtechnologie von Google
Vier ArbeitsschritteCrawlingIndexingRankingDisplaying
Definition nach GoogleCrawling the Web, following links to find pagesIndexing the pages to create an index from every word to every place it occursRanking the pages so the best ones show up firstDisplaying the results in a way that is easy for the user to understandQuelle: “Internet Searching”, 2004, Peter Norvig, Director of Research Google Inc.
1. CrawlingWebcrawler (Robots, Bots) folgen Links um neue Seiten zu finden
Übermittlung der Inhalte an den Index
Suche und Übermittlung von neuen URLs zur IndexierungSchematische Darstellung des Crawlings
Probleme beim CrawlingSeite kann zurzeit nicht ausgeliefert werdenSeite ist nicht erreichbarSeite ist dupliziert auf verschiedenen SeitenSeite ist verfügbar unter verschiedenen URL innerhalb der Domain
Weitere Probleme:Viele Seiten enthalten Inhalte die nicht dem HTML Standard entsprechenHTTP WeiterleitungenAusschluss über die robots.txt DateiInformation ist schwer zu erreichen, weil sie sich hinter einem Formular, einer Flashanimation oder JavaScript verbirgt
2. IndexingIndizieren der Seiten um einen Index zu kreieren von jedem Wort und jedem Platz an dem es vorkommt.
2. IndexingIndizieren der Seiten um einen Index zu kreieren von jedem Wort und jedem Platz an dem es vorkommt.Nicht alles was gecrawlt wird, landet im Index!
3. RankingÜber 200 Rankingfaktoren (z.B. PageRank)Wertigkeit der Webseite ermittelnReihenfolge in der Präsentation festlegen
Ein Rankingfaktor: PageRankDefinition:PageRank interpretiert einen Link von Seite A auf Seite B als Votum für Seite B durch Seite A
PageRank Formel
4. DisplayingAnzeigen der Resultate in einer Form die für den Nutzer leicht verständlich istVorhandene relevante Werbung anzeigen
OptimierungsansätzeOptimierungsansätzeCrawlingIndexingRankingDisplaying
Validität/HTML Standards beachtenDokumentengliederungPosition der SuchbegriffeOptimierung Crawling/Indexing
 Optimierung RankingSuchmaschinenfreundlichkeit

Arbeitsweise Google