3. Definition nach Google Crawling the Web, following links to find pages Indexing the pages to create an index from every word to every place it occurs Ranking the pages so the best ones show up first Displaying the results in a way that is easy for the user to understand Quelle: “Internet Searching”, 2004, Peter Norvig, Director of Research Google Inc.
7. Probleme beim Crawling Seite kann zurzeit nicht ausgeliefert werden Seite ist nicht erreichbar Seite ist dupliziert auf verschiedenen Seiten Seite ist verfügbar unter verschiedenen URL innerhalb der Domain
8. Weitere Probleme: Viele Seiten enthalten Inhalte die nicht dem HTML Standard entsprechen HTTP Weiterleitungen Ausschluss über die robots.txt Datei Information ist schwer zu erreichen, weil sie sich hinter einem Formular, einer Flashanimation oder JavaScript verbirgt
9. 2. Indexing Indizieren der Seiten um einen Index zu kreieren von jedem Wort und jedem Platz an dem es vorkommt.
10. 2. Indexing Indizieren der Seiten um einen Index zu kreieren von jedem Wort und jedem Platz an dem es vorkommt. Nicht alles was gecrawlt wird, landet im Index!
11. 3. Ranking Über 200 Rankingfaktoren (z.B. PageRank) Wertigkeit der Webseite ermitteln Reihenfolge in der Präsentation festlegen
12. Ein Rankingfaktor: PageRank Definition: PageRank interpretiert einen Link von Seite A auf Seite B als Votum für Seite B durch Seite A