Arbeitsweise Google

1.141 Aufrufe

Veröffentlicht am

Veröffentlicht in: Technologie
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.141
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
4
Aktionen
Geteilt
0
Downloads
6
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Arbeitsweise Google

  1. 1. Erläuterung der Suchtechnologie von Google<br />
  2. 2. Vier Arbeitsschritte<br />Crawling<br />Indexing<br />Ranking<br />Displaying<br />
  3. 3. Definition nach Google<br />Crawling the Web, following links to find pages<br />Indexing the pages to create an index from every word to every place it occurs<br />Ranking the pages so the best ones show up first<br />Displaying the results in a way that is easy for the user to understand<br />Quelle: “Internet Searching”, 2004, Peter Norvig, Director of Research Google Inc.<br />
  4. 4. 1. Crawling<br /><ul><li>Webcrawler (Robots, Bots) folgen Links um neue Seiten zu finden
  5. 5. Übermittlung der Inhalte an den Index
  6. 6. Suche und Übermittlung von neuen URLs zur Indexierung</li></li></ul><li>Schematische Darstellung des Crawlings<br />
  7. 7. Probleme beim Crawling<br />Seite kann zurzeit nicht ausgeliefert werden<br />Seite ist nicht erreichbar<br />Seite ist dupliziert auf verschiedenen Seiten<br />Seite ist verfügbar unter verschiedenen URL innerhalb der Domain<br />
  8. 8. Weitere Probleme:<br />Viele Seiten enthalten Inhalte die nicht dem HTML Standard entsprechen<br />HTTP Weiterleitungen<br />Ausschluss über die robots.txt Datei<br />Information ist schwer zu erreichen, weil sie sich hinter einem Formular, einer Flashanimation oder JavaScript verbirgt<br />
  9. 9. 2. Indexing<br />Indizieren der Seiten um einen Index zu kreieren von jedem Wort und jedem Platz an dem es vorkommt.<br />
  10. 10. 2. Indexing<br />Indizieren der Seiten um einen Index zu kreieren von jedem Wort und jedem Platz an dem es vorkommt.<br />Nicht alles was gecrawlt wird, landet im Index!<br />
  11. 11. 3. Ranking<br />Über 200 Rankingfaktoren (z.B. PageRank)<br />Wertigkeit der Webseite ermitteln<br />Reihenfolge in der Präsentation festlegen<br />
  12. 12. Ein Rankingfaktor: PageRank<br />Definition:<br />PageRank interpretiert einen Link von Seite A auf Seite B als Votum für Seite B durch Seite A<br />
  13. 13. PageRank Formel<br />
  14. 14.
  15. 15. 4. Displaying<br />Anzeigen der Resultate in einer Form die für den Nutzer leicht verständlich ist<br />Vorhandene relevante Werbung anzeigen <br />
  16. 16. Optimierungsansätze<br />Optimierungsansätze<br />Crawling<br />Indexing<br />Ranking<br />Displaying<br />
  17. 17. Validität/HTML Standards beachten<br />Dokumentengliederung<br />Position der Suchbegriffe<br />Optimierung Crawling/Indexing<br />
  18. 18. Optimierung Ranking<br /><ul><li>Suchmaschinenfreundlichkeit
  19. 19. Links, Links, Links
  20. 20. Social Media Graphen
  21. 21. Usergenerated Content</li></li></ul><li> Optimierung Displaying<br /><ul><li>HTML-Titel
  22. 22. Description / Snippet</li>

×