2. Wat is google?
• Google is een zoekmachine van Google inc. voor documenten op
het World Wide Web, gelanceerd in 1998 door twee promovendi
aan de Stanford-Universiteit, Larry Page en Sergey Brin. Page en
Brin hadden twee jaar gewerkt aan een geavanceerde methode
voor het vinden van informatie op internet. Al snel werd Google
's werelds populairste zoekmachine. Gebruikers waren tevreden
over de zoekresultaten, en over de presentatie ervan: op een
rustige pagina, zonder de schreeuwerige advertenties die bij
veel andere zoekmachines te zien waren.
• De naam is een variant van het woord “googol”. Googol is de
aanduiding voor een 1 met honderd nullen (10100). De term
weerspiegelt de bedrijfsmissie om alle informatie van de wereld
toegankelijk en nuttig te maken.
3. Hoe werkt google?
• De basis van de Google zoekmachine is een algoritme met de naam PageRank. In
essentie wordt de waarde van een pagina bepaald door het aantal malen dat er
naar gelinkt wordt vanaf andere internetpagina's. Elke verwijzing betekent een
stem voor een pagina. Google analyseert ook de pagina die de stem uitbrengt.
PageRank heeft -intern bij google- een schaal van 1 tot 11, In de Google toolbar
word dit teruggebracht tot een schaal van 1 tot 10
• PageRank wordt gebruikt om de resultaten van een zoekopdracht te rangschikken.
Een hoge PageRank betekent niet dat de pagina bij alle zoekopdrachten hoog zal
scoren.
4. Algoritme
• Google heeft een algoritme om te bepalen welke pagina het eerst in de
resultaatlijst wordt genoemd. Belangrijk daarbij is, naast de vraag hoe belangrijk
een zoekterm op de pagina is, hoe vaak er naar een pagina gelinkt wordt, vanaf
welke pagina's en met welke tekst.
• Omdat veel gebruikers Google gebruiken om pagina's te vinden, is het voor
aanbieders van materiaal nuttig om hoog in Google vermeld te worden. Daarom
worden er methoden gebruikt om kunstmatig de 'pagerank' van pagina's op
Google te verhogen, bijvoorbeeld door het creëren van 'fake' webpagina's, die
slechts dienen om naar andere pagina's te verwijzen, zodat deze een hogere rang
krijgen. Google heeft een aantal malen zijn algoritme aangepast om zo het effect
van dergelijke praktijken te verminderen of teniet te doen.
5. Algoritme
• Harde uitspraken die de plaats van een webpagina in de resultatenlijst van een
zoekopdracht voorspellen zijn erg moeilijk en vaak twijfelachtig. Het exacte
algoritme van Google wordt namelijk door de makers geheim gehouden en is voor
buitenstaanders niet altijd even gemakkelijk te begrijpen. Niemand weet hoe
zwaar PageRank doorweegt in het algoritme: zo had op 28 maart het Wikipedia-
artikel over Westerse wereld een pagerank van 5 op 10. Op dezelfde dag had het
Wikipedia-artikel over Westerse cultuur een pagerank van 0 op 10. Toch werd de
pagina over Westerse cultuur als eerste in de resultatenlijst opgenomen toen via
Google met de zoekterm quot;Westerse wereldquot; werd gezocht.
6. Index
• Elke zoekopdracht doorzoekt in minder dan een seconde een index die is
opgebouwd uit bijna 10 miljard webpagina's (stand juli 2007). Een groot deel van
die pagina's wordt regelmatig bezocht door de spider van Google, Googlebot
genaamd. De spider leest de pagina en slaat de gegevens op in de index. De spider
is in staat om hyperlinks te volgen, en kan op die manier een groot deel van het
web bezoeken. Volgens Google werd op 25 juli 2008 de mijlpaal van 1 biljoen
unieke URL’s overschreden.
7. Techniek
• Van meet af aan is er voor gekozen niet te werken met 1 grote centrale computer,
maar met een netwerk van zeer veel relatief goedkope computers. Googles server
park bestaat naar schatting uit meer dan 450.000 systemen die zijn opgebouwd uit
standaard hardwarecomponenten. De computers staan verspreid over allerlei
datacentra. Door clusters redundant uit te voeren kunnen defecte machines
eenvoudig vervangen worden.
8. Tips
• Men kan een zin in Google vinden. Als men bijvoorbeeld het verschil tussen Belge
en Nederlanders wil zien, kun je zoeken op verschillen tussen Nederlanders en
Belgen. Maar misschien is het handiger om de zin tussen aanhalingstekens te
zetten (quot; quot; ). Google laat dan alleen pagina's zien waar de woorden quot;verschillen
tussen Belgen en Nederlandersquot; meteen na elkaar en in deze exacte volgorde te
zien zijn.
• Als men wil weten hoeveel inwoners bijvoorbeeld Parijs heeft, kan men het beste
het volgende intypen: quot;Parijs heeft * inwonersquot;. De zoekmachine ziet het sterretje
als een joker, dus op die plaats kan van alles staan. Maar als iemand op zijn
website de volzin quot;Parijs heeft lelijke inwonersquot; heeft staan, zal Google die pagina
dus ook laten zien. Het kan ook in samenstellingen, bijvoorbeeld: quot;de snelheid van
het licht is * per * quot;; men vindt dan de snelheid van het licht in meters per seconde
maar ook in kilometers per uur.
• Het is ook mogelijk met de zoekmachine binnen een site te zoeken: je weet dat de
info die je zoekt op de betreffende site staat, maar niet wáár. Het kan dan slim zijn
om met Google binnen die site te zoeken. Het gaat als volgt: 'site:' gevolgd door de
naam van die website (overigens werkt dit het best zonder de toevoeging 'www').
Als men bijvoorbeeld een nieuwsbericht van De Telegraaf over prinses Maxima
zoekt, typ dan: maxima site:telegraaf.nl
9. Tips
• Google heeft ook een ingebouwde rekenmachine. Indien als zoekterm een
rekensom (bvb 5 * sqrt(9)) wordt gegeven, komt bovenaan de zoekresultaten het
antwoord te staan.
• Google kan ook als valuta calculator gebruikt worden. Als men bijvoorbeeld een
vakantie in de VS plant, omdat daar de dollar laag staat, zou men misschien willen
weten hoe laag die dan wel precies staat. Men zou dan kunnen typen: 1 dollar in
euro. Het antwoord komt meteen. Handig is ook om afkortingen van valuta te
maken en gebruiken. Als men in het invoervenster van Google invoert: quot;ISO 4217quot;
krijgt men een lijst met de afkortingen van verschillende valutamunten.
• Evenzeer kan men de zoekmachine als een spoorboekje raadplegen. Als men
'Rotterdam Delft' invoert, vindt men meteen bij het begin de eerstvolgende trein
van Rotterdam naar Delft. Men kan dit gegeven uitbreiden met door in de
zoekopdracht een tijd toe te voegen, en het woord 'vertrek' of 'aankomst' Als men
bijvoorbeeld wil weten welke trein men moet nemen op Rotterdam Centraal om
rond 15:00 uur in Delft te zijn, typt men dus: (zonder aanhalingstekens):
Rotterdam Delft aankomst 15:00.