Nå er dette spørsmålet kan lett besvares på 5000 ord. Bøker har blitt skrevet om dette temaet. Men poenget er som ønsker å vite i dyp? Alt som teller er noen interessante fakta å imponere dine venner. Det er en vakker flash som beskriver google arbeidsprosessen. [For å se klikk her] Blitsen gir en oppsummering av hele boka i 2 minutter audiovisuelt entity.Really interessant å se. Hvis du ikke er interessert i å lære hvordan Google skaper indeksen og databasen av dokumenter som det åpner ved behandling av en spørring, hoppe over denne beskrivelsen.
Google kjører på et distribuert nettverk av tusenvis av lavkost datamaskiner og kan derfor utføre rask parallellprosessering. Parallell behandling er en metode for beregning der mange beregninger kan utføres samtidig, i betydelig grad påskynde databehandling. Google har tre ulike deler: 1. Googlebot, en web crawler som finner og henter nettsider. 2. Indekser som sorterer hvert ord på hver side, og lagrer den resulterende indeks over ord i en stor database. 3. spørring prosessor, som sammenligner søket til indeksen og anbefaler de dokumentene som den anser mest relevant.
La oss ta en nærmere titt på hver del. 1. Googlebot, Googles Web Crawler Googlebot er Googles web krypende robot, som finner og henter sider på internett og rekker dem til Googles indekserings. Det er lett å forestille seg Googlebot som en liten edderkopp scurrying over trådene i cyberspace, men i virkeligheten Googlebot ikke traversere nettet i det hele tatt. Det fungerer omtrent som nettleseren, ved å sende en forespørsel til en web-server for en nettside, laste ned hele siden, og deretter overlate den til Googles indekserings.
Googlebot består av mange datamaskiner som ber om og henter sider mye raskere enn du kan med din nettleser. Faktisk kan Googlebot be om tusenvis av forskjellige sider samtidig. For å unngå overveldende webservere, eller trenge ut forespørsler fra menneskelige brukere, Googlebot bevisst gjør forespørsler til hver enkelt web server saktere enn det er i stand til å gjøre. Googlebot finner sider på to måter: gjennom et tillegg URL form, www.google.com/addurl.html, og gjennom å finne forbindelser med kryp nettet.
Dessverre, spammere funnet ut hvordan å lage automatiserte roboter som bombardert tillegget URL skjema med millioner av nettadresser som peker til kommersiell propaganda. Google avviser disse webadressene som sendes inn via sin Add URL form som den mistenkte prøver å lure brukere ved å bruke taktikker som blant