Verden ifølge Google

Når du foretar et søk på internett, velger søkemotoren sider og serverer dem i prioritert rekkefølge. Den populære søkemotoren Google er basert på matematiske kriterier. Hvordan blir da verden seende ut ifølge Google?

oktober 2003

Internett, med sine tre milliarder sider, blir ofte beskrevet som historiens mest komplette leksikon. En dokumentasjonssamling uten sidestykke som elskverdig stilles til vår disposisjon, og et verktøy som i løpet av sekunder kan svare på alle våre spørsmål. Søkemotorene er så effektive at vi trenger bare å taste inn noen spredte stikkord, og de finner fram til informasjon når vår egen hukommelse svikter.

Paradoksalt nok finnes det færre og færre av disse verktøyene. Bare fire amerikanske selskaper er fortsatt i stand til å tilby en kvalitetstjeneste til publikum verden over. Før man kan vise internettbrukeren vei i en stadig større mengde data, er man faktisk nødt til disponere tusenvis av datamaskiner som kan søke igjennom nettet og indeksere den tilgjengelige informasjonen. Men framfor alt må man vite hvordan man skal trekke ut de mest relevante sidene. Det er denne evnen, søkemotorens «intelligens», som avgjør om man lykkes eller ikke. Google, som i løpet av tre år har blitt den mest brukte søkemotoren i verden, er et bevis på dette. En nyskapende fremgangsmåte gjør at Google som regel kan presentere den ønskede informasjonen fra og med den første siden med søkeresultater.

Jungeltelegrafen gjorde en effektiv jobb, innvidde Google-brukere oppfordret sine venner til å bruke denne «geniale» søkemotoren. Google gikk fra 10 000 søk per dag i begynnelsen av 1999 til mer enn 200 millioner våren 2003. Det betyr at 53 prosent av søkene på verdensbasis gjøres gjennom Google, og for mange av de 70 millioner brukerne er internett fullstendig sammenfallende med dette usedvanlige verktøyet. Ifølge journalisten François Pisani er «Google umerkelig blitt et instrument som langt overskrider den oppfatningen man vanligvis har av en søkemotor. Jeg benytter ikke bare søkemotoren for å få tilgang til sider som inneholder informasjon. Resultatene som kommer opp som svar på et søkeord er tilstrekkelige i seg selv, og sidene de henviser til fungerer ikke lenger som instrument for bekreftelse.»1



Googles herredømme reiser imidlertid flere spørsmål. Hvordan kan en algoritme, hvor «genial» den enn er, velge ut de ti «mest relevante» referansene til søkeordet «Irak», blant de tre millioner sidene som inneholder dette ordet?

Som alle søkemotorer lider også Google under en viktig begrensning, den kan bare tilby informasjon som er tilgjengelig for det store publikum. Hvis ingen har funnet det for godt å publisere en artikkel om den «skjeggete lammegribbens levesett», vil man lete forgjeves etter treff på dette temaet. Når man bruker internett, søker man ikke gjennom all tilgjengelig kunnskap, men den kunnskapen ulike bidragsytere – universiteter, institusjoner, medier, privatpersoner – har valgt å gjøre fritt tilgjengelig på nettet. Kvaliteten på hva som blir lagt ut spiller derfor en avgjørende rolle for hvor relevante treffene som kommer opp er.

Selv om antallet tilgjengelige sider stadig øker, har imidlertid enkelte institusjonelle kilder valgt å bevisst senke kvaliteten på sine nettsider. Etter 11. september 2001, ble en rekke offisielle amerikanske nettsider rensket for «følsomme» opplysninger. Ett eksempel er nettsiden til den amerikanske hæren, hvor hvem som helst kunne lese en stolte presentasjon av hærens åtte depot for kjemiske våpen,2 men også en del sivil informasjon ble fjernet. Geographical Information Services har stengt tilgangen til deres kart over veinettet,3 mens staten Pennsylvania trakk tilbake oversikten over infrastrukturen for telekommunikasjon, skoler og sykehus.4 Med kampen mot terrorisme som påskudd, har enkelte selskaper tatt bort informasjon som miljøvernorganisasjoner har måttet slåss for å få tilgang til. Strømselskaper i California har for eksempel fjernet opplysninger knyttet til forurensende utslipp fra deres kraftverk.5



Sammenbruddet i «den nye økonomien» i 2001 bidro også til denne tilbaketrekningen. Stadig flere nettredaktører gir bare registrerte abonnenter tilgang til artiklene. Denne strategien, som har som mål å skaffe ekstra inntekter, har likevel en bakside: at man forsvinner fra nettet. Nettsider som krever abonnement (også om det er gratis) blir faktisk oversett av søkemotorene. Derfor, selv om New York Times forrige måned publiserte en bemerkelsesverdig undersøkelse omkring den skjeggete lammegribbens levesett, vil du ikke få opp denne artikkelen. Hovedvekten av artiklene som publiseres i pressen er på denne måten blitt så godt som usynlige på nettet.

Samtidig erobres nettet av nye aktører. Selskaper som ønsker å sikre seg synlighet gjennom å gi sin kommunikasjon en spesiell oppbakking, aktivistiske organisasjoner som oppdager en ny måte å spre sitt budskap på… Og internettbrukerne først og fremst, som stadig lager flere personlige nettsider: «Selvpubliseringen», som tidligere var forbeholdt de teknisk avanserte, er blitt demokratisert gjennom utviklingen av verktøy som er enklere å bruke.



På midten av 1990-tallet fikk denne strømmen av ekstra informasjon to informatikkstudenter ved det amerikanske Stanford-universitetet til å følge en intuisjon. Sergey Brin og Larry Page spurte seg om ikke en søkemotor som var basert på matematiske studier av forholdet mellom nettsidene, ville komme fram til mye bedre resultater enn de ufullstendige teknikkene som ble brukt på den tiden. De var overbevist om at de mest «relevante» sidene måtte være de som ble henvist til oftest (som andre sider hadde valgt å henvise til gjennom lenker), og bestemte seg for å gjøre dette til sitt studieprosjekt. De la grunnlaget for en mer «matematisk» søkemotor, og i september 1998 etablerte de sitt selskap, som fikk navnet Google.

For å vurdere nettsiders «relevans», oppfant Brin og Page «PageRank»-systemet, en vurderingsskala som er unik for Google. Verdien på en nettside blir hele tiden revurdert ut i fra hvor mange ganger den henvises til. Isolerte sider, som det ikke finnes noen lenker til, blir i dette systemet lite synlige, og har ingen «legitimitet». De nettsidene som refereres til ofte blir derimot referansesider i Googles øyne.

Men dette innebærer også en ulempe ved systemet: nye sider får et handikapp, og blir ikke synlige uten å tiltrekke seg oppmerksomhet fra allerede godt etablerte nettsider. «PageRank bygger på nettets fullstendig demokratiske karakter,» hevder grunnleggerne av Google, som likevel må innrømme at «stemmer fra viktige nettsider teller mer, og medvirker til å gjøre andre sider viktige.» Et underlig demokrati, hvor stemmene fra allerede innflytelsesrike aktører er viktigere enn stemmene til nykommere.



En anekdote fra Andrew Orlowskis The Register er interessant i forbindelse med dette.[6] 17. februar 2003 beskrev en artikkel i New York Times antikrigsbevegelsen som en «second superpower». «De enorme demonstrasjonene mot krigen over hele verden denne helgen, minner oss om at det uten tvil fortsatt finnes to supermakter på planeten: USA og verdensopinionen.» Denne formuleringen ble like etter gjentatt av FNs generalsekretær Kofi Annan. Et søk med stikkordene «second superpower» på Google i ukene som fulgte henviste også til denne originale definisjonen av supermaktene.

Dette bestemte en universitetsansatt ved Harvard, James F. Moore, seg for å gjøre noe med. 31. mars åpnet han sin hjemmeside med en artikkel som hadde tittelen «The Second Superpower Rears its Beautiful Head» (Den andre supermakten stikker fram sitt vakre hode). Det var en fullstendig ubetydelig artikkel, hvor uttrykket «second superpower» ble så ufarliggjort at til og med et medlem av det republikanske partiet ville blitt begeistret. Andre «tekno-utopister» lot seg inspirere av Moores tankegang, og ved hjelp av sine svært innflytelsesrike anmeldelser på nettet, sørget de for at hans obskure artikkel ble selve referansen på dette området. En måned senere, refererte faktisk 27 av de første 30 treffene Google fant fram til med søkeordet «second superpower», til denne aseptiske versjonen av uttrykket. James Moore, spesialist innen økonomisk strategi, teknologi og ledelse, visste hva han gjorde.



«Millioner av mennesker over hele verden måtte til for å tvinge The Gray Lady (New York Times, o.a.) til å beskrive antikrigsbevegelsen som den ’andre supermakten’. Men det var tilstrekkelig at en håndfull ’bloggere’8 henviste til den alternative betydningen for å gi den nok ’PageRank’ til å oversvømme Google med Moores alternative, nøytraliserte definisjon,» konstaterer Andrew Orlowski. «Dersom søkemotoren var den viktigste kilden til ditt syn på verden, ville du ha vanskelig for å se at uttrykket «second superpower» kunne ha en annen betydning. Den originale meningen er så godt som forsvunnet.”

For Andrew Orlowski viser denne anekdoten at «Google er ikke ’autentisk’, men ’syntetisk’». Et søk finner ikke fram til den viktigste referansen til et emne, men den betydningen som det refereres mest til. Dette fenomenet forsterkes av lovgivningen om opphavsrett, som forbyr nettpublisering av arbeider som den beskytter. Selv om et søk på Raoul Vaneigem ville fått fram noen av hans tekster (flere av bøkene hans er tilgjengelige på nettet), vil imidlertid de fleste forfattersøk få fram en oppfordring om å gå til anskaffelse av forfatterens verker og, i beste fall, en bokanmeldelse ført i pennen av en internettbruker. Man kan sammenligne denne situasjonen med et bibliotek som må slutte med gratis utlån av bøker, og ikke lenger kan tilby annet enn lesesammendrag redigert av bibliotekets medlemmer.



Dette fraværet av skriftlige referanser legger til rette for å innta posisjoner på denne ideologiske lekeplassen. Og merkelig nok er denne symbolske makten, denne muligheten til å gi sin versjon av et emne overtaket, en av de sjeldne formene for makt som fremdeles unnslipper de vanlige strukturene for maktfordeling. Den dominerende ideologien er ikke overrepresentert, snarere tvert i mot: et søk på navnet til en innenriksminister som er tilhenger av deportasjoner, vil lede deg til organisasjoner til forsvar for papirløse innvandrere. Søker man på Google etter en forretningsmann, kan søkemotoren overse hans presseskriv og heller bringe fram minnene om finansskandalene han har vært innblandet i. Det er slik at de forskjellige aktørenes innflytelse først og fremst avhenger av i hvor stor grad de har tilegnet seg nettet: det holder ikke bare å utvikle en nettside, man må også være i stand til å knytte bånd til andre sider og få status som «det som gjelder» på nettet.

Selv om mange som får sine skrifter spredt på denne måten bare har gode hensikter, er det andre som vet hvordan de skal utnytte svakhetene ved dette verktøyet. Noen byråer gjør det til sin spesialitet å utvikle sider på oppdrag fra forskjellige lobbyer, med informasjon som ved første øyekast ser ut som nyhetsmeldinger. Denne tilsynelatende objektiviteten kan lure internettbrukeren til å tro at det dreier seg om seriøs informasjon, og han kan bli fristet til å referere til den på sin egen nettside. Førstnevnte får da en symbolsk makt som den kan dra fordel av senere.



Noen ømfintlige temaer, som for eksempel genmodifiserte organismer eller konflikten mellom israelerne og palestinerne, er også gjenstand for en innbitt kamp hvor de ulike sidene slåss for å gjøre sine ideer legitime i Googles øyne. En ansvarlig for en referanseside på nettet – i alle fall ifølge Google – fikk en overraskende henvendelse fra en noe spesiell type salgsrepresentant: «Jeg er interessert i å kjøpe lenker på deres nettside for å kunne promotere nettsidene til våre klienter. Disse lenkene må ikke nødvendigvis være spesielt synlige på nettsiden deres, da vi ikke forventer å tjene på dette i form av direkte besøk på sidene. Deres nettside verdsettes av søkemotorene, og disse lenkene kan gjøre sidene mer synlige for søkemotorene.» Blant klientene sine nevnte salgsrepresentanten finanssider, reisebyråer og legemiddelfirmaer.

Det er uten tvil i forbindelse med disse politiske spørsmålene, som det finnes radikalt forskjellige meninger om på nettet, at Google virkelig viser sine begrensninger. De matematiske kriteriene kan faktisk gi fordeler til visse standpunkter og gi ufortjent oppmerksomhet til skrifter som bare uttrykker holdningene til noen få mennesker. Det grunnlaget og den overrepresentasjonen som «de først ankomne» nyter godt av på nettet, og mengden av lenker de har (spesielt i forbindelse med det i stor grad amerikanske weblog-fenomenet), avgjør matematisk hvem som til enhver tid utropes til «tankens mestere» hos Google. Når det gjelder tekniske og praktiske spørsmål, har søkemotoren helt klart bestått testen med glans. Men det finnes områder hvor relevansen går algoritmene hus forbi.




1 Francis Pisani, «Ma vie Google», Netsurf, www.netsurf.ch/archives/2001/01_10/011024nt.html
2 ?Security concerns prompt army to review Web sites, access», Defense Information and Electronics Report, 26. oktober 2001, www.fas.org/sgp/news/2001/10/dier102601.html
3 San Francisco Chronicle, 5. oktober 2001.
4 The News Media and The Law, tidsskriftet til Reporters Committee for Freedom of the Press, høsten 2002. www.rcfp.org/news/mag/v.cgi?26-4/foi-stateage
5 Jean-Pierre Cloutier, «Crise : sites Web censurés, modifiés, amendés», Les chroniques de Cybérie, 30. oktober 2001, cyberie.qc.ca/chronik/20011030.html
6 Andrew Orlowski, «Anti-war slogan coined, repurposed and Googlewashed<#133> in 42 days», The Register, 4. mars 2003. www.theregister.co.uk/content/6/30087.html.
7 James F. Moore, «The Second Superpower Rears its Beautiful Head», http://cyber.law.harvard.edu/people/jmoore/secondsuperpower.html
8 En «blogger» er en som skriver en såkalt weblogg, en nettdagbok hvor bloggeren skriver om de than eller hun kommer over på nettet. Postene er ofte daterte, og inneholder en eller flere lenker. Se Francis Pisani, «Weblogg-bølge på internett: Alternativt redskap for informasjon?», Nordiske Le Monde diplomatique, august 2003.

(…)

Bli abonnent og få tilgang til alle våre artikler, eller / logg inn med Vipps.

Tre måneder med Le Monde
diplomatique for 99 kroner!

Papiravis og full digital tilgang


Fornyes til 199,- per kvartal