|
|
"Northern Light 16%,
Altavista 15,5%, Yahoo 7,4%, Lycos 2,5%..." |
| Hakea saatat löytää et ehkä niinkään |
|
Hakukoneet tuskin pysyvät Webin vauhdissa. Tähän
johtopäätelmään ovat tulleet NEC Research Instituten tutkijat, jotka
kuluttivat kuusi kuukautta selvittääkseen, paljonko www-sivuja ylipäätään on ja
missä määrin hakukoneet pystyvät niitä massasta poimimaan. |
| Peitto 16 % tai alle |
"Hakukoneet jäävät enenevästi jälkeen kyvyssään
indeksoida Webiä", kirjoittavat Steve Lawrence ja C. Lee Giles.
Yhdestätoista tutkitusta koneesta Northern Light saavutti 16 %:n peiton, muut
kehnomman. Lycos ja Euroseek jäivät reiluun 2 %:iin. Hotbot
oli pari vuotta sitten vastaavan tutkimuksen ykkönen 34 %:lla. Nyt se kokosi 11,3 %. |
|
Tutkimuksensa alussa Lawrence ja Giles arvioivat, että
Webissä on tällä hetkellä 2,8 miljoonaa sivustoa, jotka koostuvat 800 miljoonasta
sivusta. He myös tutkivat sisältöä, josta jollain tavalla kaupallista olisi nyt 83 %, kasvattavaa tai tieteellistä 6 %. Surffarit hämmästetään
väittämällä, että seittien linnasta olisi pornoa vain 1,5 %. |
| Suosi vanhaa tuttua |
Huonon peiton ohella hakua vinouttaa koneiden taipumus
painottaa hyvin tunnettua tietoa. Tutkijat toteavat, että muutamat hakukoneet
käyttävät myös sivun suosiota indeksoinnin perusteena. Ne eivät pysy ajan tasalla:
uusimmat löydetyt sivut saattoivat olla 8 kk vanhoja. |
|
Jokaista tutkittua konetta pommitettiin 1050 kysymyksella.
Ne olivat sanoja tai fraaseja, kuten "smart matter", "rocchio
algorithm", joita tutkijat saivat työtovereiltaan. "He eivät ole Webin
keskivertokäyttäjiä", tri Lawrence tunnustaa, "mutta asian ydin onkin siinä,
että hakukoneet vinoutuvat yhä enemmän kohti yleisesti tunnettua tietoa." |
| Käytä monihakua |
Keinoksi niille, jotka etsivät parempaa hakutulosta, tri
Lawrencen tarjoaa "metasearch"-palveluja. Ne keräävät vastauksia useilta
koneilta, esim. tutkituilta. Kansainvälisiä monihakuja ovat esim. SavvySearch, Mamma ja MetaCrawler.
Niitä on koottu VelhoNetiin, joka tarjoaa myös oman ratkaisunsa: yksi pyyntö avaa 1–12 tulosikkunaa. |
| 11 hakukoneen peittoprosentit |
16,0
15,5
11,3
8,5
8,0
7,8
7,4
5,6
2,5
2,2 |
Northern Light
Snap ja AltaVista
Hotbot
Microsoft
Infoseek
Google
Yahoo!
Excite
Lycos
Euroseek |
| Uusinta tietoa |
Search Engine Watch rankkasi kesäkuussa 2000 hakukoneet järjestykseen: Google, WebTop, Inktomi, AltaVista, Fast, Northern Light, Excite ja Go. Voittaja indeksoi yli miljardi dokumenttia, kaksi seuraavaa pääsivät puoleen. Northern Light jäi nyt alle 300 miljoonan dokumentin. Heinäkuussa nk. syvähakuun perehtynyt Brightplanet esitti arvion, jonka mukaan World Wide Webissä on 550 miljardia sivua... |
|