Hakukoneiden vertailu ja indeksointi www:ssä
Suojala, Tarja (2007)
Suojala, Tarja
Satakunnan ammattikorkeakoulu
2007
All rights reserved
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-200810243716
https://urn.fi/URN:NBN:fi:amk-200810243716
Tiivistelmä
Opinnäytetyö käsittelee Internetin hakukoneita ja niiden indeksointimenetelmiä. Tavoitteena oli selvittää, tukevatko tutkimukseen valitut viisi hakukonetta Boolen hakuja ja millä hakukoneella saadaan parhaat hakutulokset. Työn teoriaosassa kerrotaan, mistä osista hakukone koostuu sekä miten hakua voidaan muotoilla ja rajata relevanttien hakutulosten saamiseksi. Yleinen tapa muotoilla hakulauseketta on käyttää Boolen operaattoreita AND, OR ja NOT, joiden avulla hakutulosta on mahdollista laajentaa tai supistaa. Teoriataustassa syvennytään myös hakukoneiden suorittamaan indeksointiin eli www-sivujen lisäämiseen hakukoneisiin. Indeksoinnissa hakukoneen hakurobotti hakee www-sivuja ja tallentaa niistä tiettyjä tietoja tietokantaan. Www-sivun sisällön kuvailemiseen ja muun sivuun liittyvän tiedon ilmoittamiseen voidaan käyttää metadataa, joka piilotetaan sivun HTML-koodiin. Yksi metadataformaateista on Dublin Core, joka kehitettiin alun perin erityisesti www-sivujen metadatan kuvailemiseen. Www-sivujen sijoittumiseen hakukoneiden hakutuloksissa voidaan pyrkiä vaikuttamaan sivujen rakenteella, sisällöllä ja linkityksillä. Tästä käytetään nimitystä hakukoneoptimointi. Työn testausosassa on kaksi eri osiota. Ensimmäisessä osiossa on selvitetty kahdeksan hyvän hakukoneen kriteeriä ja arvioitu hakukoneita niiden perusteella. Jälkimmäisessä osiossa hakukoneita on testattu viidellä hakulauseella, jotka on muotoiltu niin, että kaikki Boolen operaattorit on saatu mukaan. Jokaisen hakukoneen antamista tulossivuista on tarkastettu 10 ensimmäistä, ja ne on pisteytetty asteikolla 1-3 siten, että mitä relevantimpi sivu on ollut käytettyjen hakusanojen kannalta, sitä enemmän se on saanut pisteitä. Lopuksi kunkin hakukoneen saamat pisteet on laskettu yhteen. Tulosten perusteella tutkimuksessa mukana olleista hakukoneista paras oli markkinajohtaja Google, jonka etumatka muihin koneisiin oli selvä. Toiselle sijalle selvisi AltaVista ja kolmannelle Yahoo!. Microsoftin syksyllä 2006 julkaisema Live Search sijoittui neljänneksi ja juuri tutkimuksen teon aikoihin uusiutunut Www.fi viidenneksi.