Sisältöpohjainen kuvatiedonhaku ja kuvahaun keinot
KAAKINEN, ANTTI (2008)
KAAKINEN, ANTTI
2008
Vuorovaikutteinen teknologia - Interactive Technology
Informaatiotieteiden tiedekunta - Faculty of Information Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2008-04-02
Julkaisun pysyvä osoite on
https://urn.fi/urn:nbn:fi:uta-1-17856
https://urn.fi/urn:nbn:fi:uta-1-17856
Tiivistelmä
Kuvien hakeminen Internetissä on haastavaa. Perinteinen HTML-sivu ei anna juuri mitään mahdollisuuksia sisällönkuvailuun, joten hakeminen on suoritettava sivulla olevien tekstien perusteella. Tietokannoissa voidaan käyttää erilaisia metadataan perustuvia hakukeinoja: joko strukturoitua metadataa, jolla on tietty säännöstö, tai vapaasti valittavissa olevia tageja.
Metadatapohjaisten lähestymistapojen lisäksi on myös kehittynyt sisältöpohjaisia hakutapoja. Niissä kuvaa haetaan kuvalla, joko hahmottelemalla se hakulomakkeessa tai antamalla hakua varten malliksi toinen kuva. Tällä tavoin voidaan hakea kuvia, joita ei välttämättä osata kuvailla sanallisin keinoin.
Kuvatiedonhaun suurin ongelma muodostuu semanttisesta kuilusta, joka tarkoittaa sitä, että yleensä ei ole mahdollista kuvailla kuvaa riittävän tarkasti, jotta sen kaikki näkökulmat välittyisivät. Kuilua lisää myös se, että tietokoneen kannalta kuvassa oleelliset asiat, värit ja muodot, eivät ole ihmisen kannalta yleensä yhtä tärkeitä kuin koneellisessa tunnistamisessa. Niitä käytetään tarkentamaan hakua silloin, kun muita tarkentavia hakusanoja ei kyetä keksimään.
Käyttäjien kuvanhakutavat ovat tärkeitä suunniteltaessa uusia kuvanhakukeinoja. Tätä tutkielmaa varten tehtiin kaksi testiä, joista ensimmäisessä kartoitettiin käyttäjien kuvanhakutapoja Internetissä. Toisessa tarkasteltiin hakutapoja suljetussa tietokannassa.
Käyttäjät hakevat kuvia Internetistä hyvin perinteisin keinoin. He käyttävät objektin nimeä ja tarkentavat hakua mahdollisesti objektin ominaisuudella.
Tietokannassa, jossa sisältö on kuvailtu metadatalla, käyttäjät hakevat mieluummin käyttäen metadataa kuin sisältöpohjaisia hakukeinoja. Hahmotelmia ja värijakaumaa käytetään, kun käyttäjä ei kykene keksimään minkälaista metadataa hakuunsa käyttäisi. Lisäksi hahmotelmahaulla ei vielä testeissä kyetty löytämään oikeanlaisia kuvia, joten metadatapohjaisilla hakuliittymillä on edelleen käyttöä pääasiallisena kuvahakukeinona.
Avainsanat ja -sanonnat: sisältöpohjainen kuvatiedonhaku, semanttinen kuilu, valokuvat, kuvanhakukeinot, metadata
Metadatapohjaisten lähestymistapojen lisäksi on myös kehittynyt sisältöpohjaisia hakutapoja. Niissä kuvaa haetaan kuvalla, joko hahmottelemalla se hakulomakkeessa tai antamalla hakua varten malliksi toinen kuva. Tällä tavoin voidaan hakea kuvia, joita ei välttämättä osata kuvailla sanallisin keinoin.
Kuvatiedonhaun suurin ongelma muodostuu semanttisesta kuilusta, joka tarkoittaa sitä, että yleensä ei ole mahdollista kuvailla kuvaa riittävän tarkasti, jotta sen kaikki näkökulmat välittyisivät. Kuilua lisää myös se, että tietokoneen kannalta kuvassa oleelliset asiat, värit ja muodot, eivät ole ihmisen kannalta yleensä yhtä tärkeitä kuin koneellisessa tunnistamisessa. Niitä käytetään tarkentamaan hakua silloin, kun muita tarkentavia hakusanoja ei kyetä keksimään.
Käyttäjien kuvanhakutavat ovat tärkeitä suunniteltaessa uusia kuvanhakukeinoja. Tätä tutkielmaa varten tehtiin kaksi testiä, joista ensimmäisessä kartoitettiin käyttäjien kuvanhakutapoja Internetissä. Toisessa tarkasteltiin hakutapoja suljetussa tietokannassa.
Käyttäjät hakevat kuvia Internetistä hyvin perinteisin keinoin. He käyttävät objektin nimeä ja tarkentavat hakua mahdollisesti objektin ominaisuudella.
Tietokannassa, jossa sisältö on kuvailtu metadatalla, käyttäjät hakevat mieluummin käyttäen metadataa kuin sisältöpohjaisia hakukeinoja. Hahmotelmia ja värijakaumaa käytetään, kun käyttäjä ei kykene keksimään minkälaista metadataa hakuunsa käyttäisi. Lisäksi hahmotelmahaulla ei vielä testeissä kyetty löytämään oikeanlaisia kuvia, joten metadatapohjaisilla hakuliittymillä on edelleen käyttöä pääasiallisena kuvahakukeinona.
Avainsanat ja -sanonnat: sisältöpohjainen kuvatiedonhaku, semanttinen kuilu, valokuvat, kuvanhakukeinot, metadata