Sanakirjatietomallin toteutus XML-muodossa
Voutilainen, Simo (2021)
Voutilainen, Simo
2021
Tietojenkäsittelyopin maisteriohjelma - Master's Programme in Computer Science
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2021-04-28
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202104284027
https://urn.fi/URN:NBN:fi:tuni-202104284027
Tiivistelmä
Piirrerakenne on yksinkertainen tiedonkuvausmenetelmä, jolla on mahdollista esittää hierarkkisia rakenteita. XML on merkintäkieli, jota käytetään laajasti monenlaisten dokumenttien tuottamiseen. Tässä tutkielmassa pohditaan XML-kielen soveltuvuutta piirrerakenteiden esittämiseen.
Tutkielmassa esitellään FSXML-säännöt, joilla mikä tahansa piirrerakenne voidaan muuntaa XML-muotoon riippumatta piirrerakenteen syvyydestä tai laajuudesta. FSXML-sääntöjä sovelletaan piirrerakenteeseen, joka on tarkoitettu sanakirjan sisällön kuvaamiseen. Tuloksena syntyvän DTD-tiedoston eli dokumenttityypin määrittelyn käyttökelpoisuutta testataan todellisella sanakirjalla. Sanakirjan sisältö muunnetaan DTD:n mukaiseen muotoon sekä siitä edelleen HTML-muotoon. Muunnokset tehdään XSL-kielisillä muunnossäännöillä, joiden toimintaa kuvataan esimerkkien avulla rivi riviltä.
Sanakirjasisällön kuvaamiseen on olemassa useita XML-standardeja ja muita XML-pohjaisia ratkaisuja. Tutkielmassa esitellään niistä muutama ja verrataan niitä tutkielmassa kehitettyyn dokumenttityyppiin. Vertailussa todetaan dokumenttityypin samankaltaisuus TEI-standardin sanakirjaosuuden kanssa, mikä viittaa FSXML-sääntöjen käyttökelpoisuuteen.
Tutkielmassa esitellään FSXML-säännöt, joilla mikä tahansa piirrerakenne voidaan muuntaa XML-muotoon riippumatta piirrerakenteen syvyydestä tai laajuudesta. FSXML-sääntöjä sovelletaan piirrerakenteeseen, joka on tarkoitettu sanakirjan sisällön kuvaamiseen. Tuloksena syntyvän DTD-tiedoston eli dokumenttityypin määrittelyn käyttökelpoisuutta testataan todellisella sanakirjalla. Sanakirjan sisältö muunnetaan DTD:n mukaiseen muotoon sekä siitä edelleen HTML-muotoon. Muunnokset tehdään XSL-kielisillä muunnossäännöillä, joiden toimintaa kuvataan esimerkkien avulla rivi riviltä.
Sanakirjasisällön kuvaamiseen on olemassa useita XML-standardeja ja muita XML-pohjaisia ratkaisuja. Tutkielmassa esitellään niistä muutama ja verrataan niitä tutkielmassa kehitettyyn dokumenttityyppiin. Vertailussa todetaan dokumenttityypin samankaltaisuus TEI-standardin sanakirjaosuuden kanssa, mikä viittaa FSXML-sääntöjen käyttökelpoisuuteen.