Frequencies of Old Literary Finnish Words
View resource name in all available languages
Vanhan kirjasuomen sanojen taajuuksia
Persistent Identifier of this resource:
http://urn.fi/urn:nbn:fi:lb-20140730166
Access location:
List of frequencies of old literary Finnish words and information about their frequency. The words included are from the Institute for the Languages of Finland's old literary Finnish text corpus.
License EUPL (http://ec.europa.eu/idabc/en/document/7774.html).
Access location: http://kaino.kotus.fi/sanat/taajuuslista/vks.php.
log
26.11.2018 link http://islrn.org/resources/007-015-531-821-1 removed
View resource description in all available languagesSivu sisältää vanhan kirjassuomen kielen sanojen taajuuslistan. Taajuuslistaan sisältyvät Kotuksen vanhan kirjasuomen tekstikorpuksessa esiintyvät sananmuodot taajuustietoineen.
Teksti on käsitelty ennen sananmuotojen laskemista siten, että isot kirjaimet on muutettu pieniksi ja tekstistä on poistettu kaikki ne merkkijonot, jotka eivät sisällä yhtäkään numeroa tai kirjainta, mm. välimerkit. Lista on järjestetty siten, että yleisin sananmuoto on listassa ensimmäisenä. Näin määriteltynä korpuksessa on sanoja 3 425 382 kappaletta
Taajuuslistassa jokaiseen sananmuotoon liittyy sen taajuudenmukainen järjestysluku, sen esiintymien lukumäärä aineistossa ja sananmuodon esiintymien suhteellinen osuus prosentteina aineiston kaikista saneista.
Lisenssi EUPL (http://ec.europa.eu/idabc/en/document/7774.html).
log
26.11.2018 linkki http://islrn.org/resources/007-015-531-821-1 poistettu
License EUPL (http://ec.europa.eu/idabc/en/document/7774.html).
Access location: http://kaino.kotus.fi/sanat/taajuuslista/vks.php.
log
26.11.2018 link http://islrn.org/resources/007-015-531-821-1 removed
Sivu sisältää vanhan kirjassuomen kielen sanojen taajuuslistan. Taajuuslistaan sisältyvät Kotuksen vanhan kirjasuomen tekstikorpuksessa esiintyvät sananmuodot taajuustietoineen.
Teksti on käsitelty ennen sananmuotojen laskemista siten, että isot kirjaimet on muutettu pieniksi ja tekstistä on poistettu kaikki ne merkkijonot, jotka eivät sisällä yhtäkään numeroa tai kirjainta, mm. välimerkit. Lista on järjestetty siten, että yleisin sananmuoto on listassa ensimmäisenä. Näin määriteltynä korpuksessa on sanoja 3 425 382 kappaletta
Taajuuslistassa jokaiseen sananmuotoon liittyy sen taajuudenmukainen järjestysluku, sen esiintymien lukumäärä aineistossa ja sananmuodon esiintymien suhteellinen osuus prosentteina aineiston kaikista saneista.
Lisenssi EUPL (http://ec.europa.eu/idabc/en/document/7774.html).
log
26.11.2018 linkki http://islrn.org/resources/007-015-531-821-1 poistettu
People who looked at this resource also viewed the following: