Word Collections of Modern Finnish

View resource name in all available languages

Nykysuomen sanakokoelmat

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-20140730187

A corpus of over 5,5 million entries of Finnish words. Each entry contains the reference, its passage and information on the original context, often also the special field. The corpus has been collected mostly from literature of different fields, newspapers, magazines and fictional literature.

Entries from 1984 and later are in electronical form and its use in the intranet of the Institute for the Languages of Finland recquires permission. Paper versions can be used without restriction.

License EUPL (http://ec.europa.eu/idabc/en/document/7774.html).


log
26.11.2018 links http://islrn.org/resources/933-882-874-267-0 and http://www.kotus.fi/index.phtml?s=222 removed

View resource description in all available languages

Suomen yleiskielen sanoista tekstiyhteyksineen on yli 5,5 miljoonan sanalipun kokoelma. Sanalipussa on hakusanan lisäksi tekstikatkelma ja tieto siitä, mistä katkelma on poimittu, usein myös tieto erikoisalasta. Sana-aineisto on koottu ja sitä kootaan jatkuvasti lähinnä eri alojen kirjallisuudesta sekä sanoma- ja aikakauslehdistä ja myös kaunokirjallisuudesta.

Vanhin aineisto on vuosien 1880–1950 lähteistä kerätty 4,5 miljoonan sanalipun kokoelma (850 000 eri sanaa), joka koottiin Nykysuomen sanakirjan toimittamista varten. Vuoden 1950 ja sitä myöhemmistä lähteistä sanalippuja on noin 700 000. Vuoden 1984 ja sitä myöhemmät sanatiedot ovat myös sähköisessä muodossa. Arkistotietokantaa voi käyttää Kotuksen intranetissä, mutta käyttö vaatii luvan. Paperimuotoinen nykysuomen arkisto on vapaasti käytettävissä.

Mikrokortteina on tekstiotoksia eri lehdistä ja kirjallisuudesta pääasiassa 1970-luvulta noin 1 400 000 sanaa sekä Lauseopin arkiston yleiskielen aineisto.

Lönnrotin juhlavuoden Sanaseppo-kilpailun vastaukset on arkistoitu Suomen murteiden sana-arkistoon.

Aineistojen pohjalta toimitetaan nykykielen sanakirjoja.

Lisenssi EUPL (http://ec.europa.eu/idabc/en/document/7774.html).


log
26.11.2018 linkit http://islrn.org/resources/933-882-874-267-0 ja http://www.kotus.fi/index.phtml?s=222 poistettu

You don’t have the permission to edit this resource.