Corpus of landscapes in medieval documents from Turku, source

View resource name in all available languages

Turun keskiaikaisten asiakirjojen maamerkkien korpus, lähdemateriaali

medievalturku

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-2023032021

This resource will be made available in Kielipankki – the Language Bank of Finland.

This is a text corpus for the study of the linguistic landscapes of Turku. The material is mostly based on the so-called Black Book of the Turku Cathedral, but also on other contemporary documents concerning the ownership of real estate or the urban space of Turku. Most of the material has been collected from the Diplomatarium Fennicum database in 2022. The original texts were written in the time period from the 13th to the 15th centuries mainly in Medieval Swedish, about 5% in Latin. Finnish and (Middle) German are also included in the form of different proper names.

The texts have been converted to be as machine-readable as possible using TEI/XML annotation. In addition to landmarks and socio-economic and other background variables, the text documents were annotated with headings, summaries and other descriptive information, including language.

The corpus includes about 20 000 words in Medieval Swedish and a few thousand words in Latin. There are 86 documents in total.

The material is related to the forthcoming compilation Kupari Hanna-Mari & Lamberg Marko: Language in the landscape and landscapes in linguistics (working title of a publication in Finnish). The book is expected to be published in autumn 2023.

View resource description in all available languages

Tämä aineisto on tulossa Kielipankkiin.

Turun kielimaisemia käsittelevän tutkimuksen tekstikorpus. Aineisto perustuu enimmäkseen Turun tuomiokirkon nk. Mustaan kirjaan mutta myös muihin kiinteistöjen omistamista tai Turun kaupunkitilaa koskeviin aikalaisasiakirjoihin. Suurin osa aineistosta on kerätty Diplomatarium Fennicum -tietokannasta vuonna 2022. Alkuperäiset tekstit on kirjoitettu 1300- ja 1400-luvuilla pääosin ruotsiksi, noin 5 % latinaksi. Mukana on erisnimien muodossa myös suomea ja (keskiala)saksaa.

Tekstit on muunnettu mahdollisimman koneluettaviksi käyttäen TEI/XML-merkintätapaa. Maamerkkien ja sosioekonomisten yms. taustamuuttujien lisäksi tekstidokumentteihin on merkitty esimerkiksi otsikot, regestat ja muuta kuvailutietoa.

Keskiajan ruotsia on mukana n. 20 000 sanaa ja latinaa muutama tuhat sanaa. Dokumentteja on yhteensä 86 kappaletta.

Aineisto liittyy teokseen Kupari, Hanna-Mari & Lamberg, Marko (tulossa): Kieli maisemassa ja maisema kielessä. Kirjan arvioitu ilmestymisajankohta on syksy 2023.

You don’t have the permission to edit this resource.