The Longitudinal Corpus of Finnish Spoken in Helsinki (2010s Text Corpus)

View resource name in all available languages

Helsingin puhekielen pitkittäiskorpus (2010-luvun tekstimuotoinen aineisto)


Persistent Identifier of this resource:

This corpus is a subset of The Longitudinal Corpus of Finnish Spoken in Helsinki, which contains interviews with people of different ages born in Helsinki. The Longitudinal Corpus of Finnish Spoken in Helsinki (2010s text corpus) contains the anonymized transcripts of the 2010s interviews.

The 2010s material is based on about one hour long audio recordings of individual interviews. Most of the interview questions are about how the interviewees perceive Helsinki, living and traveling in the city, as well as the languages and language forms spoken in Helsinki. The interviews also touch upon such topics as school, work and hobbies related issues of the interviewees.
A part of the corpus has been transcribed and thematically coded. The Longitudinal Corpus of Finnish Spoken in Helsinki (2010s text corpus) contains also parts in which the audio material and the transcript are aligned.
Work on the transcription, alignment and thematic coding of the corpus is planned to continue in the future.

The corpus should be referred to in the following way:

The Longitudinal Corpus of Finnish Spoken in Helsinki (2010s text corpus), informant’s code (if applicable).

The informant’s code should be marked if concrete text examples of the corpus are given.

The corpus will be published in Korp (

This corpus can be used for educational and research purposes. For detailed information on the license of the resource see
However, in order to use the audio files, a personal permission is required, see The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s, 2010s).

25.11.2018 link removed

View resource description in all available languages

Tämä korpus sisältää Helsingin puhekielen pitkittäiskorpuksen 2010-luvun anonymisoidun tekstimuotoisen osa-aineiston, jota voidaan käyttää koulutus-, tutkimus- ja opetustarkoituksiin.

Alkuperäinen Helsingin puhekielen pitkittäiskorpus sisältää eri-ikäisten syntyperäisten helsinkiläisten haastatteluja. 2010-luvun aineisto koostuu noin tunnin mittaisista äänitallennetuista yksilöhaastatteluista. Niissä on kyselty etenkin haastateltavien suhteesta Helsinkiin, siellä asumisesta ja liikkumisesta sekä Helsingissä puhuttavista kielistä ja kielimuodoista. Muita teemoja ovat olleet mm. haasteltavien koulunkäynti, työ ja harrastukset.

Osa aineistosta on litteroitu ja teemakoodattu; osassa ääni ja litteraatti on kohdennettu toisiinsa.
Aineiston litterointia, kohdennusta ja temaattista koodausta pyritään jatkamaan.

Aineistoon viitataan seuraavasti:
Helsingin puhekielen pitkittäiskorpus, 2010-luvun tekstiaineisto, (tarvittaessa) informantin koodi
Informantin koodi olisi syytä merkitä silloin, jos esittää aineistosta konkreettisia tekstiesimerkkejä.

Korpus julkaistaan Korp-palvelussa,

Tätä tekstimuotoista korpusta voidaan käyttää koulutus-, tutkimus- ja opetustarkoituksiin.

Huom. Ääniaineiston käyttäminen edellyttää henkilökohtaista käyttölupaa, ks. Helsingin puhekielen pitkittäiskorpus (1970, 1990, 2010).

25.11.2018 linkki poistettu

You don’t have the permission to edit this resource.