Donate Speech: Annotated dataset

View resource name in all available languages

Lahjoita puhetta: Annotoitu aineisto

puhelahjat-annotated

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-2022060128

Access location:

This collection contains the manually transcribed recordings of the Donate Speech Corpus, version 1 that were available at the time of publishing the complete dataset.
The transcripts are included as plain text files and as annotation files with time alignments. The dataset also contains the metadata of the audio recordings.

The total duration of the audio recordings included in this transcribed and annotated dataset is approximately 1600 hours.

The dataset is available for download via Kielipankki – the Language Bank of Finland.

View resource description in all available languages

Tämä Lahjoita puhetta -aineiston osakokoelma sisältää kaikki ne Lahjoita puhetta -aineiston versioon 1.0 kuuluvat äänitteet, jotka oli koko aineiston julkaisuun mennessä ehditty litteroida käsin. Litteraatit ovat saatavilla sekä raakatekstitiedostoina että äänitteisiin kohdistettuina annotaatiotiedostoina. Aineistoon sisältyvät myös kyseisten äänitteiden kuvailutiedot.

Tähän osa-aineistoon kuuluvien litteroitujen ja kohdistettujen äänitteiden kokonaiskesto on noin 1600 tuntia.

Aineisto on saatavilla Kielipankin latauspalvelussa.

You don’t have the permission to edit this resource.