A cellular automaton environment for the complex system of speech
Juuso, Ilkka (2019-12-09)
https://urn.fi/URN:ISBN:9789526224046
Kuvaus
Tiivistelmä
Abstract
Linguistic data collections, such as representative language and dialect corpora collected over several decades, have in the past 15 years become the focus of extensive digitization efforts. The Linguistic Atlas Project (LAP), containing meticulously curated American language survey data from the past 90 years, is a prime example of such a corpus. The scholarly use of such bodies has traditionally relied heavily on the linguist researcher’s intuition in observing patterns and producing maps of the data to answer questions on language use across time and space. Some solutions have been offered by statistical methods and Geographic Information Systems (GIS), but the high learning curves involved in these techniques have limited their appeal in dialectology. At the same time, the spatially and temporally scattered nature of language datasets, and the lack of longitudinal data in particular, has hindered the modeling of language change in dialectology.
This thesis aims to provide solutions for both visualizing spatial variation in language and modeling its temporal change. The framework adopted for this work is the theory of the complex system of speech, and the method of implementation that of the Cellular Automaton (CA). A further distinguishing feature of the work is that it uses the extensive data holdings of the Linguistic Atlas Project as a source of real-world language data to base its simulations on. The results obtained through the work are validated in respect to previous linguistic theory, and the complex systems of speech in particular.
The results of the work include the construction of a versatile simulation environment for language, and its successful application to a) the development of a linguistically feasible simulation of language change, and b) the development of an objective, straightforward process for region estimation of linguistic features.
Tiivistelmä
Lingvistiset kokoelmat kuten vuosikymmenten yli kerätyt kieli- ja murrekorpukset ovat viimeisen 15 vuoden aikana päätyneet mittavien digitointitoimien kohteeksi. Malliesimerkki tällaisesta korpuksesta on The Linguistic Atlas Project (LAP), jonka aineisto pohjautuu viimeisen 90 vuoden aikana kerättyyn ja huolella kuratoituun Yhdysvaltojen kielikartoitukseen. Tämänkaltaisten aineistojen tutkimuskäyttö on perinteisesti nojannut lingvistitutkijan intuitioon, jonka avulla kielen ajallisen ja alueellisen käytön rakenteet on voitu muuntaa tiettyihin kysymyksiin vastaaviksi kartoiksi. Tilastolliset menetelmät ja paikkatietojärjestelmät ovat tarjonneet työhön ratkaisuja, mutta näiden huomattava oppimiskynnys on rajoittanut menetelmien houkuttelevuutta murretutkimuksen parissa. Samaan aikaan kieliaineistojen ajallinen ja alueellinen hajaantuneisuus, sekä erityisesti aikasarjojen puutteellisuus, ovat haitanneet kielen muutoksen mallintamista murretutkimuksessa.
Tämän väitöskirjan tavoitteena on tarjota ratkaisuja sekä kielen alueellisen variaation visualisointiin että kielen ajallisen muutoksen mallintamiseen. Työn teoreettinen tausta pohjautuu kielen kompleksisen järjestelmän käsitteeseen ja toteutus solukoneeseen (CA, Cellular Automaton). Lisäksi työn luonnetta määrittelee sen pureutuminen mittavan LAP-aineiston tarjoamaan todelliseen dataan, jota työ käyttää kaikkien simulaatioiden taustalla. Työn tuloksia tarkastellaan aiemman lingvistisen tiedon sekä erityisesti kielen kompleksisen järjestelmän käsitteeseen kautta.
Työn tuloksena on kielen monipuolinen simulointiympäristö, jota sovelletaan a) lingvistisen teorian valossa uskottavaan kielen muutoksen mallinnukseen ja b) kielen ominaisuuksien alueellisuuden tutkimukseen objektiivisen ja suoraviivaisen prosessin kautta.
Original papers
Original papers are not included in the electronic version of the dissertation.
Kretzschmar, W. A., Juuso, I., & Bailey, C.T. (2014). Computer simulation of dialect feature diffusion. Journal of Linguistic Geography, 2(1), 41–57. https://doi.org/10.1017/jlg.2014.2
Kretzschmar, W. A., & Juuso, I. (2014). Cellular automata for modeling language change. Lecture Notes in Computer Science, 8751, 339–348. https://doi.org/10.1007/978-3-319-11520-7_35
Kretzschmar, W. A., & Juuso, I. (2014). Simulation of the complex system of speech interaction: digital visualizations. Literary and Linguistic Computing, 29(3), 432-442. https://doi.org/10.1093/llc/fqu015
Juuso, I., & Kretzschmar, W. A. (2016). Creation of regions for dialect features using a cellular automaton. Journal of English Linguistics, 44(1), 1–30. https://doi.org/10.1177/0075424215620279
Juuso, I., & Kretzschmar, W. A. (2019). An ordinal cellular automaton for phonetic survey data. Manuscript in preparation.
Osajulkaisut
Osajulkaisut eivät sisälly väitöskirjan elektroniseen versioon.
Kretzschmar, W. A., Juuso, I., & Bailey, C.T. (2014). Computer simulation of dialect feature diffusion. Journal of Linguistic Geography, 2(1), 41–57. https://doi.org/10.1017/jlg.2014.2
Kretzschmar, W. A., & Juuso, I. (2014). Cellular automata for modeling language change. Lecture Notes in Computer Science, 8751, 339–348. https://doi.org/10.1007/978-3-319-11520-7_35
Kretzschmar, W. A., & Juuso, I. (2014). Simulation of the complex system of speech interaction: digital visualizations. Literary and Linguistic Computing, 29(3), 432-442. https://doi.org/10.1093/llc/fqu015
Juuso, I., & Kretzschmar, W. A. (2016). Creation of regions for dialect features using a cellular automaton. Journal of English Linguistics, 44(1), 1–30. https://doi.org/10.1177/0075424215620279
Juuso, I., & Kretzschmar, W. A. (2019). An ordinal cellular automaton for phonetic survey data. Manuscript in preparation.
Kokoelmat
- Avoin saatavuus [32041]