ARIMA-mallin sovittaminen aikasarjadatalle : case Lappeenrannan lentokentän ilmanlämpötila 1960–2020
Heikkinen, Matias (2021)
Kandidaatintutkielma
Heikkinen, Matias
2021
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2021092046676
https://urn.fi/URN:NBN:fi-fe2021092046676
Tiivistelmä
Tutkimuksen aiheena on tarkastella ARIMA-mallien toimintaa ja niiden matemaattista määrittelyä. Tutkimus keskittyy erityisesti ARIMA-mallien matemaattisen esitysmuodon tarvitsemien kerrointen määrittämiseen teoreettisesti, ja kuinka näitä voidaan tarkentaa kokeellisesti iteroiden. Työssä SARIMA-mallien yleinen yhtälö käydään läpi, selittäen mistä se koostuu, avaten myös viiveoperaattorin käyttöä. Lopulta dekomponointia hyödyntäen, ilmanlämpötila aikasarja datan stokastiseen sarjaan sovitetaan SARIMA(0,0,1)(0,0,1)₁₂-sovite havainnollistaen aikasarjamallin rakentamista käytännössä.
Tutkimuksen tuloksena esimerkki case-aineistoon Lappeenrannan ilmanlämpötilasta vuosina 1960-2020 onnistuttiin rakentamaan malli, jossa SARIMA(0,0,1)(0,0,1)₁₂-mallilla luotiin ennuste jäännöstermeille. SARIMA-mallille onnistuttiin laskemaan teoreettiset kertoimet, joita iteroimalla saatiin kertoimia tarkennettu pienintä neliösummaa minimoimalla parhaiksi mahdollisiksi. Työn tuloksena rakennettu malli ei välttämättä ollut paras vaihtoehto case-aineistona käytetyn aikasarjan mallintamiseen ja ennustamiseen, mutta mallin varsinainen rakennusprosessi tuki ARIMA-mallien toiminnan tarkastelua ja sen matemaattisen esitysmuodon kerrointen määrittämistä, joka oli itse tutkimuksen keskiössä. The research subject is to study the function of ARIMA-models and the mathematical definition. The research focuses in particular on the theoretical determination of the coefficients required for the mathematical representation of ARIMA-models, specifying them experimentally by iteration. In this work, the general equation of the SARIMA models is reviewed by explaining what it consists of, also opening up the use of backshift operator. Finally, utilizing decomposition method, SARIMA(0,0,1)(0,0,1)₁₂-model can be fitted to the stochastic series of air-temperature time series data to illustrate the construction of the time series model in practice.
As the results of the study, the case-material of Lappeenranta’s air temperature from 1960-2020 was used to build a model, in which the SARIMA(0,0,1)(0,0,1)₁₂-model was used to forecast residual terms. For the SARIMA-model, the theoretical coefficients were successfully calculated, and were iterated to optimum values by minimizing the least squares of the residual of model fit. As the result, the model itself may not have been the best for modeling and forecasting the time series used as case data, but the actual model building supported the review of ARIMA models and the determination of coefficients for the mathematical representation that was itself the key point of the study.
Tutkimuksen tuloksena esimerkki case-aineistoon Lappeenrannan ilmanlämpötilasta vuosina 1960-2020 onnistuttiin rakentamaan malli, jossa SARIMA(0,0,1)(0,0,1)₁₂-mallilla luotiin ennuste jäännöstermeille. SARIMA-mallille onnistuttiin laskemaan teoreettiset kertoimet, joita iteroimalla saatiin kertoimia tarkennettu pienintä neliösummaa minimoimalla parhaiksi mahdollisiksi. Työn tuloksena rakennettu malli ei välttämättä ollut paras vaihtoehto case-aineistona käytetyn aikasarjan mallintamiseen ja ennustamiseen, mutta mallin varsinainen rakennusprosessi tuki ARIMA-mallien toiminnan tarkastelua ja sen matemaattisen esitysmuodon kerrointen määrittämistä, joka oli itse tutkimuksen keskiössä.
As the results of the study, the case-material of Lappeenranta’s air temperature from 1960-2020 was used to build a model, in which the SARIMA(0,0,1)(0,0,1)₁₂-model was used to forecast residual terms. For the SARIMA-model, the theoretical coefficients were successfully calculated, and were iterated to optimum values by minimizing the least squares of the residual of model fit. As the result, the model itself may not have been the best for modeling and forecasting the time series used as case data, but the actual model building supported the review of ARIMA models and the determination of coefficients for the mathematical representation that was itself the key point of the study.