Predicting OMX Helsinki stock prices using social media sentiment of Finnish retail investors
Karttunen, Jani (2021)
Pro gradu -tutkielma
Karttunen, Jani
2021
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2021082444118
https://urn.fi/URN:NBN:fi-fe2021082444118
Tiivistelmä
Sentiment analysis uses machine learning to interpret moods from text. There have been studies to see whether sentiment analysis can be used to measure investor sentiment and forecast asset prices, but their results have been conflicting. This thesis aims to further study the relationship between investor sentiment and stock prices by studying the effect of Finnish investor sentiment towards OMX Helsinki stock prices. The study consists of classifying the sentiment social media posts about individual stocks using Naïve Bayes classifier to create stock-specific investor sentiment time series, which were then used as regressors in VAR models aiming to predict the future stock prices. The results of this study reveal that there is no predictive power in the Finnish investor sentiment as the prediction errors and price direction forecast accuracies do not improve with the inclusion of sentiment in the models. This conclusion was further confirmed with Granger causality analysis, which could not find any predictive power in sentiment towards stock prices. Sentimenttianalyysissä koneoppimista käytetään tunnistamaan mielialoja tekstistä. Useat tutkimukset ovat tutkineet voisiko sentimenttianalyysiä käyttää sijoittajien sentimentin mittaamiseen ja investointikohteiden hintojen ennustamiseen, mutta tulokset ovat olleet ristiriitaisia. Tämä tutkielma pyrkii tutkimaan sijoittajasentimentin ja osakehintojen välistä yhteyttä lisää tarkastelemalla suomalaisen sijoittajasentimentin vaikutusta OMX Helsingin osakehintoihin. Tutkimuksessa sosiaalisen median viestien sentimentti tunnistettiin naiivilla Bayesin luokittimella ja koottiin osakekohtaisiksi sentimenttiaikasarjoiksi, joita käytettiin selittävinä muuttujina osakehintoja ennustavissa VAR malleissa. Tutkimuksen tulokset eivät löytäneet mitään ennustavaa voimaa sijoittajien sentimentistä, sillä ennustusvirheet tai hintojen suunnan ennustamisen tarkkuus eivät parantuneet sentimenttimuuttujan mukaanotosta huolimatta. Tämä johtopäätös varmistettiin Granger-kausaalisuusanalyysillä, mikä ei myöskään löytänyt mitään ennustavaa voimaa sentimentistä osakehintoja kohtaan.