Aspect Based Sentiment Analysis in Finnish

Loading...
Thumbnail Image
Journal Title
Journal ISSN
Volume Title
Perustieteiden korkeakoulu | Master's thesis
Date
2022-01-24
Department
Major/Subject
Computer Science
Mcode
SCI3042
Degree programme
Master’s Programme in Computer, Communication and Information Sciences
Language
en
Pages
43
Series
Abstract
In this thesis Aspect Based Sentiment Analysis (ABSA) is explored for the Finnish language. ABSA is the task of finding aspects mentioned in texts about a product or a service and then classifying the sentiment around the aspects e.g., the sentence "I liked the packaging of this product" has the aspect packaging and the sentiment around is positive. ABSA can be broken into two subtasks. The first is aspect term extraction ATE the other is aspect polarity classification APC. In ATE we extract the aspect from a sentence and in APC classify of the aspect has been talked about in positive, neutral, or negative way. In this thesis we present two possible solutions to this task for the Finnish language. In the first solution we use a pretrained deep learning model called FinBERT and it is used to solve both ATE and APC with one machine learning model. The other solution we use a dependency parser and a set of rules for ATE and again the FinBERT is used but now only for APC. The solutions are found to have potential, but it is found that a lack of data in Finnish is the most difficult problem to overcome to improve the solutions provided.

I denna magisteravhandling tacklar vi problemet Aspekt Baserad Sentimentalitet Analys (ABSA). ABSA handlar om att hitta aspekter som har talas om i texter om en produkt eller en service och sedan klassificera i vilket sentimentalitet aspekten har talats om. Till exempel meningen ”jag tycker om förpackningen av produkten” har aspekten förpackningen och aspekten talas om på ett positivt sätt. ABSA kan delas upp i två deluppgifter aspektterm utdragning (ATD) i vilket man hitta aspekterna i mening-ar. I den andra deluppgiften skall klassificeras om aspekten talas om på ett positivt, neutralt, eller negativt sätt. I denna avhandling presenteras två lösningar på ABSA uppgiften när meningarna är på Finska. I första lösningen så används förinlärd maskininlärnings modell som kallas Fin-BERT och den används för att lösa båda deluppgifterna på samma gång med en modell. Den andra lösningen används en beroendeparser för att lösa ATD och sedan används igen FinBERT för att lösa bara sentimentalitetklassificeringen. Lösningarna visade sig ha potential, men verkar som det svåraste att lösa ABSA uppgiften på finska är bristen på data.
Description
Supervisor
Jung, Alex
Thesis advisor
Jerome, Richard
Keywords
NLP, sentiment analysis, aspect based sentiment analysis, deep learning
Other note
Citation