Comparison of machine learning algorithms in forest tree species classification from aerial images
Harinen, Henriikka (2022)
Katso/ Avaa
Sisältö avataan julkiseksi: 20.06.2024
Diplomityö
Harinen, Henriikka
2022
School of Engineering Science, Laskennallinen tekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2022062148213
https://urn.fi/URN:NBN:fi-fe2022062148213
Tiivistelmä
Remotely sensed data, such as satellite and aerial imagery, allow data to be obtained without visiting the area or physical contact with the area to be studied. Collecting remotely sensed data is faster and cheaper than terrain-collecting the data. Utilizing machine learning models in the analysis of remotely sensed data provides an effective way to obtain valuable information about the state of the environment.
The thesis aimed to compare the performance and accuracy of different machine learning models based on the dominant tree species in the classification of aerial images. The aerial image data has been collected from all over Finland, and the images are divided into three categories: spruce, pine, and deciduous trees. Three pre-trained convolutional neural networks, one self-built convolutional neural network, and a random forest algorithm were selected for comparison. In addition, the image classification model provided by the cloud platform Azure was included in the comparison.
The thesis represents current research and explains the working principles of different machine learning models. In this study, the performance of the models differs from the comparisons presented in previous studies, indicating that it is worthwhile to test several models in the image classification process. However, the results show that the accuracy of the models in recognizing tree species is promising. Kaukokartoitusaineistot, kuten satelliitti- ja ilmakuvat, mahdollistavat tiedon hankkimisen ilman paikalla käyntiä tai fyysistä kosketusta tutkittavaan alueeseen. Kaukokartoitettujen aineistojen kerääminen on nopeampaa ja edullisempaa kuin aineistojen kerääminen paikanpäältä. Koneoppimismallien hyödyntäminen kaukokartoitetun aineiston analysoinnissa tarjoaa tehokkaan tavan saada arvokasta tietoa ympäristön tilasta.
Diplomityön tavoitteena oli vertailla eri koneoppimismallien tehokkuutta ja tarkkuutta ilmakuvien luokittelussa vallitsevan puulajin perusteella. Ilmakuva-aineisto on kerätty eripuolilta Suomea, ja kuvat on jaettu kolmeen luokkaan: kuusi, mänty ja lehtipuut. Vertailuun valittiin kolme valmiiksi määritettyä ja opetettua konvoluutionaalista neuroverkkoa, yksi itse rakennettu konvoluutionaalinen neuroverkko sekä satunnaismetsäalgoritmi. Lisäksi pilvipalvelu Azuren tarjoama kuvanluokittelumalli oli mukana vertailussa.
Työssä on käsitelty tämänhetkistä tutkimustietoa aiheesta sekä selitetty eri koneoppimismallien toimintaperiaatteet. Tässä tutkimuksessa mallien suorituskyvyt poikkeavat aiemmissa tutkimuksissa esitetyistä vertailuista, mikä osoittaa, että kuvanluokitteluprosessissa kannattaa kokeilla useampia malleja. Tulokset kuitenkin osoittavat, että mallien tarkkuus puulajien tunnistuksessa on lupaava.
The thesis aimed to compare the performance and accuracy of different machine learning models based on the dominant tree species in the classification of aerial images. The aerial image data has been collected from all over Finland, and the images are divided into three categories: spruce, pine, and deciduous trees. Three pre-trained convolutional neural networks, one self-built convolutional neural network, and a random forest algorithm were selected for comparison. In addition, the image classification model provided by the cloud platform Azure was included in the comparison.
The thesis represents current research and explains the working principles of different machine learning models. In this study, the performance of the models differs from the comparisons presented in previous studies, indicating that it is worthwhile to test several models in the image classification process. However, the results show that the accuracy of the models in recognizing tree species is promising.
Diplomityön tavoitteena oli vertailla eri koneoppimismallien tehokkuutta ja tarkkuutta ilmakuvien luokittelussa vallitsevan puulajin perusteella. Ilmakuva-aineisto on kerätty eripuolilta Suomea, ja kuvat on jaettu kolmeen luokkaan: kuusi, mänty ja lehtipuut. Vertailuun valittiin kolme valmiiksi määritettyä ja opetettua konvoluutionaalista neuroverkkoa, yksi itse rakennettu konvoluutionaalinen neuroverkko sekä satunnaismetsäalgoritmi. Lisäksi pilvipalvelu Azuren tarjoama kuvanluokittelumalli oli mukana vertailussa.
Työssä on käsitelty tämänhetkistä tutkimustietoa aiheesta sekä selitetty eri koneoppimismallien toimintaperiaatteet. Tässä tutkimuksessa mallien suorituskyvyt poikkeavat aiemmissa tutkimuksissa esitetyistä vertailuista, mikä osoittaa, että kuvanluokitteluprosessissa kannattaa kokeilla useampia malleja. Tulokset kuitenkin osoittavat, että mallien tarkkuus puulajien tunnistuksessa on lupaava.