Smart city : using Bluetooth beacons and machine learning to predict traffic points
Pitkänen, Samuel (2022)
Diplomityö
Pitkänen, Samuel
2022
School of Engineering Science, Tietotekniikka
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2022060141676
https://urn.fi/URN:NBN:fi-fe2022060141676
Tiivistelmä
The population is increasingly concentrated in highly populated urban city areas. The density of population in urban cities increases traffic congestion. The concept of a smart city is being used more and more as the utilization of the internet of things in the context of cities is becoming more popular. Smart cities include different types of smart devices, like sensors. With the big data gathered by the smart cities’ sensors and utilization of machine learning, the traffic points of a city can be predicted. The traffic point prediction helps in the decision- making of traffic congestion management and urban city planning.
This thesis aims to develop the most optimal machine learning model for predicting traffic points in Helsinki. The thesis includes a comparison of various common machine learning regression algorithms, including support vector regression, random forest regression, polynomial regression, K-nearest neighbor regression, and decision tree regression. The traffic points are predicted based on the traffic volume data gathered by Bluetooth beacons. The access to the traffic volume data is acquired from the case company Hypercell.
The thesis followed the research approach of design science which includes six steps. This approach aims to create an artifact (developed machine learning model) by also producing a scientific document (this thesis). Each of these steps is presented in this document.
The results showed that the difference between the accuracy of the algorithms is insignificant. However, the K-nearest neighbor regression algorithm was selected for further demonstration and evaluation. The demonstration presented a couple of approaches, to how the traffic points can be identified. The thesis presented a heatmap and color-coded marker map to represent the predicted volumes. Finally, the model evaluation showed promising results that the K-nearest algorithm and Bluetooth beacon data can be used for predicting the traffic points. Väestön asutus keskittyy yhä enemmän kaupunkialueille. Ruuhkien esiintyvyys kasvaa tiheästi asutuilla kaupunkialueilla. Käsite älykäs kaupunki yleistyy jatkuvasti, sillä esineiden internet yleistyy myös kaupunkikuvassa. Älykkäät kaupungit hyödyntävät erilaisia älylaitteita, kuten sensoreita. Hyödyntämällä yhdessä sekä älykaupunkien sensorien tuottamaa suurta datamäärä ja koneoppimista voidaan kaupunkien ruuhkapisteitä ennustaa. Ruuhkapisteiden ennustamista voidaan hyödyntää ruuhkien hallitsemisen ja kaupunginsuunnittelun päätöksenteossa.
Tämän työn tavoitteena on kehittää optimaalisin koneoppimismalli ruuhkapisteiden ennustamiseksi Helsingissä. Työssä vertaillaan useita yleisiä koneoppimisen regressio algoritmeja, mukaan lukien tukivektoriregressio, satunnainen metsä regressio, polynomiregressio, K-lähin naapuri regressio sekä päätöspuuregressio. Ruuhkapisteiden ennustamisessa hyödynnetään Bluetooth majakoiden keräämää ruuhkan voluumidataa. Pääsyn dataan tarjoaa yhteistyöyritys Hypercell.
Työ seurasi suunnittelutieteen (design science) tutkimuslähestymistapaa, joka sisältää kuusi vaihetta. Suunnittelutiede lähestymistapana pyrkii kehittämään artefaktin (kehitetty koneoppimismalli) sekä tieteellisen dokumentin (tämä diplomityö). Kaikki lähestymistavan vaiheet on esitetty tässä työssä.
Työn tulokset osoittivat, että eri algoritmien välinen tarkkuusero on merkityksetön. Kuitenkin K-lähin naapuri algoritmi valittiin tarkempaan esittelyyn ja arviointiin. Esittelyn avulla esiteltiin kaksi lähestymistapaa, joiden avulla ruuhkapisteet voidaan tunnistaa. Esitetyt lähestymistavat ovat lämpökartta sekä kartta, joka hyödyntää värikoodattuja merkkejä. Lopuksi mallin arviointi osoitti, että K-lähin naapuri algoritmia yhdessä Bluetooth majakoiden avulla kerättyä dataa voidaan hyödyntää ruuhkapisteiden ennustamisessa.
This thesis aims to develop the most optimal machine learning model for predicting traffic points in Helsinki. The thesis includes a comparison of various common machine learning regression algorithms, including support vector regression, random forest regression, polynomial regression, K-nearest neighbor regression, and decision tree regression. The traffic points are predicted based on the traffic volume data gathered by Bluetooth beacons. The access to the traffic volume data is acquired from the case company Hypercell.
The thesis followed the research approach of design science which includes six steps. This approach aims to create an artifact (developed machine learning model) by also producing a scientific document (this thesis). Each of these steps is presented in this document.
The results showed that the difference between the accuracy of the algorithms is insignificant. However, the K-nearest neighbor regression algorithm was selected for further demonstration and evaluation. The demonstration presented a couple of approaches, to how the traffic points can be identified. The thesis presented a heatmap and color-coded marker map to represent the predicted volumes. Finally, the model evaluation showed promising results that the K-nearest algorithm and Bluetooth beacon data can be used for predicting the traffic points.
Tämän työn tavoitteena on kehittää optimaalisin koneoppimismalli ruuhkapisteiden ennustamiseksi Helsingissä. Työssä vertaillaan useita yleisiä koneoppimisen regressio algoritmeja, mukaan lukien tukivektoriregressio, satunnainen metsä regressio, polynomiregressio, K-lähin naapuri regressio sekä päätöspuuregressio. Ruuhkapisteiden ennustamisessa hyödynnetään Bluetooth majakoiden keräämää ruuhkan voluumidataa. Pääsyn dataan tarjoaa yhteistyöyritys Hypercell.
Työ seurasi suunnittelutieteen (design science) tutkimuslähestymistapaa, joka sisältää kuusi vaihetta. Suunnittelutiede lähestymistapana pyrkii kehittämään artefaktin (kehitetty koneoppimismalli) sekä tieteellisen dokumentin (tämä diplomityö). Kaikki lähestymistavan vaiheet on esitetty tässä työssä.
Työn tulokset osoittivat, että eri algoritmien välinen tarkkuusero on merkityksetön. Kuitenkin K-lähin naapuri algoritmi valittiin tarkempaan esittelyyn ja arviointiin. Esittelyn avulla esiteltiin kaksi lähestymistapaa, joiden avulla ruuhkapisteet voidaan tunnistaa. Esitetyt lähestymistavat ovat lämpökartta sekä kartta, joka hyödyntää värikoodattuja merkkejä. Lopuksi mallin arviointi osoitti, että K-lähin naapuri algoritmia yhdessä Bluetooth majakoiden avulla kerättyä dataa voidaan hyödyntää ruuhkapisteiden ennustamisessa.