Big datan käyttö liiketoiminnan ennustamiseen: tieliikenneonnettomuudet Suomessa
Alto, Olga (2019)
Alto, Olga
2019
All rights reserved. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2019061216609
https://urn.fi/URN:NBN:fi:amk-2019061216609
Tiivistelmä
Tämän opinnäytetyön tarkoituksena on selvittää, mitä tietoja voidaan ennustaa suurista tietomääristä. Aineistona on käytetty Suomessa liikennetapaturmia koskevia avoimia lähteitä vuosilta 2015 – 2017.
Työssä ennustetaan liikenneonnettomuuksien tulevia arvoja vuonna 2018. Regressioanalyysin avulla arvioitiin kuljettajan iän, ajokokemuksen ja nopeusrajoitusten vaikutusta loukkaantuneiden lukumäärään liikenneonnettomuuksissa. Luottamusväli luotiin, jotta voitaisiin arvioida uhrien lukumäärä tieliikenneonnettomuuksissa kuljettajan iän ja ajokokemuksen mukaan.
Tutkimuksessa ennustettiin, että tieliikenneonnettomuuksien määrä vuonna 2018 pysyi vuoden 2017 tasolla, mutta vähemmän kuin vuosina 2015-2016.
Regressioanalyysin avulla todettiin, että ajokokemuksella on vahva vaikutus uhrien määrään. Liikenneonnettomuudet vaikuttavat paljon nuorempiin kuljettajiin, joilla on vähän ajokokemusta. Ikääntyneihin kuljettajiin tämä vaikutus vähenee. Nopeusrajoitusten ja uhrien lukumäärän suhdetta regressiomalleja verrattaessa pidettiin heikkona.
Regressioanalyysin aikana luotiin luottamusväliä ennustetulle uhrien määrälle 19-vuotiaalla kuljettajalla, jolla oli yhden vuoden ajokokemus, 30-vuotias kuljettaja, jolla on yhdeksän vuoden kokemus, 50-vuotias kuljettaja, jolla on 19 vuoden kokemus. Ennusteiden mukaan luottamusväli laskee (uhrien määrä pienenee), kun ajokokemus ja kuljettajan ikä kasvaavat. Niinpä, käyttämällä regressioanalyysiä ja rakentamalla luottamusvälejä ennustetun uhrien lukumäärän kanssa, voidaan päätellä, että ajokokemus ja kuljettajan ikä vaikuttavat suuresti uhrien määrään.
Tutkimuksen tulos voi olla hyödyllistä vakuutusyhtiölle vakuutusriskien arvioinnissa ja vakuutuskustannusten laskemisessa.
Tutkimus suoritettiin R-ohjelmointikielellä RStudio-ympäristössä. Työssä käytettiin tilastotietoja, ohjelmointia, tiedon louhintamenetelmiä. The purpose of this thesis is to find out what information can be predicted from large amounts of data, for which open data on road traffic accidents in Finland in 2015 – 2017 has been used.
The study predicted the future values of traffic accidents in 2018. Using the regression analysis, the influence of the driver’s age, driving experience and speed limits on the number of people injured in road traffic accidents is estimated. 95 % confidence intervals were built to estimate the number of victims, depending on the set age and driving experience.
The study predicted that the number of road accidents in 2018 remained at the 2017 level, but less than in 2015-2016.
Regression analysis found that driving experience has a strong impact on the number of victims. Traffic accidents affect much younger drivers with little driving experience. For older drivers, this effect is reduced. The relationship between speed limits and the number of victims compared to regression models was considered weak.
During the regression analysis, a confidence interval was created for the predicted number of victims with a 19-year-old driver with a one-year driving experience, a 30-year-old driver with nine years experience, a 50-year-old driver with 19 years of experience. According to forecasts, the confidence interval will decrease (the number of victims will decrease) as the driving experience and driver age increase. Thus, by using regression analysis and building confidence intervals with the predicted number of victims, it can be concluded that the driving experience and driver age have a major impact on the number of victims.
The result of the study may be useful for the insurance company in assessing insurance risks and calculating insurance costs.
The research was conducted in the R programming language in RStudio and used information about statistics, programming, date mining methods.
Työssä ennustetaan liikenneonnettomuuksien tulevia arvoja vuonna 2018. Regressioanalyysin avulla arvioitiin kuljettajan iän, ajokokemuksen ja nopeusrajoitusten vaikutusta loukkaantuneiden lukumäärään liikenneonnettomuuksissa. Luottamusväli luotiin, jotta voitaisiin arvioida uhrien lukumäärä tieliikenneonnettomuuksissa kuljettajan iän ja ajokokemuksen mukaan.
Tutkimuksessa ennustettiin, että tieliikenneonnettomuuksien määrä vuonna 2018 pysyi vuoden 2017 tasolla, mutta vähemmän kuin vuosina 2015-2016.
Regressioanalyysin avulla todettiin, että ajokokemuksella on vahva vaikutus uhrien määrään. Liikenneonnettomuudet vaikuttavat paljon nuorempiin kuljettajiin, joilla on vähän ajokokemusta. Ikääntyneihin kuljettajiin tämä vaikutus vähenee. Nopeusrajoitusten ja uhrien lukumäärän suhdetta regressiomalleja verrattaessa pidettiin heikkona.
Regressioanalyysin aikana luotiin luottamusväliä ennustetulle uhrien määrälle 19-vuotiaalla kuljettajalla, jolla oli yhden vuoden ajokokemus, 30-vuotias kuljettaja, jolla on yhdeksän vuoden kokemus, 50-vuotias kuljettaja, jolla on 19 vuoden kokemus. Ennusteiden mukaan luottamusväli laskee (uhrien määrä pienenee), kun ajokokemus ja kuljettajan ikä kasvaavat. Niinpä, käyttämällä regressioanalyysiä ja rakentamalla luottamusvälejä ennustetun uhrien lukumäärän kanssa, voidaan päätellä, että ajokokemus ja kuljettajan ikä vaikuttavat suuresti uhrien määrään.
Tutkimuksen tulos voi olla hyödyllistä vakuutusyhtiölle vakuutusriskien arvioinnissa ja vakuutuskustannusten laskemisessa.
Tutkimus suoritettiin R-ohjelmointikielellä RStudio-ympäristössä. Työssä käytettiin tilastotietoja, ohjelmointia, tiedon louhintamenetelmiä.
The study predicted the future values of traffic accidents in 2018. Using the regression analysis, the influence of the driver’s age, driving experience and speed limits on the number of people injured in road traffic accidents is estimated. 95 % confidence intervals were built to estimate the number of victims, depending on the set age and driving experience.
The study predicted that the number of road accidents in 2018 remained at the 2017 level, but less than in 2015-2016.
Regression analysis found that driving experience has a strong impact on the number of victims. Traffic accidents affect much younger drivers with little driving experience. For older drivers, this effect is reduced. The relationship between speed limits and the number of victims compared to regression models was considered weak.
During the regression analysis, a confidence interval was created for the predicted number of victims with a 19-year-old driver with a one-year driving experience, a 30-year-old driver with nine years experience, a 50-year-old driver with 19 years of experience. According to forecasts, the confidence interval will decrease (the number of victims will decrease) as the driving experience and driver age increase. Thus, by using regression analysis and building confidence intervals with the predicted number of victims, it can be concluded that the driving experience and driver age have a major impact on the number of victims.
The result of the study may be useful for the insurance company in assessing insurance risks and calculating insurance costs.
The research was conducted in the R programming language in RStudio and used information about statistics, programming, date mining methods.
Kokoelmat
Samankaltainen aineisto
Näytetään aineisto, joilla on samankaltaisia nimekkeitä, tekijöitä tai asiasanoja.
-
Recognizing the value of data in business operations : Data analytics for business operation
Duma, Don (2022)The aim of this study was to demonstrate the hidden value of data that can be extracted with few commercial and open-source software tools. Any given business can collect, organize, and extract data for analysis that can ... -
Recognizing the value of data in business operations : A study on gathering internal and external data and ways to utilize it in business strategies
Duma, Don (2021)The purpose of the study was to discover how organizations in the regions of Jakobstad / Pietarsaari and Karleby / Kokkola in Finland collect data and how data are utilised to make accurate and informed decisions to gain ... -
GDPR Implementation Framework for SMEs
Ashraf, Saira (2021)General Data Protection Regulation (GDPR) has been in force since May 2018. Despite the time lapsed, there is no simple interpretation of the regulation that can be adapted by Small and Medium size enterprises to become ...