Modelling costs of train timetable changes with machine learning regression models : case VR-Group Plc
Handroos, Sara (2022)
Katso/ Avaa
Sisältö avataan julkiseksi: 03.10.2024
Pro gradu -tutkielma
Handroos, Sara
2022
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2022100361054
https://urn.fi/URN:NBN:fi-fe2022100361054
Tiivistelmä
Changes in train operators' original timetables occur on daily basis all over the world. These changes are caused by external factors, such as weather changes or track failure, or internal ones, like a defect in locomotives and wagons. Timetable change requires re-planning the resources related to the train. Each planning phase generates costs. These can be related to planning the task itself or resources, such as moving locomotives between stations and train crew to travel on the route.
The first objective of this study is to examine, what kind of machine learning models has been presented for determining the cost of train timetable changes from a train operator's perspective. The study focuses on long-distance passenger and freight trains. Based on these findings, the second objective is to determine the best models for the case company to forecast the costs of train timetable changes. The case study focuses on planning costs related to locomotives and train drivers. Data used in this study consists of train timetable changes, where a train is cancelled, or an additional train is added to the timetable. Data includes train timetable changes, locomotive and crew plans from August 2019 to January 2022. Regression modelling is focused on full and partial freight train cancellations.
For regression analysis, appropriate variables are determined based on previous literature with assistance of the case company’s field experts and costs are allocated to each train’s timetable change separately. Machine learning models are computed for the dataset and results are compared. The results of this thesis show that in the scope of adapting machine learning to train timetable changes, the literature focuses mainly on train delay prediction. Random forests, support vector machines and artificial neural networks have been used for prediction. In this study, decision tree outperforms other compared regression models for predicting the costs of train timetable changes for the case company. When hours between the train’s timetable change and departure time decrease, it has the greatest effect on costs related to freight train cancellations. Muutoksia junaliikenteen harjoittajien alkuperäisissä aikatauluissa tapahtuu päivittäin kaikkialla maailmassa. Nämä muutokset johtuvat ulkoisista tekijöistä, kuten sään muutoksista tai radan vaurioista, tai sisäisistä, kuten veturien ja vaunujen toimintahäiriöistä. Aikataulun muutos vaatii junaan liittyvien resurssien uudelleensuunnittelua. Jokainen suunnitteluvaihe tuottaa kustannuksia. Nämä voivat liittyä itse suunnittelutehtävään tai resursseihin, kuten veturien siirtämiseen asemien välillä ja junan miehistön matkustamiseen maanteitse.
Tämän tutkimuksen ensimmäisenä tavoitteena on selvittää, millaisia koneoppimismalleja on esitetty junien aikataulumuutosten määrittämiseksi junaoperaattorin näkökulmasta. Tutkimus keskittyy kaukoliikenteen matkustaja- ja tavarajuniin. Näiden tulosten perusteella toisena tavoitteena on määrittää case yritykselle parhaat mallit aikataulumuutosten kustannusten ennustamiseen. Case tutkimus keskittyy vetureihin ja veturinkuljettajiin liittyvien kustannusten suunnitteluun. Tässä tutkimuksessa käytetty data koostuu aikataulumuutoksista, joissa juna peruuntuu tai aikatauluun lisätään lisäjuna. Data sisältää junamuutokset, veturi- ja kuljettajasuunnitelmat elokuusta 2019 tammikuuhun 2022. Regressiomallinnus keskittyy tavarajunien koko matkan ja osamatkan peruutuksiin.
Regressioanalyysiä varten sopivat muuttujat määritetään aiemman kirjallisuuden perusteella case yrityksen alan asiantuntijoiden avustuksella ja kustannukset kohdistetaan yksittäisten junien aikataulumuutoksiin. Aineistoon sovitetaan koneoppimismalleja ja tuloksia verrataan. Tämän opinnäytetyön tulokset osoittavat, että koneoppimisen sovittamisessa aikataulumuutoksiin, kirjallisuus keskittyy pääasiassa junien viivästysten ennustamiseen. Ennustukseen on käytetty satunnaisia metsiä, tukivektorikoneita ja neuroverkkoja. Tässä tutkimuksessa päätöspuun ennusteiden oikeellisuus ylittää muut siihen verratut regressiomallit case yrityksen aikataulumuutosten kustannusten ennustamisessa. Kustannukset kasvoivat eniten tavarajunien peruutuksissa, mitä lähempänä aikataulumuutos on tehty ennen junan lähtöaikaa.
The first objective of this study is to examine, what kind of machine learning models has been presented for determining the cost of train timetable changes from a train operator's perspective. The study focuses on long-distance passenger and freight trains. Based on these findings, the second objective is to determine the best models for the case company to forecast the costs of train timetable changes. The case study focuses on planning costs related to locomotives and train drivers. Data used in this study consists of train timetable changes, where a train is cancelled, or an additional train is added to the timetable. Data includes train timetable changes, locomotive and crew plans from August 2019 to January 2022. Regression modelling is focused on full and partial freight train cancellations.
For regression analysis, appropriate variables are determined based on previous literature with assistance of the case company’s field experts and costs are allocated to each train’s timetable change separately. Machine learning models are computed for the dataset and results are compared. The results of this thesis show that in the scope of adapting machine learning to train timetable changes, the literature focuses mainly on train delay prediction. Random forests, support vector machines and artificial neural networks have been used for prediction. In this study, decision tree outperforms other compared regression models for predicting the costs of train timetable changes for the case company. When hours between the train’s timetable change and departure time decrease, it has the greatest effect on costs related to freight train cancellations.
Tämän tutkimuksen ensimmäisenä tavoitteena on selvittää, millaisia koneoppimismalleja on esitetty junien aikataulumuutosten määrittämiseksi junaoperaattorin näkökulmasta. Tutkimus keskittyy kaukoliikenteen matkustaja- ja tavarajuniin. Näiden tulosten perusteella toisena tavoitteena on määrittää case yritykselle parhaat mallit aikataulumuutosten kustannusten ennustamiseen. Case tutkimus keskittyy vetureihin ja veturinkuljettajiin liittyvien kustannusten suunnitteluun. Tässä tutkimuksessa käytetty data koostuu aikataulumuutoksista, joissa juna peruuntuu tai aikatauluun lisätään lisäjuna. Data sisältää junamuutokset, veturi- ja kuljettajasuunnitelmat elokuusta 2019 tammikuuhun 2022. Regressiomallinnus keskittyy tavarajunien koko matkan ja osamatkan peruutuksiin.
Regressioanalyysiä varten sopivat muuttujat määritetään aiemman kirjallisuuden perusteella case yrityksen alan asiantuntijoiden avustuksella ja kustannukset kohdistetaan yksittäisten junien aikataulumuutoksiin. Aineistoon sovitetaan koneoppimismalleja ja tuloksia verrataan. Tämän opinnäytetyön tulokset osoittavat, että koneoppimisen sovittamisessa aikataulumuutoksiin, kirjallisuus keskittyy pääasiassa junien viivästysten ennustamiseen. Ennustukseen on käytetty satunnaisia metsiä, tukivektorikoneita ja neuroverkkoja. Tässä tutkimuksessa päätöspuun ennusteiden oikeellisuus ylittää muut siihen verratut regressiomallit case yrityksen aikataulumuutosten kustannusten ennustamisessa. Kustannukset kasvoivat eniten tavarajunien peruutuksissa, mitä lähempänä aikataulumuutos on tehty ennen junan lähtöaikaa.