Forecasting cash flow curve of construction projects using support vector regression and project cost composition
Virtanen, Antti (2021)
Pro gradu -tutkielma
Virtanen, Antti
2021
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2021083044625
https://urn.fi/URN:NBN:fi-fe2021083044625
Tiivistelmä
Cash flow management is a crucial factor of construction project profitability and its negligence contributes a significant portion of contractor bankruptcies. This study proposes a novel cash outflow forecasting model. The model applies a machine learning method, support vector regression (SVR), on historical data of similar projects to forecast the current project’s cash outflow from the beginning to the end of construction. In the proposed model project key characteristics are identified via project k-means clustering and project cost composition before producing the cash outflow forecast. The model is tested and verified using actual data from 33 projects of a Finnish general contractor. The forecasting model and its intermediate versions are benchmarked against the current state-of-the-art approaches found in the literature.
A systematic literature review of the current cash outflow models in the construction industry is conducted. The review shows that cash outflow is forecasted indirectly by estimating a cost commitment curve with a linear logit model and applying a fixed timelag based on project cost composition. The issues with this approach is that it cannot fit non-linear relationships and assumes that different cost categories are incurring at a uniform rate which results to a systematic error. The proposed model addresses the identified issues by applying non-linear methodology to forecast cash outflow directly and utilizing project cost composition to estimate the cash outflow curve profile which makes it novel from the theoretical perspective.
The results of the proposed model performance are promising. Forecasting cash outflow directly reduced the average error by 5.41% compared to the often used indirect approach. The use of SVR improved the model’s ability to fit an individual project and utilization of project cost composition had a similar effect in the pre-construction phase reducing the root mean squared error (RMSE) to 7.75% from 10.25% RMSE observed with the standard approach. Within the construction phase, the average error reduced from -2.33% pre-construction level to an average of -0.67%. Kassavirran hallinta on ratkaiseva tekijä rakentamisprojektien kannattavuudessa ja sen laiminlyönti aiheuttaa merkittävän osan urakoitsijoiden konkursseista. Tutkimus ehdottaa uudenlaista kassavirran ennustemallia, jota voidaan käyttää ennen rakentamisen aloittamista sekä sen aikana. Malli soveltaa koneoppimismenetelmää (tukivektoriregressio) ennustamaan nykyisen projektin kassavirtaa rakentamisen alusta loppuun käyttäen vastaavien projektien historiallisia tietoja. Se tunnistaa projektin ominaisuudet projektien ryhmittelyn (k:n keskiarvon klusterointimenetelmä) ja kustannusrakenteiden avulla. Mallin toimivuus on testattu ja todennettu käyttäen toteumatietoa suomalaisen pääurakoitsijan 33:sta projektista. Ennustemallia ja sen väliversioita verrataan kirjallisuuden johtaviin lähestymistapoihin.
Rakennusteollisuuden nykyisistä kassavirtamalleista tehdään systemaattinen kirjallisuuskatsaus, joka osoittaa, että kassavirta ennustetaan epäsuorasti arvioimalla kustannuskäyrä lineaarisella mallilla (logaritminen lineeariregressio) ja käyttämällä kiinteää aikaviivettä, joka perustuu projektin kustannusrakenteeseen. Lähestymistavan ongelmana on, että se ei sovellu mallintamaan epälineearisia suhteita ja se olettaa kustannuskategorioiden samantahtisen toteutumisen, mikä johtaa systemaattiseen virheeseen. Ehdotettu ennustemalli vastaa tunnistettuihin ongelmiin soveltamalla epälineaarista menetelmää kassavirran suoraan ennustamiseen ja arvioimalla kassavirtakäyrän muotoa projektin kustannusrakenteiden avulla. Tämä tekee mallista uuden teoreettisesta näkökulmasta.
Ehdotetun mallin suorituskyvyn tulokset ovat lupaavia. Kassavirran ennustaminen suoraan pienensi keskimääräistä virhettä 5.41% verrattuna yleisesti käytettyyn epäsuoraan ennustamiseen. Tukivektoriregression käyttö paransi mallin kykyä ennustaa yksittäinen projekti sekä projektin kustannusrakenteen hyödyntämisellä oli samanlainen vaikutus rakentamista edeltävässä vaiheessa, jossa ne paransivat mallin keskineliövirheen neliöjuuren (RMSE) 7.75%:iin tavanomaisen lähestymistavan 10.25%:sta. Rakenamisvaiheessa keskimääräinen virhe pieneni rakentamisvaihetta edeltävästä -2.33%:sta -0.67%:iin.
A systematic literature review of the current cash outflow models in the construction industry is conducted. The review shows that cash outflow is forecasted indirectly by estimating a cost commitment curve with a linear logit model and applying a fixed timelag based on project cost composition. The issues with this approach is that it cannot fit non-linear relationships and assumes that different cost categories are incurring at a uniform rate which results to a systematic error. The proposed model addresses the identified issues by applying non-linear methodology to forecast cash outflow directly and utilizing project cost composition to estimate the cash outflow curve profile which makes it novel from the theoretical perspective.
The results of the proposed model performance are promising. Forecasting cash outflow directly reduced the average error by 5.41% compared to the often used indirect approach. The use of SVR improved the model’s ability to fit an individual project and utilization of project cost composition had a similar effect in the pre-construction phase reducing the root mean squared error (RMSE) to 7.75% from 10.25% RMSE observed with the standard approach. Within the construction phase, the average error reduced from -2.33% pre-construction level to an average of -0.67%.
Rakennusteollisuuden nykyisistä kassavirtamalleista tehdään systemaattinen kirjallisuuskatsaus, joka osoittaa, että kassavirta ennustetaan epäsuorasti arvioimalla kustannuskäyrä lineaarisella mallilla (logaritminen lineeariregressio) ja käyttämällä kiinteää aikaviivettä, joka perustuu projektin kustannusrakenteeseen. Lähestymistavan ongelmana on, että se ei sovellu mallintamaan epälineearisia suhteita ja se olettaa kustannuskategorioiden samantahtisen toteutumisen, mikä johtaa systemaattiseen virheeseen. Ehdotettu ennustemalli vastaa tunnistettuihin ongelmiin soveltamalla epälineaarista menetelmää kassavirran suoraan ennustamiseen ja arvioimalla kassavirtakäyrän muotoa projektin kustannusrakenteiden avulla. Tämä tekee mallista uuden teoreettisesta näkökulmasta.
Ehdotetun mallin suorituskyvyn tulokset ovat lupaavia. Kassavirran ennustaminen suoraan pienensi keskimääräistä virhettä 5.41% verrattuna yleisesti käytettyyn epäsuoraan ennustamiseen. Tukivektoriregression käyttö paransi mallin kykyä ennustaa yksittäinen projekti sekä projektin kustannusrakenteen hyödyntämisellä oli samanlainen vaikutus rakentamista edeltävässä vaiheessa, jossa ne paransivat mallin keskineliövirheen neliöjuuren (RMSE) 7.75%:iin tavanomaisen lähestymistavan 10.25%:sta. Rakenamisvaiheessa keskimääräinen virhe pieneni rakentamisvaihetta edeltävästä -2.33%:sta -0.67%:iin.