Estimating loss given default for retail credit portfolio
Savolainen, Tuomas (2021)
Pro gradu -tutkielma
Savolainen, Tuomas
2021
School of Business and Management, Kauppatieteet
Kaikki oikeudet pidätetään.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2021090645183
https://urn.fi/URN:NBN:fi-fe2021090645183
Tiivistelmä
Financial institutions have the option to internally estimate LGD and PD in determining risk weight of loans, instead of the standard approach. This thesis contributes to the existing literature by employing five different methodologies in estimating LGD for retail credit portfolio. Earlier research has applied multiple techniques, but no consensus exists for the best practice of LGD modeling.
The research composes of forecasting LGD and comparing model estimates. The data set and models are built to comply with the effective Basel framework and EU legislation. The models in use are linear regression, generalized linear regression (gamma regression), beta regression, random forest, and support vector regression. Prediction performance was evaluated from perspective of estimation accuracy and discriminatory power with five different metrics in use. Overall ranking was formed by ranking models from the best performance to the worst with individual metrics and aggregating the rankings. The best performing model was generalized linear regression with gamma distribution in use. This thesis concludes that LGD models are case sensitive as they are built on the need of individual institutions and their specific risk characteristics hence the lack of single best methodology. Rahoituslaitoksilla on mahdollisuus käyttää sisäisen luottoluokituksen menetelmää estimoidakseen LGD- ja PD-arvoja, joita hyödynnetään riskipainolaskennassa standardimallin sijasta. Tämä pro gradu tutkielma täydentää olemassa olevaa kirjallisuutta käyttämällä viittä eri metodologiaa LGD:n estimointiin vähittäisluotoille. Aiempi kirjallisuus on tutkinut useaa eri tekniikkaa, mutta yhtenevää näkemystä parhaasta metodologiasta ei ole syntynyt.
Tämä tutkimus koostuu LGD-estimaattien muodostamisesta valituilla metodeilla ja niiden ennusteiden arvioinnista. Käytetty aineisto ja mallit täyttävät voimassa olevat Basel kehikon ja EU:n sääntelyvaatimukset soveltuvin osin. Tutkimuksessa käytettävät mallit ovat lineaarinen regressio, yleistetty lineaarinen regressio (gamma regressio), beeta regressio, satunnainen metsä ja tukivektori regressio. Ennusteiden suorituskykyä arvioidaan tarkkuuden ja luokittelukyvyn mukaan viidellä mittarilla. Mallien paremmuusjärjestys määritetään ensin yksittäisten metriikoiden mukaan ja lopulta järjestysten summana. Parhaiten suoriutunut malli oli yleistetty lineaarinen regressio gamma jakaumaa soveltaen. Tämä pro gradu tutkielma vahvistaa LGD-mallien tapauskohtaisuuden, sillä ne rakennetaan vastaamaan yksittäisten instituutioiden riskiprofiiliin ja tarpeisiin, minkä takia yksi metodologia ei ole noussut toisten yläpuolelle.
The research composes of forecasting LGD and comparing model estimates. The data set and models are built to comply with the effective Basel framework and EU legislation. The models in use are linear regression, generalized linear regression (gamma regression), beta regression, random forest, and support vector regression. Prediction performance was evaluated from perspective of estimation accuracy and discriminatory power with five different metrics in use. Overall ranking was formed by ranking models from the best performance to the worst with individual metrics and aggregating the rankings. The best performing model was generalized linear regression with gamma distribution in use. This thesis concludes that LGD models are case sensitive as they are built on the need of individual institutions and their specific risk characteristics hence the lack of single best methodology.
Tämä tutkimus koostuu LGD-estimaattien muodostamisesta valituilla metodeilla ja niiden ennusteiden arvioinnista. Käytetty aineisto ja mallit täyttävät voimassa olevat Basel kehikon ja EU:n sääntelyvaatimukset soveltuvin osin. Tutkimuksessa käytettävät mallit ovat lineaarinen regressio, yleistetty lineaarinen regressio (gamma regressio), beeta regressio, satunnainen metsä ja tukivektori regressio. Ennusteiden suorituskykyä arvioidaan tarkkuuden ja luokittelukyvyn mukaan viidellä mittarilla. Mallien paremmuusjärjestys määritetään ensin yksittäisten metriikoiden mukaan ja lopulta järjestysten summana. Parhaiten suoriutunut malli oli yleistetty lineaarinen regressio gamma jakaumaa soveltaen. Tämä pro gradu tutkielma vahvistaa LGD-mallien tapauskohtaisuuden, sillä ne rakennetaan vastaamaan yksittäisten instituutioiden riskiprofiiliin ja tarpeisiin, minkä takia yksi metodologia ei ole noussut toisten yläpuolelle.