Predicting Risk and Return in Peer-to-Peer Lending with Machine Learning : A Decision Making Approach
Byanjankar, Ajay (2021-12-03)
Byanjankar, Ajay
Åbo Akademi University
03.12.2021
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
Julkaisun pysyvä osoite on
https://urn.fi/URN:ISBN: 978‑952‑12‑4129‑1
https://urn.fi/URN:ISBN: 978‑952‑12‑4129‑1
Tiivistelmä
Credit risk is one of the prominent risk types in the financial industry. It is the risk associated with lending money to borrowers, where the risk is the likelihood of not receiving back the money as a result of borrowers defaulting. Therefore, credit risk is directly related to the loss of investment, which makes credit risk a significant risk in terms of potential losses. While the loss from credit risk can be extreme, assessing the credit risk is a difficult task, and it receives high importance in decision making. With the growth of the credit industry, it also increases the likelihood of increased defaulted loans that further increases the need for careful selection of borrowers in providing credits. To prevent the loss from providing credits to risky borrowers, credit risk evaluation plays a critical role in differentiating between ’low‑risk’ and ’high‑risk’ borrowers.
An alternative financial market with easy and quick access to loans has been emerging as a popular alternative to the traditional market. Peer‑to‑peer lending is one such popular market that connects borrowers directly to lenders through an online platform for loan transactions. With the absence of collateral and financial intermediaries, peer‑to‑peer lending provides an easy access to credits at a lower cost. Additionally, its online and automated operation allows for quick access to credits. However, the absence of collateral also becomes the source of credit risk. The risk is further increased due to most lenders being non‑professional investors and thus, lack analytical skills. Therefore, it requires careful selection of borrowers to prevent loss in presence of high risk in peer‑to‑peer lending.
The objective of this thesis is to study credit risk evaluation in peer‑to‑peer lending for supporting lending decisions. With credit scoring as the statistical tool for evaluating credit risk, the primary aim of the thesis is to apply predictive analytics for estimating credit risk. Machine learning algorithms are implemented to create more accurate credit scoring models with high predictive performance.
Implementing multiple approaches to analyzing credit risk in peer‑to‑peer lending, this thesis attempts to generate solutions for better risk identification to support lending decisions. For a more realistic estimation of return from peer‑to‑peer loans, return is estimated by accounting risk that ensures for profitable investments in the presence of risk to the lenders. Due to the presence of different risk levels in peer‑to‑peer lending, credit risk modeling is performed to create risk‑specific decisions. The risk evaluation performed at a group level contributes to more accurate risk identification and lower misclassification costs in differentiation between ‘low‑risk’ and ‘high‑risk’ borrowers. With portfolio optimization, lenders’ need for budget allocation in ensuring overall proϐit is achieved. Portfolio optimization supports lenders in loan selection with budget allocation to achieve a high return by accepting a certain level of risk. ----------
Kreditrisk är en framträdande risktyp i den finansiella industrin och beskriver risken associerad till utlåning där det finns en viss sannolikhet att de lånade medlen inte fås tillbaka efter att låntagaren har försummat sina avbetalningar. Eftersom kreditrisken är direkt anknuten till långivares investering, blir den en signifikant risk med hänsyn till potentiella förluster. Förlusten orsakad av kreditrisk kan bli ytterst stor vilket gör riskbedömningen ett svårt men synnerligen betydelsefullt steg i beslutsfattandet. I och med att kreditindustrin växer, växer också sannolikheten av försummade lån och låntagarnas behov av att kunna bättre välja till vilka låntagare de kan bevilja kredit. Evalueringen av kreditrisk spelar en kritisk roll i att skilja åt de potentiella låntagarna till ”lågrisk” och ”högrisk” för att kunna förebygga förluster. Den alternativa finansiella marknaden har blivit ett populärt alternativ till den traditionella finansiella marknaden genom att erbjuda lätt och snabb tillgång till lån. Här är P2P‑utlåning, d.v.s. utlåning från långivare direkt till låntagare utan mellanhand (en. peer‑to‑peer, P2P) genom en webbservice, en viktig nyare serviceform. I och med att man inte kräver realsäkerhet eller finansiella mellanhänder erbjuder P2P‑utlåning en lätt tillgång till krediter med en lägre kostnad. Utöver detta erbjuder automatiserade webbtjänsterna även snabbare tillgång till kredit. Å andra sidan ökar frånvaro av säkerheten kreditrisken och risken blir ännu större i och med att de flesta långivarna inte är professionella investerare och ofta saknar analytiska färdigheter. Den höga risken i P2P‑utlåning betyder att långivare har ett stort behov av att kunna välja omsorgsfullt mellan de potentiella låntagarna. Avsikten i denna avhandling är att forska i evalueringen av kreditrisk och erbjuda stöd till beslutet att bevilja P2P‑lån. Kreditbedömning (en. credit scoring) är metoden som används i den statistiska evalueringen av kreditrisk och det primä ra målet i avhandlingen är att tillämpa prediktiva analytiska metoder i estimeringen av kreditrisk. Maskininlärningsmetoder tillämpas med avsikten att skapa modeller med hög prediktiv prestanda för mer exakt kreditbedömning. Efter att ha tillämpat diverse metoder att analysera kreditrisk erbjuder avhandlingen lösningar som möjliggör bättre identifiering av risker och bättre stöd till lånebeslut. För att man skall kunna estimera en realistisk avkastning för investeringar i P2P‑lån ska man beakta långivarnas kreditrisk på den risknivå som garanterar lönsamma investeringar. Man kan hitta olika risknivåer i P2P‑lån och kreditriskmodeller utvecklas för att stödja riskspecifika beslut. När riskevaluering tillämpas skilt i grupper av lånekontrakt med olika nivåer av risk får man som resultat exaktare identifiering av riskerna och mindre felklassificeringskostnader när man skiljer mellan lågrisk och högrisk låntagare. Med optimeringen av låneportföljer åstadkommer man en lönsam allokering av medlen i långivarnas investeringsbudget. Med portföljoptimeringen erhåller långivarna ett urval av lånekontrakt som de kan finansiera med sin investeringsbudget och som uppnår hög avkastningsnivå med en viss nivå av risk.
An alternative financial market with easy and quick access to loans has been emerging as a popular alternative to the traditional market. Peer‑to‑peer lending is one such popular market that connects borrowers directly to lenders through an online platform for loan transactions. With the absence of collateral and financial intermediaries, peer‑to‑peer lending provides an easy access to credits at a lower cost. Additionally, its online and automated operation allows for quick access to credits. However, the absence of collateral also becomes the source of credit risk. The risk is further increased due to most lenders being non‑professional investors and thus, lack analytical skills. Therefore, it requires careful selection of borrowers to prevent loss in presence of high risk in peer‑to‑peer lending.
The objective of this thesis is to study credit risk evaluation in peer‑to‑peer lending for supporting lending decisions. With credit scoring as the statistical tool for evaluating credit risk, the primary aim of the thesis is to apply predictive analytics for estimating credit risk. Machine learning algorithms are implemented to create more accurate credit scoring models with high predictive performance.
Implementing multiple approaches to analyzing credit risk in peer‑to‑peer lending, this thesis attempts to generate solutions for better risk identification to support lending decisions. For a more realistic estimation of return from peer‑to‑peer loans, return is estimated by accounting risk that ensures for profitable investments in the presence of risk to the lenders. Due to the presence of different risk levels in peer‑to‑peer lending, credit risk modeling is performed to create risk‑specific decisions. The risk evaluation performed at a group level contributes to more accurate risk identification and lower misclassification costs in differentiation between ‘low‑risk’ and ‘high‑risk’ borrowers. With portfolio optimization, lenders’ need for budget allocation in ensuring overall proϐit is achieved. Portfolio optimization supports lenders in loan selection with budget allocation to achieve a high return by accepting a certain level of risk.
Kreditrisk är en framträdande risktyp i den finansiella industrin och beskriver risken associerad till utlåning där det finns en viss sannolikhet att de lånade medlen inte fås tillbaka efter att låntagaren har försummat sina avbetalningar. Eftersom kreditrisken är direkt anknuten till långivares investering, blir den en signifikant risk med hänsyn till potentiella förluster. Förlusten orsakad av kreditrisk kan bli ytterst stor vilket gör riskbedömningen ett svårt men synnerligen betydelsefullt steg i beslutsfattandet. I och med att kreditindustrin växer, växer också sannolikheten av försummade lån och låntagarnas behov av att kunna bättre välja till vilka låntagare de kan bevilja kredit. Evalueringen av kreditrisk spelar en kritisk roll i att skilja åt de potentiella låntagarna till ”lågrisk” och ”högrisk” för att kunna förebygga förluster. Den alternativa finansiella marknaden har blivit ett populärt alternativ till den traditionella finansiella marknaden genom att erbjuda lätt och snabb tillgång till lån. Här är P2P‑utlåning, d.v.s. utlåning från långivare direkt till låntagare utan mellanhand (en. peer‑to‑peer, P2P) genom en webbservice, en viktig nyare serviceform. I och med att man inte kräver realsäkerhet eller finansiella mellanhänder erbjuder P2P‑utlåning en lätt tillgång till krediter med en lägre kostnad. Utöver detta erbjuder automatiserade webbtjänsterna även snabbare tillgång till kredit. Å andra sidan ökar frånvaro av säkerheten kreditrisken och risken blir ännu större i och med att de flesta långivarna inte är professionella investerare och ofta saknar analytiska färdigheter. Den höga risken i P2P‑utlåning betyder att långivare har ett stort behov av att kunna välja omsorgsfullt mellan de potentiella låntagarna. Avsikten i denna avhandling är att forska i evalueringen av kreditrisk och erbjuda stöd till beslutet att bevilja P2P‑lån. Kreditbedömning (en. credit scoring) är metoden som används i den statistiska evalueringen av kreditrisk och det primä ra målet i avhandlingen är att tillämpa prediktiva analytiska metoder i estimeringen av kreditrisk. Maskininlärningsmetoder tillämpas med avsikten att skapa modeller med hög prediktiv prestanda för mer exakt kreditbedömning. Efter att ha tillämpat diverse metoder att analysera kreditrisk erbjuder avhandlingen lösningar som möjliggör bättre identifiering av risker och bättre stöd till lånebeslut. För att man skall kunna estimera en realistisk avkastning för investeringar i P2P‑lån ska man beakta långivarnas kreditrisk på den risknivå som garanterar lönsamma investeringar. Man kan hitta olika risknivåer i P2P‑lån och kreditriskmodeller utvecklas för att stödja riskspecifika beslut. När riskevaluering tillämpas skilt i grupper av lånekontrakt med olika nivåer av risk får man som resultat exaktare identifiering av riskerna och mindre felklassificeringskostnader när man skiljer mellan lågrisk och högrisk låntagare. Med optimeringen av låneportföljer åstadkommer man en lönsam allokering av medlen i långivarnas investeringsbudget. Med portföljoptimeringen erhåller långivarna ett urval av lånekontrakt som de kan finansiera med sin investeringsbudget och som uppnår hög avkastningsnivå med en viss nivå av risk.