当前位置:首页 期刊杂志

基于生存分析法的P2P网络借贷违约风险研究

时间:2024-09-20

摘要:近年来,P2P网络借贷平台的发展十分迅猛,但其背后隐藏的风险也是不容忽视的,尤其是借款人违约的风险。对于借款人违约风险影响因素进行的研究,有利于借贷平台和投资者合理规避风险。本文运用生存分析的方法,建立了cox比例风险模型,基于lending club的贷款数据,对P2P网络借贷借款人的违约风险进行了实证研究,并依据研究结论针对P2P网络借贷平台及投资者提出建议。

关键词:P2P网络借贷;违约风险;生存分析;cox比例风险模型

一、引言

P2P 网络借贷是一种不需要以银行等其他金融机构作为中介,个人和个人间直接发生借贷,并借助互联网平台完成相关交易步骤的借贷行为。近年来,P2P网络借贷随着互联网的蓬勃发展也得到了快速的发展,其数量和成交量都呈现出不断增长的趋势,但同时累计的问题平台数量也在激增。因此,p2p网络借贷在为借贷双方提供便利的同时,也使投资者和平台面临着诸多风险,其中最为普遍的就是借款人的违约风险。违约风险,也称信用风险,是指借款人因种种原因, 不愿或无力履行合同条件而构成违约, 致使出借人或者中介平台等交易对手遭受损失的可能性(王书斌等,2017)。由于借款人发生违约时,不仅会使投资者遭受损失,而且使得越来越多的平台出现资金流停滞、提现困难、甚至跑路等不良现象。所以,对于p2p网络借贷平台中借款人违约风险的研究具有十分重要的意义。

二、相关文献回顾

目前P2P网络借贷违约风险的评估是国内外研究的热点问题,许多学者都对其进行了研究,已有的研究常用的方法是Logistic回归方法和Probit回归方法,如Pope 和Syndor ( 2011) 通过构建Logistic回归模型,并基于平台Prosper 的数据进行相关实证研究,实证结果表明借款人的性别、种族等特征对借款人的违约风险有影响。徐喆(2015)建立Probit模型对P2P网络借贷业务违约风险的相关因素进行了实证研究,研究发现:(1)客户的违约记录、借贷时间、银行存款数额、工作状态、个人财产、户口所在地这些变量对借款人的的违约可能性有着较为显著的影响;(2)房贷情况、年龄、电话号码的影响能力则较差。还有一些学者运用了BP神经网络分析的方法、决策树和支持向量机(SVM)算法等。宋丽平等人(2015)构建基于BP算法的神经网络模型,并选取借款人性别、年龄、文化程度、婚姻状况、工作年限、收入状况、房产状况、购车状况、借款成功次数及逾期笔数等作为评价指标,对借款人的信用状况进行评估,研究发现该模型适用于贷前对借款人信用状进行预测。

此外,还有少量学者将生存分析法引入借款人违约风险的评估中,生存分析法是研究生存现象和响应时间数据及其统计规律的一种分析方法,最初主要应用于医学、生物学领域,近年来越来越多的学者将其引入到金融、财务、统计学等领域中,如Emekter et al.(2015)运用Cox模型考察借款期限与违约率之间的关系,证明了借款期限越长违约可能性越大。

虽然这些传统的回归方法也可以对借款人的违约风险及其影响因素就行测算,但是这些模型只能对违约风险进行静态的评估,而生存分析方法还能对贷款在不同时点的违约可能性进行动态的预测分析。

因此,本文拟在前人的研究成果的基础之上,运用生存分析的方法,基于美国的P2P网络借贷平台Lending Club的借贷数据,构建Cox比例风险模型来探究P2P网络借贷借款人的违约风险,分析哪些因素与借款人的违约风险有关,以期对P2P网络借款人的风险进行有效的评估。

三 、生存分析方法

生存分析是用来分析生存现象与生存时间之间的关系及其规律的一种统计方法。生存分析是一种既考虑结果又考虑具体的生存时间的统计方法,它可以对生存时间的分布特征进行描述,还可以对影响生存时间的因素进行分析。

生存时间是指从某个时间点到另一个时间点之间的间隔。完整的生存时间数据具有三个要素:观察起点、观察终点及关心的特定事件。生存时间数据根据其完整性,可以分为两大类:

(1)完全数据,又称非删失数据,是指研宄对象的观测数据完全落在观察起点和终点之间,即我们关心的事件出现在观测期内,生存时间数据的三要素是完整的。

(2)删失数据,是指关心的事件出现在终点事件之前,观测过程由于失访、退出或研究时限已到而终止了。删失数据又可以根据删失情况的不同分为:左删失、右删失和区间删失。左删失数据是指在观察起点开始之前,研究所关心的事件就已经发生;右删失数据是指到了观测终点,研究所关心的事件仍然没有发生;区间删失是指无法完整地观测到所关心的事件确切的发生时间。

四、实证结果

本文主要对借款人的违约风险进行研究,主要从借款信息和借款人信息两大类信息中选取12个可能会影响借款人违约风险的变量(见表1)。

本文选择以美国典型的P2P网贷平台——Lending club作为研究对象,选取了 Lending Club 公司2012 年借贷交易数据来进行实证研究,其贷款最终的还款状态目前是已知的,分别为 Fully Paid /Default/Late (16-30 days)/ Late (31-120 days)/Charged Off/In Grace Period,其中Fully Paid视为全额还款,其它狀态均视为还款逾期,即发生违约。本文共提取了lending club 2012年的53367条借贷数据作为初始样本,对数据做处理及删除缺失数据后得到48180条有效数据,其中发生违约的数据有8000条,违约率大概为16.60%。

借款信息主要是指那些与每笔贷款有关的信息及特征。主要包括以下五个方面:

(1)借款金额,即借款金额总额。

(2)借款期限,是指借入一笔贷款的期限。

(3)借款利率,是指借款人为了获得贷款而必须支付的借贷成本。

(4)月还款额,是借款人借入一笔贷款后每月需要偿还的金额。

(5)信用等级。Lending Club平台基于借款人的 FICO 等信用得分以及借贷金额等借贷特征,对每笔贷款进行评级,分为 A、B、C、D、E、F、G 七个等级,等级依次递减,见表2。

借款人信息主要是指借款人本身具备的特征情况。主要包括以下几个方面:

(6)年收入,美国对P2P 网络借贷借款人规定了年收入最低限额。

(7)工作年限,是指借款人有稳定收入的时间。

(8)住房拥有情况,目前的房产情况主要分为三大类:自有住房(own)、按揭住房(mortgage)、租房(rent)。

(9)债务收入比,是指借款人的借贷金额与其年收入的比值。

(10)额度循环利用率,是指借款人目前已经占用的循环贷款额度与其循環贷款总额度的比值。

(11)过去 2 年内超过 30 天的逾期欠款次数和被公开的不良记录次数。这两项指标都反映了借款人信用记录中发生的不良行为次数。

五、结论及建议

本研究主要得出以下结论:

(1)借款期限、年收入以及额度循环利用率属于保护因子。它们降低了贷款发生违约的可能性。

(2)借款利率、信用等级、债务收入比和被公开的不良记录次数属于危险因子。它们增加了贷款发生违约的可能性。

(3)借款金额、月还款额、工作年限、住房拥有情况和过去两年内超过30天的逾期欠款次数这四个变量与贷款发生违约的概率之间没有显著关系。

根据以上的研究结论,本文针对p2p网络借贷提出以下建议:

平台应当对每笔贷款确定合理的借款期限、借款利率和信用等级。由于这三个与借款信息相关的变量与借款人违约风险存在紧密的联系,因此平台应当予以重视。首先平台应当选择恰当的方法对借款人的信用等级进行评估,并在此基础上为不同借款人设定合理的借款利率和借款期限。

平台应尽可能地收集并验证借款人信息。由于p2p网络借贷存在严重的信息不对称性,投资者能够获得的信息是有限的。P2P 网络借贷平台作为借款人和投资人的中间平台,应当对借款人的年收入、额度循环利用率、债务收入比以及被公开的不良记录次数等信息进行收集,并进行严格地验证,以供投资人在作出投资决策时参考。

第三,投资者在对借款人进行选择时,也应对风险和收益有正确的认识,不要盲目或者从众,投资者要学会主动对借款信息和借款人信息进行分析,并做好风险管理,以降低违约风险。

参考文献:

[1]王书斌,谭中明,陈艺云.P2P网贷违约风险及其传染性评估综述[J].武汉金融,2017(6):40-44.

[2]Pope D G,Sydnor J R.What's in a Picture?: Evidence of Discrimination from Prosper.com[J].Journal of Human Resources, 2011, 46(1):53-92.

[3]徐喆.逻辑回归模型在互联网金融P2P业务信用风险的应用[J].统计科学与实践, 2015(11):26-29.

[4]宋丽平,张利坤,徐玮.P2P网络借贷个人信用风险评估[J].财会月刊,2015(35):94-96.

作者简介:刘琼,湖北孝感人,汉族,1992年3月生,硕士,工商管理专业,现湖北商贸学院会计学院专职教师,研究方向为审计学。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!