当前位置:首页 期刊杂志

基于集成评分卡模型的中小微企业信贷风险评估研究

时间:2024-09-24

摘要:中小微企业是我国经济发展的重要力量,但商业银行对这类企业普遍存在“惜贷”行为。银行通常依据企业交易票据信息等对其信贷风险做出评估,并依据相关因素来确定是否放贷及额度、利率等信贷策略。本文基于样本企业数据,用有效发票开票频率等指标作为反应供求稳定性等的因素,基于数据建立随机森林分类模型,并将相关数据代入模型进行训练,通过训练得到样本企业的信誉评级和是否违约,基于中的 Logistic 回归的评分卡模型,得到各个企业的风险评估得分与违约率,最后固定贷款总额为一亿时对额度策略与利率策略进行修正,得到该信贷總额下对 302 家企业的贷款额度和贷款年利率,并对信贷决策方案进行了修正。分析样本数据中 2020 年的价税合计数据,构造虚拟 GDP,通过分析 2020 年 1 月的虚拟 GDP,来自国家统计局的 2020 年第一季度、上半年的 GDP 数据,确定上下界[-10,10],从 10 个行业挑选出增长率在上下界以外的 6 个行业,利用熵权法确定各个行业的影响因子。把影响因子带入所得的违约率、评分卡分数,贷款额度等计算出修正后的贷款策略。

关键词:信贷风险;中小微企业;评分卡模型;logistics回归

中小微企业是我国经济发展的主心骨,创造了国内GDP的60%。但由于中小微企业规模相对较小,缺少抵押资产,不能有效满足金融机构相关的贷款要求,因此银行主要依据信贷政策、企业的交易票据信息和上下游企业的影响力向企业提供贷款,并对信誉高、信贷风险小的企业给予利率优惠。企业的信贷风险进行量化分析,并在年度信贷总额一定的情况下,制定银行的信贷策略。

1.数据来源

数据来源于2020年全国大学生数学建模竞赛C题。本文采用评分卡模型对小额贷款公司的客户信用进行评价。首先,建立信用评价模型,给出客户的评分和违约率,对好客户和坏客户进行筛选,然后采用额度策略和利率策略分别对每个企业计算贷款额度和贷款利率。

2.模型建立与求解

2.1评分卡模型分析

我们主要关注的是找到客户中会违约的客户,因为违约的客户毕竟是少数类的,因此我们通过召回率和 ROC 曲线来判断模型的好坏。

(1)ROC曲线:

所以我们可以从上图中得到我们判断对一个坏客户的情况下只会判错 0.08 个好客户,说明我们的评分卡模型有着很好的召回率(从所有客户中预测出本来是坏客户的概率),能够让我们的银行更好的在一开始就找到可能会违约的客户。

(2)评分卡刻度:

可以看出在违约率在分值低的时候呈现出一种指数式的下降,然后逐渐趋近于 0,所以能够看出分值低时客户违约概率很高,分数高时客户违约概率很低。因为会违约的客户分值肯定会很低,不会违约的客户分值肯定很高,因此计算出来的违约率相差会比较大,并且在分值低的时候跌柱线也明显大与分值高的时候的跌柱线,因此评分卡模型能够更好的将违约客户和不会违约客户分离开来。

(3)信贷风险评价策略

每个客户来银行贷款都需要填写申请表,然后我们让每个用户填上我们需要的指标,然后将其带入我们的评分卡模型就可以计算出每个客户的得分和违约率也就能帮助银行判断客户的好坏了。

2.2信贷策略模型

(1)信贷风险评价策略

每个客户来银行贷款都需要填写申请表,然后我们让每个用户填上我们需要的指标,然后将其带入我们的评分卡模型就可以计算出每个客户的得分和违约率也就能帮助银行判断客户的好坏了。

通过计算表达式我们能计算出间均值A0对应的常数K0,即相对最优的一个解,其中K0=55.6%,然后拟合出上图的折线,最后得到额度策略表达式:

2.3突发情况影响下中小企业信贷风险分析

(1)数据分析

在国家统计局上寻找产业的 2020 年第一季度 GDP 增长率和上半年增长率,对农林牧渔业,制造业,建筑业等企业类型进行分析:

住宿和餐饮业受到 2020 年最开始新冠疫情的影响最大,而信息传输、软件和信息技术服务业在新冠疫情的影响下反而有很大的一个提升,说明不同行业在新冠疫情的影响下会有不同的经济增长反应。

数据预处理:首先针对附件 2 筛选出 2019 年 1 月及 2020 年 1 月的价税总和,分别对进项、销项将不同行业的价税总和相加,再彼此相加。得到的数据记为 N,即表示该时间段内的虚拟 GDP(即只由该行业所有企业的进项价税总和和销项价税总和表示)。同时,从国家统计局得到 2020 年第一季度、上半年各行业的 GDP 增长率。

注:①所研究的行业仅有:农林牧渔业;制造业;建筑业;交通运输、仓储和邮政业;住宿和餐饮业;金融业;房地产业;信息传输、软件和信息技术服务业;租赁和商业服务业;其他服务业。②以下皆是基于 2020 年 1 月爆发的“新冠肺炎”疫情的研究。

(2)2020 年 1 月各行业相比去年同期的虚拟 GDP 的增长率

由数据结果分析可知:在“新冠肺炎”爆发的 2020 年 1 月,A(农、林、牧、渔业)的虚拟 GDP 拔高,其余行业的虚拟 GDP 为负值,其中,房地产业受影响最严重,虚拟 GDP下降率最高。

(3)2020 年第一季度、上半年各行业的 GDP 的增长率

由数据结果分析可知,H(住宿和餐饮业)对突发因素导致的市场波动最为敏感,其次是建筑行业,再来是信息传输、软件和信息技术服务业(稳正增长)和金融业。

(4)综合考虑 GDP 和虚拟 GDP

由数据分析结果可知,受新冠疫情影响严重的行业有:H(住宿和餐饮业)、E(建筑业)、I(信息传输、软件和信息技术服务业)、G(交通运输、仓储和邮政业)、J(金融业)。

综上所述,2020 年初在“新冠疫情”的影响下,受到影响较大的企业有:A(农、林、牧、渔业)、H(住宿和餐饮业)、E(建筑业)、I(信息传输、软件和信息技术服务业)、G(交通运输、仓储和邮政业)、J(金融业)。

(5)熵权法确定影响因子

① 判斷输入的矩阵中是否存在负数,如果有则要重新标准化到非负区间,这里有n =302 个要评价的对象,m =6 个评价指标(已经正向化)构成的正向化矩阵。对其标准化的矩阵记为z,判断z矩阵中是否存在负数,如果存在,需要对x使用另一种标准化方法。计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标的熵权对于第 j 个指标而言,有特殊的信息效用值公式,将信息效用值进行归一化,我们就能得到每个指标的熵权:A影响因子为1.1,H影响因子为0.5,E影响因子为0.7,I影响因子为1.5,G影响因子为0.8,J影响因子为0.8。

(6)引入影响因子的策略修正

用求出来的影响因子乘以对应行业的企业中对贷款额度和贷款年利率进行数据修正就可以得到在各企业的信贷风险和可能的突发因素(例如:新冠病毒疫情)对各企业的影响。那么还是展示前 15 个企业的贷款额度和年度贷款利率和修正后的违约率和修正后的分数。当有外部因素影响企业的时候要乘以对应行业的影响因子才能计算出真正的违约率,分值,贷款额度,最大贷款年利率。

参考文献:

[1]吴沈娟.供应链金融环境下中小企业信用风险评估——基于大数据的应用[J].时代金融,2020(20):93+95.

[2]段翀.基于PFM模型与倾向匹配得分法的中小企业信用风险评估[J].征信,2020,38(06):35-42.

[3]张天宇.基于KMV模型的上市中小企业信用风险评估研究[J].科技经济导刊,2020,28(16):229.

[4]张雯. 基于logistic回归的中小型企业信用评估[D].山东大学,2020.

[5]梁伟森,温思美.涉农中小企业贷款违约风险评估研究——基于“新三板”农林牧渔类企业数据[J].农村经济,2019(11):93-100.

[6]林海.“双创”背景下科技型中小企业创新项目风险评估模型构建[J].科技管理研究,2019,39(21):83-90.

[7]余得生,李星.供应链金融模式下的中小企业信用风险评估——以电子制造业为例[J].征信,2019,37(10):72-77.

[8]兰晓然.科技型中小企业信用风险评估——基于Adaptive Lasso-Logistic实证研究[J].华北金融,2018(08):69-75.

基金项目:本文系2021年安徽财经大学科研创新基金项目,项目编号:XSKY2156。

作者简介:卢悦冉(2001—)女,汉族,安徽亳州人,安徽财经大学金融学院,2018级本科生,金融学专业。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!