当前位置:首页 期刊杂志

基于复杂网络的企业信息特征挖掘及风控应用探索

时间:2024-04-24

赵 晖,朱子言

(1.江苏银行,江苏 南京210001;2.东南大学,江苏 南京211189)

当前,随着内外部环境的深刻变化,商业银行信贷风险管理面临多重挑战。一是各个经济主体之间的联动性越来越紧密,企业之间的股权、债权和资金往来关系错综交错,授信风险传染路径更为复杂,事前防控风险的难度加大。二是客户利用信息不对称,通过欺诈等手段套取银行贷款现象增多。三是银行客户内部业务信息管理分散,风控应用价值受限。四是可用于交叉验证的外部信息质量不高。同时传统的评分卡和评级模型也已无法满足日益复杂的风险环境。对此,随着大数据技术的逐步成熟,金融机构开始尝试运用大数据和复杂网络技术来构建便捷、直观的企业信息挖掘应用模式,以扬长避短,提高风控质效。文章探讨当下商业银行信贷业务风险管理面临的主要问题,介绍基于复杂网络的企业信息特征挖掘概念和方法,并提出银行应对挑战的举措及展望。

一、 信贷风险管理面临的主要问题

(一)企业复杂关联关系的识别能力不足

市场经济环境下投资主体逐渐多元化,跨地区、跨行业和集团化经营的企业越来越多,纳入集团合并报表范围内的母子公司或子子公司仅为关联客户类型之一,除此以外关联客户类型还有总分公司、家族式、合营联营、担保关联、产品关联、市场关联客户等,企业之间的关系错综复杂,也使得授信风险传染路径更为复杂。该类客户,尤其是关联度高的团系企业(如集团客户、实际控制团系企业、资金关联度高的企业、担保圈企业),一旦其中某一客户暴露风险,极易形成多米诺骨牌效应,无疑会给银行信贷资产安全造成重大威胁。针对该类风险防控,目前,商业银行可以通过查询企业工商信息、征信报告等手段掌握存在股权关联、担保关联的企业基本情况,但上述手段受制于查询不便捷,同时无法获取企业资金来往等信息,以致应用价值大大受限。部分银行则专门开发了企业关联图谱,通过整合工商数据、征信数据以及线下调查信息项下企业对外对内担保、投资和实际控制情况等客户信息逐户展现企业关联关系,但仍存在展示维度不足、风险揭示不充分的问题。

(二)鉴别信贷业务真实性手段传统单一

信贷业务真实性是银行信贷决策的前提条件,银行信贷申报人员往往通过现场走访了解客户实际经营情况、盈利模式、结算方式、往来交易等信息。信贷审批和风险管理人员在进行信贷业务审核或风险排查时通过企业提供的信贷业务申请资料和银行内部掌握的企业存取款信息、交易信息及基本信用评级等来判断企业贷款需求真实与否。然而受制于信息不对称,特别是在宏观经济探底期,企业通过提供虚假信息及材料套取银行贷款的现象在增多,主要涉及以下几方面:一是通过没有实质现金流的关联交易增加业务往来记录,美化财务报表相关数据,调整和控制企业的资产负债结构和经营成果,使各项财务指标符合机构借贷条件;二是通过企业间相互投资参股,虚增资本,营造公司资本雄厚的假象;三是私下互保;四是虚构贸易背景和贷款项目,使商业银行无法通过现场调查、第三方数据交叉验证以及逻辑推导等方式核实企业的真实状况,致使不法企业套取或挪用银行贷款成为可能。

(三)银行客户内部业务信息不完整、管理较分散

在商业银行风险管理中,内部数据对风控发挥着重要的作用。国内商业银行数据建设普遍为业务驱动型,即根据业务单元进行划分管理,以最先满足业务单元需求,这产生了客户业务信息分散化、口径差异化的问题,以致相关数据价值难以被充分挖掘。特别是在当前银行理财、公司类基金、信用债承销及投资等业务规模迅速膨胀的大背景下,银行除需加快相关数据互联互通外,还应探索其他数据应用模式,以克服条线数据不完整、不共享的缺陷。

(四)可利用的企业外部信息质量不高

在信贷风险类型多样化、复杂化的大背景下,银行内部数据已远远不能支撑银行信贷风险管理工作,大部分商业银行已普遍开始布局涉及授信客户的外部数据挖掘和分析工作。但可利用的外部数据普遍存在硬数据少、质量不高的现象。结合部分银行的实际情况看,工商数据、金融市场数据、手机验证、个人户籍、学籍学历等数据获取相对容易,但税务、水电等“硬数据”获取难度较大。同时从不同渠道获取的同类外部数据,或多或少存在重复、缺失等问题,这也给数据风控应用增加了难度。

二、 基于复杂网络的企业信贷风险特征挖掘及风控应用

(一)复杂网络技术应用于企业特征挖掘概述

复杂网络技术是以企业为核心,利用信贷客户授信基本情况、财务指标、行为信息以及商业银行引入的征信、失信人等信息为数据源,运用复杂网络建模挖掘结构特征,建立起企业授信要素之间的联系,结合行为信息计算行为特征,研究企业与企业之间、个人与企业之间以及个人与个人之间的投资、担保、实际控制人、高管等复杂关联关系,并以直观的图谱形式展示,以供授信管理人员识别和防控信贷风险。该技术因运用了复杂网络建模,一定程度上能克服内外部数据缺陷对风险识别造成的负面影响。

(二)网络图谱展示方法

以文章研究的企业网络图谱为例,图1 表示的是企业之间的网络关系,每个节点代表的是一个信贷企业客户,节点之间存在的连线若为实线则表示企业之间存在担保关系;节点之间存在的连线为虚线则表示企业之间存在资金往来,在图中分别表示为关联1 和关联2。如图中A 与C 之间有连线且为实线,因此说明A 企业为C 客户的贷款担保或者C 企业为A 企业的贷款担保;A 与B 之间有连线且为虚线,因此说明A 企业贷款客户与B 企业贷款客户之间存在一定的资金往来。并且,若与一个企业存在担保关联或资金往来关系的企业越多,则代表该企业的节点越大。因此,通过网络图谱可挖掘出企业在整个信贷网络之中的关系特征以及地位。

图1 企业之间的网络关系图

(三)复杂网络建模挖掘优势

一是刻画企业网络结构以及风险特征。复杂网络能够较为完整地刻画企业担保圈结构、资金往来关系、派系特征等,通过模型算法将授信企业划分成团,进行团伙性分析,根据图论上的属性,如团的密集程度和某些路径的关键程度、图直径等角度来估计风险。二是弥补有限的内外部数据缺陷,弱化数据真实性影响等问题。一方面,利用复杂网络可以提取企业行为特征,传统企业行为特征大部分来源于外部数据但相对稀疏,复杂网络可以一定程度地解决外部数据稀缺和有效性欠佳的问题,作为预测信贷风险的有力补充。另一方面,复杂网络通过对涉及授信企业基本信息和授信特征的深入挖掘,计算出大量的有效关联信息,可以提升风险预测精度。三是解决中小企业风险评价成本高、手段少的问题。通过复杂网络建模挖掘,能较快地形成企业特征图谱,并能识别涉及包括集团关系、担保关系、资金关系等风险,除能应用于大企业风控外,同样也可以适用于中小企业贷款的风险管理,如结合中小企业授信流程优化,可大幅降低中小企业风险管理成本。同时随着可利用数据的多元化,如加入企业供应链、外部投资等信息数据,银行对企业风险的评价范围和尺度也将更加全面和有效。

(四)模型实施

1.根据业务流程定位模型数据

文中复杂网络建模主要针对对公授信客户,数据主要包括两大类,分别是某城商行内部数据和外部征信数据。数据直接描述企业在整个业务流程中的行为以及关联关系的形成,并从内部业务系统获取客户业务、预警等相关数据,按主题进行汇总。

2.特征提取

基于处理好的数据,论文从以下维度提取特征:一是企业基本信息特征。定性地反映企业的基本情况、信用及还款能力等,如企业规模、所有权性质、所属行业、是否集团客户等。二是结构特征。描述客户所在网络关系中的结构特征,企业在图中所处的位置对其他节点产生的影响,比如客户在图中的影响程度值。文中结构特征涉及担保关联、资金往来、集团关联和派系关联等。

我们利用Python 的Networkx 库构建数据结构。每个网络图谱均可转化为邻接矩阵的形式,其中网络图谱的每条边均可对应于矩阵中的一个元素。又由于文中网络图谱均为无向图,因此所有边均可对应为邻接矩阵中的两个对称元素,且邻接矩阵为对称阵。

如图2 所示,根据复杂网络理论,关联网络可由邻接矩阵A={aij}的形式唯一给出。其中aij=1 表示i企业与j企业之间存在关联,值为0 则表示不存在关联。假设i企业的特征为wj,则j企业受i企业行为传染的结果为aij×wj。即若i企业与j企业之间存在关联,则i企业对j企业的特征的贡献为wj。因此,对于一个已知网络关联关系或邻接矩阵,根据所有企业的特征向量W=[w1,w2,…,wj]可以计算出j企业受传染的特征为∑n i aij×wj。根据高等代数知识,我们定义行为特征为经过传染的特征,可具体用线性代数中的内积表示如下:ω=A×w=[ω1,ω2,…,ωn]。其中,j企业的特征为ωj=因此,依据企业关联关系挖掘,可以分别输出企业特征。进一步通过聚类分析即可挖掘特征与潜在风险标识之间的关联。如果将所有特征通过降维得到唯一的风险特征因子,结合关联图谱可以得到如图3 所示效果。

图2 关联网络创建

图3 关联效果

由此,风险特征因子与潜在风险标识之间的关联可以分割为两个层面。一方面,风险特征越大的集团派系会具有越大的潜在风险标识发生概率。另一方面,同一集团或派系的企业具有相近的风险特征的同时,也会具有相似的潜在风险标识情况。这一结果将进一步表明网络图谱对于风险特征挖掘和风险预测的作用,同时给风险管理提供有力建议,即对集团或派系风险进行有针对性的提前预防和监控。

3.模型效果

论文所涉及的图谱呈现明显的无标度特征,即网络中少数称之为Hub 点的节点拥有极其多的连接,而大多数节点只有很少量的连接。从复杂网络理论来看,无标度网络的整体结构对抗风险的稳定性较强,而个别节点的风险传染效应较为明显。这一特征可由双对数坐标轴下的度累积分布图佐证。

根据复杂网络理论,无标度网络十分符合现实社会网络结构的形式,其中重要节点产生变化,将对整个网络产生巨大影响。而从风险管理角度来看,如果重要节点产生风险,将迅速传染至其关联节点。一方面,重要节点关联企业较多,被高风险企业牵连的可能性较大;另一方面,重要节点由于其自身关联企业较多,控制风险和解决短期流动性问题的能力较强。总的来说,节点的重要性与其自身风险之间存在一定关联关系。

由此,我们定义结构特征为节点重要性,可以用节点度来表征。节点度即与该节点关联节点的个数,对于有向图则分为入度和出度。节点度可以根据网络结构计算得出,若网络图以节点度作为节点大小,则可以清晰看出重要节点的位置。

三、 启示和展望

(一)强化网络图谱风险防控应用

一是持续优化图谱展示功能。利用文章所述的复杂网络技术可以将银行掌握的企业信息结构化,银行可以把企业基本情况、授信情况、内部数据和外部信息等多维度信息整合到一张图谱中,并可结合内部数据整合和外部数据引入,持续优化图谱展示功能,从而不断提升信贷风险识别和防控能力。二是加强图谱在信贷“三查”中的应用。结合图谱展示的风险状况,客户经理可根据风险揭示信息开展针对性的现场核查,审查审批人员可判断企业是否存在关联关系风险、担保圈风险、供应链风险、贷款被挪用等风险,并可根据潜在风险状况采取针对性的授信方案。

(二)挖掘企业内部信息,丰富特征维度

银行可进一步搜集企业风险数据并进行挖掘处理,通过关联业务分析和数据可视化建设,探索并实践大数据分析方法。对海量客户信息开展多维度挖掘,并根据业务风险排查结果总结经验,梳理客户风险图谱多维度展现客户基本信息、风险信息、银行业务与往期风险处置信息,将客户全方位风险要素可视化,提升风险信息挖掘处理和关联业务分析能力。将风险客户的资产情况、社会关系、行为轨迹等信息横向关联、纵向发掘,可以支持风险信息的交叉分析验证和风险评估,提升风险客户评价的可靠性和准确率。内部风险信息在银行各业务条线的自动调用与实时展现,可以丰富业务风险防控的预警模式与参考要素,为客户风险分析与处置提供保障,为银行业务稳健安全发展提供支持。

(三)建立不良授信案例库,提升模型效果

对于很多中小型银行,因业务规模及信息系统建设滞后等原因,不良授信的案例库要么缺失、要么案例较少,尤其是对于结构化融资、投资基金等类信贷业务,不良案例库更是少之又少。由于案例库的缺少,目前风头正劲的机器学习等新的风控技术难有用武之地,大数据风控技术、模型的效果难以得到充分的验证,基本只能通过对传统业务客户的历史违约情况进行分析,以此来评价风控模型效果。为此,中小银行应持续构建不良授信案例库,并通过模型校验,持续完善本行的风控技术。

(四)将人工智能技术应用于客户风险分析

随着国内“双创”政策的推动和对人工智能产业的投资拉动,人工智能技术已广泛运用于各行各业,国内金融行业已经逐步开始应用人工智能技术,比如平安集团下设平安科技人工智能实验室研发人工智能金融应用等。在授信决策方面,人工智能技术可以将不同来源的数据整合到一起,分析企业的信贷特征,将不同的企业进行分类。比如将已进入诉讼流程的出险客户直接标记为“司法诉讼”,并提醒相关人员及时开展处置工作。通过提取企业或法人在网络或社交媒体等领域的信息,比如观测企业或其产品在搜索网站的搜索数量、在微博中被提及的次数或获得的评价来判断贷款企业综合实力。在反欺诈方面,人工智能技术中的机器学习可以利用信贷企业的交易特征和正常贷款数据,学习什么是好的贷款,什么是坏的贷款,推测信贷业务风险点,提升银行风险识别能力,推动银行信贷评价体系向更科学的方向发展。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!