您好, 访客   登录/注册

P2P网贷借款人违约风险影响因素研究

来源:用户上传      作者:

  摘要:P2P网贷在爆发式增长的同时,也面临着重大的信用风险,对借款人违约风险的预测是降低信用风险的重要方法。以“人人贷”平台上采取的数据为研究样本,构建借款人信用评价指标体系,采用二元Logistic回归模型建立借款人信用风险评估模型。结果表明,借款期限、借款人年龄、信用评级、逾期次数对借款人信用风险影响最为显著,其次是学历、成功借款次数、借款利率和房产。
  关键词:P2P网贷;信用风险评估;二元Logistic回归模型
  中图分类号:F830.39         文献标识码:A
  文章编号:0439-8114(2019)04-0103-05
  Abstract: While P2P is experiencing explosive growth, it also faces significant credit risks. The prediction of borrower default risk is an important method to reduce credit risk. Taking the data taken on the platform of "Everyone's Loan" as the research sample, the credit evaluation index system of borrowers is constructed, and the dual-logistic regression model is used to establish the credit risk assessment model of borrowers. The results show that the borrowing period, the borrower's age, credit rating and overdue times have the most significant impact on the borrower's credit risk, followed by education, successful borrowings, borrowing rates, and real estate.
  Key words: P2P; credit risk assessment; dual-logistic regression model
  2013年是中国的互联网金融元年,互联网技术与金融行业的深度融合促进了互联网金融的迅猛发展。互联网金融的出现影响了传统金融业的格局且催生了新的支付方式和融资模式,大大促进了中国经济的发展。其中,P2P(Peer-to-Peer Lending)网络借贷是互联网金融模式的主要代表之一。
  P2P网络借贷作为金融行业的新兴产业,将民间借贷与互联网金融的特点结合起来,这种新的业务模式相较于传统的金融模式,具有操作便捷、效率更高等优点,缩短了交易距离,提高了交易效率,节省了交易时间,满足了不同层次的金融需求,弥补了传统金融业的短板,因而在中国蓬勃发展起来。根据“网贷之家”的数据显示,截至2016年11月30日,中国的P2P網贷平台已达5 879家,相比2015年新增744家;年成交额为2.8万亿元,相较于2015年增长137.59%。但是,行业呈现爆发式增长的同时也面临诸多问题,非法集资、借款人“跑路”现象层出不穷。截至2016年年底,停业及问题平台数量累计达到1 478家,网贷平台普遍存在10%~20%的坏账率,显著高于传统的金融借贷。网贷平台的高风险主要来自两个方面,一方面是政府加强了对信用监管方面的力度,外在的压力导致许多网贷平台难以发展;另一方面,由于网贷属于无抵押贷款,借款人违约成本较低,若大量客户违约,将会导致账款无法催收,平台资金流停滞、无法正常提取资金,威胁平台持续稳定经营。因此,个人信用风险已经成为网络借贷平台面临的主要风险之一。在此背景下,对平台上借款人违约风险的影响因素进行研究显得格外重要。
  本研究采取爬虫技术从“人人贷”平台上选取了2014年4月至2017年10月的借款人相关数据作为研究样本,引入二元Logistic回归模型作为研究方法,从借款人基本情况、借款产品信息、历史信用3个方面构建指标体系;为了提高模型准确性,使用WOE值对变量进行处理,将WOE值替代原值代入模型进行回归,力求找出影响借款人违约风险的主要因素,以提高网贷平台和投资人通过借款人信息来辨识其违约概率的能力,降低网络借贷的信用风险。
  1  文献综述
  网络借贷的迅速发展,引起了学术界的广泛关注,国内外学者进行了不少关于网络借贷信用风险的研究。
  关于信用风险揭示的研究,Michels[1]以Prosper网站上的数据为基础,研究发现网络借贷平台责任的确认会导致网络市场运行有效性下降,进而会带来较大的风险。Lee等[2]通过韩国最大的网贷平台上出现的“从众行为”发现,该行为会导致网络借贷信用风险加大,网络借贷市场上的信息不对称现象非常严重,进一步还会导致道德风险。杨宇焰等[3]通过对四川省的11家网贷平台进行调研,提出网贷中主要风险来自于缺少相关立法和部门监管、借款人违约、操作风险和流动性风险、平台自身资本实力和管理风险。卢馨等[4]认为网贷平台上存在的主要风险是因法律和监管缺失而导致的政策法律风险和监管风险,操作上的不规范和技术投入不足而导致的操作风险和网络风险以及由于借款人道德缺失而引发的信用风险。
  关于信用风险影响因素的研究,Lin等[5]研究发现,若借款人P2P平台上有好友,则容易获得借款,且借款利率也更低,同时违约率也更低,说明关系网络能在一定程度上起到识别借款质量的作用。Gonzalez等[6]从借款人的个人特征入手,研究其对网贷决策的影响,研究结果表明,借款人性别、年龄和外貌影响其借款成功率。Emekter等[7]通过研究信用等级对于网贷借贷信用风险的影响,发现借款人信用等级与违约风险发生率呈反比,信用等级越高违约率越低,信用等级越低则违约率越高。董梁等[8]通过分析“人人贷”上的数据,建立新进借款人信用风险评估模型,认为年龄、性别、岗位职位、工作认证、借款用途和实地认证指标应该作为评价个人信用风险的主要根据。肖曼君等[9]采取排序选择模型从多个P2P网站上截取数据,从借款信息、历史表现、信用变量以及人口特征4个方面选取影响信用风险的变量,研究发现这4个因素分别对网络借贷信用风险存在正向影响。王会娟等[10]通过研究描述性信息对网贷行为的影响发现,借款人信用等级越低,越倾向添加描述性信息;另一方面,若借款描述展示的人格数量越多,则更容易获得借款且借款人违约率越低。   关于信用风险评估方法的研究,主要方法有Logistic回归模型、BP神经网络、决策树、层次分析等方法。Bekhet等[11]分别使用Logistic回归模型和径向基函数模型构建信用评分模型,结果表明,Logistic回归模型比径向基函数模型更为准确,但径向基函数模型更能准确地识别出潜在违约者。Oreski等[12]提出了将遗传算法和神经网络的混合算法(HGA-NN)相结合来进行信用风险评估,结果发现,HGA-NN算法相较于遗传算法在信用风险评估中的特征选择和分类方面具有较大优势。宋丽平等[13]以平台借款人个人信用等级作为预测输出目标,运用BP神经网络模型研究发现,借款人自身的客观条件、还款能力、历史表现都会对P2P网络借贷个人信用风险产生重要影响。姚凤阁等[14]采用“拍拍贷”平台上的经验数据,联合采用Logit和Probit回归模型研究借款人信息与信用风险之间的关系,认为信用等级、投标成功次数、投标失败次数、借款利率对借款人的信用风险有显著影响,而借款期限、性别、年龄则对借款人信用风险无显著影响。
  通过对现有文献的梳理和总结可以发现,由于国外网贷发展相比国内较为成熟,征信体系比较完善,且数据也对外公开,关于网贷的研究成果较为丰富。国外学者不仅进行了如平台监管、平台发展模式、平台面临风险等定性分析,也有如借款成功率、P2P网贷平台违约风险影响因素等定量分析。国外学者的研究成果对中国网贷信用风险的研究有重要的参考意义。然而,国内P2P网贷行业目前处于初级阶段,关于网贷的研究起步比较晚,没有完善的征信体系,监管比较滞后,缺少法律约束,学者对网贷行业的研究以定性分析为主,主要集中在网贷平台的监管、风险控制、平台运营模式等方面,很少从定量的角度研究网贷的信用风险。基于此,本研究从定量的角度出发,利用“人人贷”平台上的真实数据,建立借款人信用风险评估模型,力求找出影响借款人违约风险的主要因素,以帮助网贷平台和投资者更好地识别借款人的信用风险。
  2  研究方法與指标选取
  2.1  研究方法
  选取经典的二元Logistic回归模型,研究借款人信息与其违约行为之间的关系,因变量为借款人是否违约,为典型的二分变量,定义为“违约=1,未违约=0”,且为非连续变量,因此需要使用非线性回归。Logistic回归模型是一种研究二分类被解释变量与一些影响因素之间关系的一种多变量分析方法,模型中的自变量可以是定性的也可以是定量的。
  2.2  数据来源及说明
  “人人贷”作为中国互联网金融业的领军企业,对借款人和借款标的的审批比较严格,对每一组贷款有详细的记录,因此数据的完整性比较好。本研究采取爬虫技术从“人人贷”平台中的“散标投资”和“债权转让”随机抽取了2014年4月至2017年10月的相关数据。抽取到的原始样本数据含有大量与个人信用风险无关的数据,如借款人编号、借款人昵称等,若加入模型,会干扰模型的准确程度;另外,原始数据有些是字符型格式,回归模型只能识别数值型格式,需要把数据统一设置为数值型格式。
  借款人列表中借款人信息包括借款信息(借款用途、标的总额、借款利率、借款期限、借款性质、还款方式、标的状态、借款人来源、对借款的描述、垫付金额);借款人个人信息(出生年月、性别、学历、用户名、婚姻状况、户籍、工作情况、公司情况、房车产情况);借款人信用信息(信用评级、信用分数、信用额度、逾期情况);借款担保信息(担保方式)。为了得到干净且完整的数据,删除了部分借款人信息缺失和信息无效部分,共获得有效完整的数据10 863条。需要说明的是,“人人贷”平台中“垫付金额”表示借款人未还清贷款,平台为其垫付,表示借款人违约,有垫付金额记录的为违约客户。10 863条数据中,有9 270条是未违约客户,即“好客户”;有1 593条是违约客户,即“坏客户”。
  2.3  变量选取与处理
  目前网贷平台对于个人信用风险评估的指标并没有统一的标准和规范,指标的选取直接关系到模型预测的准确性。综合考虑影响信用风险的各项因素,选取借鉴了传统信用风险评估体系和网贷平台的特征信息及其实际的业务需求,参考国内外相关文献所选取的指标,遵循指标能容易获得、能够反映借款人的还款能力和意愿,从借款人基本情况、借款产品信息、历史信用3个方面,构建了定性和定量指标相结合的网贷平台个人信用评价指标体系。选取13项指标作为借款人信用风险评估的具体指标,具体分组见表1。
  选取的样本数据中,既有序数型(如信用等级)变量,又有区间型(如收入)变量,且每个变量的取值区间和量纲存在较大差别,为了降低变量属性、平滑变量变化趋势、提高模型的评估水平,应对变量的取值进行分箱计算证据权重WOE(Weight of Evidence)值。WOE值是对原始自变量的一种编码形式,用来衡量变量某个属性的风险指标,WOE值越高,代表着该分组中客户是“坏客户”的风险越低。其计算公式如下:
  3  结果与分析
  3.1  多重共线性分析
  本研究选取的变量比较多,若不考虑变量之间的线性相关性,盲目地进行回归分析,往往达不到理想的结果,甚至会导致错误的结论。为了判断变量之间是否线性相关,先用SPSS 17.0软件进行共线性诊断,结果见表3。
  由检验结果可知,方差膨胀因子VIF值均小于10,表明变量之间不存在高度多重共线性问题。另外,容差在0.1的标准下,若有变量容差小于0.1,则表明存在多重共线性,结果中的变量无小于0.1的值,也说明了变量之间不存在多重共线性问题。说明选取的指标直接相互独立,可以用于回归模型。
  3.2  实证检验
  由回归结果可知,在a=0.05的显著水平下,P≤0.05的变量有借款利率、信用评级、房产、成功借款次数、借款期限、年龄、学历、逾期次数,说明这8项指标都显著影响借款人的违约率,其中,借款期限、年龄、信用评级、逾期次数4项指标对借款人违约率影响最为显著;房产、借款利率、成功借款次数、学历次之。其他5项指标即工作时间、车产、收入、婚姻、性别则对借款人违约率影响不显著。   1)借款人基本情况(年龄、学历、房产)对违约率有显著影响。年龄与借款人违约率呈显著正相关关系,借款人年龄越大违约率越大,这可能与年长者相对于年轻人来说工作效率降低,收入不如年轻人;学历与借款人违约率呈显著负相关关系,借款人学历越高违约率越低,可能是学历较高者工资起点高,且受到的道德約束力相对较强;有房产与借款人违约率呈显著负相关关系,借款人有房产违约率会降低,这可能与借款人无房贷压力,经济较为宽裕,还款能力更强有关。
  2)借款产品信息(借款利率、借款期限)对违约率影响显著。借款利率与违约率呈显著负相关关系,借款利率越高违约率越高,较高的利息会给借款人带来更大的压力,使其不能如期还款;借款期限与违约率呈显著负相关关系,借款期限越长违约率越低,可能是由于借款期限越长,每月所需还款金额越小,借款人还款压力越小。
  3)历史信用(信用评级、成功借款次数、逾期次数)对违约率影响显著。借款人信用评级与违约率呈显著负相关关系,借款人信用等级越高违约率越低,较高的信用评级说明借款人信用资质较好,违约概率比较小,信用评级可以作为贷款人贷款给借款人的一项重要参考指标;成功借款次数与违约率呈显著负相关关系,在平台上借款成功次数越多借款人违约率越低,借款人多次在平台上借款成功说明个人信用资质较好,平台愿意贷款,故违约可能性较低;逾期次数与违约率呈显著负相关关系,借款人违约次数越多违约概率越大,借款人多次违约说明个人信用资质较差,贷款人对这类借款人应持有谨慎态度。
  4  结论与建议
  本研究基于“人人贷”网贷平台上借款人真实数据,根据中国P2P网贷平台特征,从借款人基本情况、借款产品信息、历史信用3个方面建立了适合P2P网贷平台的借款人信用风险评估体系。引入了稳定性较高的Logistic回归模型,得出影响借款人违约风险的主要因素是借款期限、年龄、信用评级、逾期次数;其次是学历、成功借款次数、借款利率、房产,可以为P2P网贷平台和投资人识别借款人违约风险提供一定参考。但研究选取样本数据及验证数据规模有限,可能会导致试验结果有一定的偏差;P2P行业体系本身正在不断发展,本研究的指标选取仅借鉴了前人的研究成果,存在一定的滞后性,且严谨性不足。基于上述结论,结合中国P2P网络借贷发展实际,分别从P2P网贷平台内部、之间和外部层面提出以下几点建议。
  1)平台内部。信用评级对贷款人有重要的参考意义,平台内部可以建立统一规范的信用评分系统,帮助投资者有效测评借款人的信用信息,更好地规避风险。平台可以加大线下审核力度,线上信息可能存在造假因素,平台可以从内部将线上线下审核相结合,派专员进行线下走访,实地调查借款人经济情况,力求借款人上传资料的真实性、有效性。平台应重视网络安全的维护,聘请高水平的信息技术人才,确保平台系统内部网络不受侵害,保证客户信息资料不被泄露。平台可以建立资金池保证投资者资金安全,足够的资金是P2P平台得以生存和发展的前提,当贷款人获得一定收益时,平台可收取部分资金填充自身资金池,当借款人出现违约情况,平台能及时补给投资者,保障投资者收益。
  2)平台之间。P2P平台可以建立信息共享平台,实现平台之间的征信信息共享,实现透明公开和黑名单公示机制,互通有无。可以共同研发建立高规格的平台运营技术、防御技术,发展P2P行业的统一网络金融服务体系或统一的操作平台和数据库,管理和推广P2P信息技术,实现平台之间信息数据的交流和信息共享。
  3)平台外部。一方面商业银行可以加强数据库的建设力度,作为与公众接触最多的社会机构,银行所掌握的信用信息量最多。银行可以凭借这种优势积累借款人的历史信用数据,加快建设信用信息数据库,这些数据可以与P2P平台共享,实现P2P网贷和商业银行的交互,力求覆盖更多层次的客户群体,共同为中国经济发展作出贡献。政府方面,应充分发挥政府的规范和引导作用,加快推动对民间借贷的立法规范,尽可能消除P2P平台中非法集资等乱像,使P2P平台朝着合理合法合规的方向发展。
  参考文献:
  [1] MICHELS J. Do unverifiable disclosures matters?Evidence from peer-to-peer lending[J].Accounting Review,2012,87(4):36-41.
  [2] LEE E,LEE B. Herding behaviorin online P2P lending:An empirical investigation[J].Electronic Commerce Research and Applications,2012,11(5):495-503.
  [3] 杨宇焰,陈  倩,田忠成.P2P网络信贷平台的主要模式、风险及政策建议[J].西南金融,2014(1):29-31.
  [4] 卢  馨,李慧敏.P2P网络借贷的运行模式与风险管控[J].改革,2015(2):60-68.
  [5] LIN M,NAGPURNANAND R P,VISWANATHAN S. Judging borrowers by the company they keep:Friendship Net-works and information asymmetry in online peer-to-peer lending[J].Management Science,2013,59(1):17-35.
  [6] GONZALEZ L,LOUREIRO Y K. When can a photo increasecredit? The impact of lender and borrower profiles online peer-to-peer Loans[J].Journal of Behavioral & Ex-perimental Finance,2014(2):44-58.
  [7] EMEKTER R,TU Y,JIRASAKULDECH B. Evaluating credit riskand loan performance in online peer-to-peer(P2P)Lending[J].Applied Economics,2015,47(1):54-70.
  [8] 董  梁,胡明雅.基于Logistic回归模型的网贷平台新进借款人信用风险研究[J].江苏科技大学学报(社会科学版),2016,16(3):102-108.
  [9] 肖曼君,欧缘媛,李  颖.我国P2P网络借贷信用风险影响因素研究——基于排序选择模型的实证分析[J].财经理论与实践,2015(1):2-6.
  [10] 王会娟,廖  理.中国P2P网络借贷平台信用认证机制研究——来自“人人贷”的经验证据[J].中国工业经济,2014(4):136-147.
  [11] BEKHET H A,ELETTER S F K. Credit risk assessment modelfor jordanian commercial banks:Neural scoring approach[J].Review of Development Finance,2014,4(1):20-28.
  [12] ORESKI S,ORESKI G. Genetic algorithm-based heuristic for feature selection in credit risk assessment[J].Expert Systems With Applications,2014,41(4):2052-2064.
  [13] 宋丽平,张利坤,徐  玮.P2P网络借贷个人信用风险评估[J].财会月刊,2015(35):94-96.
  [14] 姚凤阁,隋  昕.P2P网络借贷平台借款人信用风险影响因素研究——来自“拍拍贷”的经验依据[J].哈尔滨商业大学学报(社会科学版),2016(1):3-10.
转载注明来源:https://www.xzbu.com/8/view-14889656.htm