大数据时代下的互联网金融风险管控研究
来源:用户上传
作者:
摘 要:大数据早已渗透到人们生活的各个领域并发挥着重要的作用。大数据时代的到来给各行各业带来了新的思维方式和解决问题的方式。对于金融行业而言,传统的风险管控中数据维度单一,数据滞后性,审核效率低下的问题阻碍了业务的发展,因而需要使用大数据风险管控的优势进行补充,两者相辅相成,共同促进金融行业的发展。
关键词:大数据;互联网金融;风险管控
数据,早已渗透到每一个行业和业务职能领域。数据与我们息息相关,我们每天都在和各种数据打交道,进入“大数据”时代。大数据技术依托现代互联网技术而出现、兴起、发展,网络资源的海量存储特性,为大数据存储提供了必备的条件,大数据技术的分析特性及存储特性,有助于收集更多的用户信息。随着金融机构业务的快速发展及服务人群的扩大,传统的风险管控暴露出相关问题,例如人力成本高昂,审核流程冗长等,无法满足当下业务中产生的海量数据实时分析和多样化风险识别的要求。为了更好的开展业务与服务客户,金融机构需要加强对大数据的使用。
一、大数据与金融
大数据的特征经历了3V、4V到5V的演变,阿姆斯特丹大学提出了大数据体系架构框架的5V特征,分别是数量(Volume)、速度(Velocity)、种类(Variety)、价值(Value)及真实性(Veracity)。第一是数据体量巨大(Volume),体现在数据采集、存储和计算的量都非常大,存储单位从过去的GB到TB,直至PB、EB、ZB。第二是数据类型繁多(Variety),大数据包括多种格式和不同类型的数据,分为结构化、半结构化和非结构化数据。第三是价值密度低(Value),价值密度的高低与数据总量的大小成反比,要从海量的数据中挖掘出有价值的信息。第四是处理速度快(Velocity),这是大数据区别于传统数据挖掘的最显著的特征。在数据处理速度方面,有“1秒定律”之说,即数据如果没有在秒级时间内给出分析结果,数据就失去价值了。第五是数据的真实性(Veracity),大数据都是在真实世界发生的,要保证数据的准确性和信赖性。
金融行业由于服务客户众多,业务类型复杂、信息化程度较高,天然具有“海量用户和大数据”的特性。在规模上,金融机构积累了海量的数据,包括客户信息、产品信息、交易信息、行情信息等,每时每刻都在进行数据的收集与处理。在速度上,为了满足客户、产品及交易要求,金融机构重视大数据技术的发展,提高业务的处理速度,不断优化数据的采集、存储及分析平台。在类型上,金融机构产生的数据中,不仅包含结构化的数据,但更多的是半结构及非结构数据。
二、传统金融风险管控的痛点
(一)单一的数据维度
传统金融风险管控数据来源单一,多基于征信信息及客户主动提供的信息。金融机构多使用和客户相关的强信用属性数据,一般采用20个维度左右的数据,例如客户的年龄、职业、学历、收入、支出、还款情况、资产、负债等数据,利用评分模型来识别客户的还款能力和还款意愿。金融机构利用这些强信用属性的数据构建了不同的用户画像,对客户的还款能力及还款意愿进行了差异性区分,依据最终的打分模型来决定是否贷款以及贷款额度。
相较于欧美国家,我国个人征信行业起步较晚,虽然央行征信中心个人征信系統经过不断发展,已产生了较为显著的成果,但是其覆盖人群、覆盖维度仍远远不足。数据显示,央行个人征信记录覆盖率为35%,目前仍存在大量的征信白户。对于此类人群,金融机构获取的信用属性数据有限,采用原有的方法对客户进行评估存在偏颇,评估结果容易失效。其次,金融机构在使用数据不全面的情况下,没有大数据的支持,缺乏有效的交叉核验手段,对于欺诈风险的识别能力有限,容易遭受团伙欺诈及其他类型欺诈。
(二)风险管控的滞后性
对金融机构而言,欺诈风险管理相比信用风险管理更为复杂。信用风险管理侧重于对用户的还款能力和还款意愿进行衡量,欺诈风险管理侧重于评估用户是否有主观恶意骗贷的意图或者行为。随着社会的进步和科技的发展,新型欺诈也日益活跃,各类欺诈手段千变万化,各种欺诈行为层出不穷,欺诈事件也从传统的个人作案逐渐演变成了有组织、成规模的团伙作案,背后有一整条完整的犯罪产业链,所有人分工明确、紧密合作、协同作案。面对着层出不穷的欺诈事件,金融机构主要使用名单+规则+有监督模型去进行风险管控,但以上三种方法均存在一定的滞后性问题。金融机构在业务的开展过程中,积累了一定数量的黑名单,通过黑名单过滤掉部分欺诈客户,但机构在收集黑名单的过程中存在数据来源及准确性有限,数据时效性滞后的问题。
金融机构通过各种规则对不同的风险行为进行区分,有力的识别欺诈事件,但是现有规则的制定来源于已发生风险事件的分析以及过往的经验,存在滞后性,对于新型欺诈事件的识别乏力。在积累了一定的风险数据之后,金融机构通过有监督模型识别欺诈事件,有监督模型需要高质量的标签(已发生的风险事件)去不断优化,但机构所收集到的欺诈事件仅是所有欺诈行为中的小部分,模型对于新型未知欺诈的检测仍显得力不从心。数据是有时间价值的,金融机构利用滞后数据来识别欺诈事件,不能实时反映风险变化情况,存在一定程度上的结构性风险。
(三)风险管控的低效率
以往的风险管控措施中,客户的负担较重,金融机构的负担较轻。金融机构在牺牲客户体验的前提下换取了风险的可控。比如说,客户需要提供相应的资料,需要按照机构的要求进行申请、安装、激活、更新等。金融机构在获取了客户的信息之后,还需要进行相应的审核流程,在将审核结果反馈给客户。从客户申请贷款到金融机构出具审核结果的耗时较长,客户体验度较差。
传统的风险管控中,人起到了很大的作用。比如,需要人工对坏样本进行标记,需要人工通过相关信息找出关联标记样本,需要人工对风险事件进行调查等。但是每个人的计算能力和理解能力各有不同,在调查中也会受限于个人的经验,存在一定的主观性,难以实现标准化及量化,缺乏整体的把控能力,使评估结果容易出现偏差。而随着金融机构业务规模的扩大与服务人群的提升,传统的依靠人来进行审核的风险管控中存在时效性差和风控水平参差不齐的问题。 三、大数据风险管控的优势
(一)丰富数据维度
大数据风险管控中涉及多维度的数据,对传统金融风险管控的不足进行了补充。在风险管控中最好的数据依旧是强信用属性的数据,这类数据的风险权重高,在信用评估中起到了重要的作用,能够反映客户的还款能力和还款意愿。但除了这些强相关数据,机构内部还积累了大量的非信用属性数据,例如设备信息、网络信息、运营商信息、用户行为信息等。尽管这些数据并非直接影响金融借贷,但都存在一定的价值,对这类数据的挖掘与分析有助于金融机构从更全面的角度构建客户的用户画像及对客户进行风险评估。对于在传统风险管控评估中存在偏差的群体,例如没有信用卡、没有房贷的征信白户,金融机构通过对大数据的使用,从更多的维度对这类群体进行区分,在风险可控的前提下更好地服务于客户。
设备信息、网络信息、用户行为信息一般不是客户主动提供,很大程度上是大数据采集和分析的结果。大数据技术对零散的碎片数据具有更好的整合能力,将零散的数据整合输出规律性的数据,便于金融机构的使用。大数据也给金融机构提供了新的思维方式,即直接从海量数据出发,关注数据本身,通过大量的数据分析得出结论,不容易受到以前经验的影响。
(二)实时风险管控
传统的风险管控中存在着一定的数据滞后性问题,而大数据通过强大的数据采集和计算能力,能够帮助金融机构建立实时的风险管控,随时监控客户的申请、交易行为,发现警报马上处理,停止相关交易,减少损失。
大数据风险管控下,多样的数据维度对原有规则以及有监督模型进行了扩充,提升了使用范围和效用。虽然有监督模型在预测的准确性上有不错的表现,但由于其天然存在的数据滞后性以及数据标签难以获取的问题,大数据风险管控中同时强调对无监督模型的使用,无监督模型在进行学习时并不知道其分类结果是否准确,也不知道何种学习是正确的,通过给模型输入大量范例,使之自动识别出潜在的风险并输出相应类别规则。通过模型的不断自我迭代,模型在识别新型欺诈方面有着不错的表现。面对欺诈行为日益呈现团伙化特征,关系网络提供了全新的反欺诈视角,通过无监督学习算法,挖掘诈骗团伙的特征,进而识别诈骗团伙。关系网络通过基于图的数据结构,把不同的个体按照其关系连接在了一起,提供了从“关系”角度分析问题的能力,通过对个体与个体之间的关系的分析,使我们更能从正常行为中识别出异常的特征,有效的提高風险管控的精准度,实现复杂环境下的反欺诈。
(三)提升客户满意度
传统风险管控中,机构往往要求客户提供大量的资料来进行辅助审核。这个过程涉及到了大量的人工及时间成本,为了提高效率,机构必须搭建一套自动化程度较高的后台管理系统,具备数据采集、数据存储、数据清理、数据建模及数据输出的功能。机构要重视大数据技术,加强底层技术架构搭建能力,加强技术基础设施的建设。
相对于传统金融风险管控,大数据风险管控通过大规模的数据运算,完成大量用户的贷款申请审核工作,提升工作效率。传统金融的审核中人占据了很大的作用,因而效率相对有限。大数据风险管控中,通过全方位收集客户的各项信息,进行有效的分析、建模、迭代,对客户的信用情况进行评价,使客户在申请之后能迅速得到审核结果,大大减少了等待时间,提升了用户体验。大数据技术的运用帮助机构简化信贷业务办理流程,实现申请过程的电子化,节省重复和无效的信息输入,更加高效、低成本、低风险的服务客户,在某些信贷领域甚至实现“秒贷”,摆脱了工作时间的限制。大数据技术的运用,实现了实时及自动化审核,覆盖了很多以前无法触及的更广泛的人群。
结束语:
传统金融风险管控使用有限的数据维度,强调变量之间的因果关系,讲究逻辑性。即使变量与审核结果存在相关性,但是如果不能在逻辑上讲通,也不会采用。大数据风险管控,核心在于利用更多维的数据,不强调因果性,更着重于统计学上的相关性,通过数据间的弱相关性来加强传统的强因果性。这些弱相关变量看起来和结果没有直接关系,但通过大量的数据累积及数据间的相互作用,能产生有效的识别客户的能力。大数据风险管控并不是取代传统风险管控,而是在一定程度上加强传统风险管控,对传统风险管控进行补充。
参考文献:
[1]刘英,罗明雄.互联网金融模式及风险监管思考[J].中国市场,2013(43):29-36.
[2]李思远.基于大数据的互联网金融研究[J].消费导刊,2017(01):131-132.
转载注明来源:https://www.xzbu.com/3/view-15102713.htm