大数据应用:从认知、实践到价值创造
来源:用户上传
作者:
【摘要】随着数字智能时代的快速到来,大数据在各行各业中开始扮演越来越重要的角色。金融业作为典型的数据驱动型行业,大数据应用在该行业的未来发展前景与价值创造的潜力十分巨大。本文从全新的数字智能时代出发,分析了大数据及大数据应用的关键因素,并结合金融业的具体实践,详细阐述了大数据应用的价值创造过程以及未来发展趋势与业务潜力。
【关键词】大数据;大数据应用;金融科技;客户画像;数字风控
一、全新的数字智能时代
自2018年下半年以来,几乎在一夜之间,我们所处的创新创业环境就已经发生了翻天覆地的变化,互联网时代进入下半场逐步成为当前最时髦的一个词汇。大数据应用行业也迎来全新的数字智能( DigitalIntelligence)时代,一切事物皆可数字化,进而推动决策与行动的全面智能化。在这个全新的数字智能时代,基于大数据的创新正在成为一个新的经济增长点,不断释放新的商业潜力、培育新的业务形态、增加新的就业机会、刺激国家经济发展。与此同时,随着大数据变得越来越重要,越来越多的企业希望从大数据中挖掘价值,并将大数据应用作为获得差异化竞争优势的一大重要来源。一些企业通过以数据为驱动的创新业务模式,在很短的时间内完成了传统企业需要十几年甚至几十年才能积累的智慧或业务规模。未来十年将是一个“大数据引领的数字智能时代”,并且“数字智能时代有望开启下一次工业革命”。
二、大数据与大数据应用的价值
数字智能时代的数据,与以前经常提到的数据相比,有以下几个不同的特点:第一,数据量庞大。据资料显示,目前每天全球互联网产生的数据累计达1EB(即10亿GB或1000PB),相当于660亿部金庸全集(一部金庸全集大约860万字),可刻满1.88亿张DVD光盘。第二,数据种类多,包括文本、图片、影像、音频、视频等。第三,数据的价值密度较低。现在每天互联网产生的数据中,结构化数据、半结构化数据和非结构化数据的占比分别为5%、80%、15%,也就是说大约只有5%的结构化数据是可以直接用于分析的,其余超过95%的数据在用于分析前还要做大量的清洗与整理工作。第四,数据的实时性要求高,也就是业界经常提到的“1秒定律”,要求能够实时计算分析数据并提供最佳解决方案。
从以上分析也就不难理解,现在大家常说的大数据并非仅是绝对意义上的“大”,它更强调数据的“全”,也就是“全量数据”的概念,每个数据的价值变得更加平等。从宏观层面看,全量数据不再是传统统计方法的抽样数据,不再采用“以点带面”的分析过程,进而避免依据抽样数据分析导致的错误决策。就微观个体而言,则进一步强调个体数据的完整性。比如金融行业在为每个客户做授信审批时,也均是基于全量数据的理念,尽可能取得该客户的整体信息,除了分析客户在商业银行本身的基本信息与交易行为信息外,还尽可能从外部合作机构获取客户的代发薪、社保、公积金等信息,甚至还从互联网公共渠道爬取与客户信用相关的负面信息。
这些数据蕴含着无限的价值与商机,并已经成为众多行业和业务领域的重要生产因素,其中最为关键的是要找到数据分析或数据价值发现创造的方式与方法。一般来讲,数据从产生到发挥价值需要经过三个阶段,一是找到真实的数据来源,二是加工处理这些数据,三是对这些经过加工处理的数据予以进一步分析鉴别并作出价值判断。
例如,2018年某金融机构手机银行APP的平均月活跃用户数突破4000万的数据,这个数据是否有用?我们可以从这个数据知道该金融机构手机银行APP的月活跃用户数,但这个数据没有经过加工处理,我们无法从中作出价值判断。因此我们需要对该数据进行加工处理,進一步得出以下信息,如同比增长75%、环比增长15%、占签约客户数的比重为30%、占基础客户数的比重为10%、在主要同业中排名第二位等。数据经过加工处理后,维度更加全面、信息也更加丰富。但如果希望利用这些信息来指导后续业务的开展,我们还需要进一步对这些信息进行甄别分析,比如分析客户结构、产品结构,得出用户不活跃的主要原因以及活跃用户经常交易的主要产品种类等,进而形成指导后续业务发展的策略与措施。这个数据分析的过程其实就是数据价值的发现创造过程,除了尽可能追求数据的全面以外,还需要数据采集、分析的工具、系统与平台等。
在具体实践中,企业普遍面临以下困难与挑战:一是现有数据不联通,客户在企业内部的数据分散在不同的应用系统,长期存在的系统竖井导致出现数据孤岛,客户在企业内部的数据相互隔离。二是由于客户数据的相互隔离,并受限于可获得数据的丰富度不够,难以通过数字化手段给客户做全方位的画像,从而无法有效识别客户并预测客户需求。三是无法实时获取客户信息,尤其是客户信用与产品交易层面的信息,无法及时判断客户的信用状况并对交易环节中可能存在的风险进行实时处理。以金融机构的信用卡申请为例,目前客户从申请到最终得到核准的周期普遍较长,而且即使通过了最终核准,所核准的信用额度也经常不能反映客户的真实状况,影响客户体验。此外,数据的产品化不够、交互能力不强,也在很大程度上直接制约了数据价值的发挥。
为有效应对并解决上述困难与挑战,目前很多企业纷纷启动大数据应用工程,并通过大数据应用的逐步深化,打通内外部数据壁垒,在实现数据融合的基础上,进一步推动数据与规则、数据与模型、数据与算法、数据与场景、数据与商业模式的融合,进而利用大数据应用来识别客户、识别风险,推动业务创新、优化运营流程、提升客户体验,预警客户流失等。可以说,目前大数据应用正扮演着越来越重要的角色并发挥越来越大的价值。
三、大数据应用的“软实力”与“硬支撑”
投资建设大数据基础设施容易,但要发挥大数据应用价值则较难,这不仅需要硬支撑,更需要软实力。从业界实践来看,如要切实做好大数据应用,需要具备两个方面的基础或条件,一是要有大数据思维,二是要有大数据平台,两者缺一不可。 大数据思维是切实做好大数据应用的“软实力”。这要求企业尽快形成“依托数据说话、依托数据决策”的习惯,并在“用数据说话”的大数据应用过程中逐步建立“多、快、好、省”的数字化观念,包括量化思维、重视全量数据的关联性分析、乐于接受纷繁复杂的局面等,从而实现对数据、用户以及关联关系的理解与应用。“多”是要有基于全量数据开展数据分析的思维,不再局限于随机样本数据;“快”是要有基于实时数据开展数据分析的思维,不能停留在前台接受客户申请、中后台批量审批业务的传统做法,而是要适应客户期望实时推荐定制产品,实时监控潜在风险;“好”是指在做数据分析时,不要局限于仅从因果关系中寻求价值,同时更要在大量数据之间的相关性分析的基础上做出预测;“省”是要接受不精准的数据,并通过一定手段清洗、整理并做分析利用,因为随着数据量的增加,数据格式存在不一致,数据错失率也在不断增加,这就更需要我们有“去伪存真”的能力。
大数据平台是落实大数据应用的“硬支撑”。建设大数据平台,首先要抓住大数据应用的精髓,即坚持“问题导向”与“价值驱动”,利用数据解决业务问题并带来实质效益。其次是不要落入两个误区,一是技术误区:即把大数据应用当作一项纯粹的IT基础设施来建设,大数据应用平台的建设必须由需求引领;二是认识误区:即不尊重行业特性,将大数据应用当作“万能钥匙”,面对所有问题都言必称“大数据”,更不能“只顾炫耀手中的好锄头,而荒了本应该耕种的庄稼地”。
大数据平台建设同样需要好的顶层设计与循序渐进的实施策略,需要业务、信息、應用和技术等多方面的协同。在业务方面,重点关注大数据应用支撑的业务流程和端到端的业务场景,定义在总体企业战略指导下希望实现的业务能力及其关系,帮助企业业务发展,实现高效率运营。在应用方面,重点实现支撑业务流程及场景需要的应用组件和分析模块,基于业务架构和业界最佳实践来建立大数据平台。在信息方面,主要构建支撑应用组件的数据模型和分析模型(包括基于人工智能的模型与基于规则的模型等),从跨组织、跨业务的视角对数据与信息进行组织与管理,构建客户的统一360度画像、相应的规则引擎库(包括推荐规则引擎库、营销线索引擎库、授信规则引擎库等)以及可视化分析建模工具(如数据沙箱)等,为预测客户需求、提升风险控制水平、向客户提供量身贴合的产品与服务奠定更好的分析数据基础。在技术方面,重点采取Hadoop、分布式、流计算等先进信息科学技术建设符合应用架构和信息架构的大数据一体化技术支撑平台,基于面向服务的架构思路,实现信息、应用、流程的横向贯通,实现对企业各类数据的可视化展现,从而有效支撑智能决策。
四、金融大数据应用实践与未来展望
金融是大数据的重要产生者,金融业不仅是信息科技密集型行业,也是典型的数据驱动型行业。对金融服务机构而言,大数据不仅是一种创新工具、更是一种不可比拟的战略资源,构建并实施金融大数据应用的主要目标是为了实现大数据应用与金融服务的完美快速融合,从大数据中找客户、从大数据中控风险、从大数据中要效率。可以说,“数据是金融服务的边界”,拥有的数据有多全,金融服务就可以覆盖多广。事实上,目前国内外已有不少金融机构正在积极推动大数据平台建设与大数据应用创新,并在洞察客户行为、变革营销模式、创新数字风控、实时侦测风险等业务场景方面取得了显著的实际成效。
洞察客户行为:主要通过对数据资产的有效分析与应用,在深刻理解客户各项内外部数据(包括基本属性数据、交易数据、行为数据等)的基础上建立客户标签服务体系并抽象出客户360度统一画像(可根据不同数据维度对客户进行不同层面的画像,如客户的全面资产画像、全面投资画像、全面现金流画像、全面风险偏好画像、情感情绪画像等),还原并表征客户行为特征,使金融机构能够更好地识别自己的客户( KnowYour Customer,简称KYC)。这是一个“化抽象为具体”的数字化过程,是金融大数据应用的核心。建立客户360度统一画像是一个持续的过程,一方面需要充分利用大数据的技术与思维建立客户标签服务体系,另一方面也要根据不同的维度(包括渠道、来源、结构、内外部等)对客户标签服务体系进行分类动态管理。
变革营销模式:在原有营销体系下,由于无法及时精确掌握每个客户的需求偏好,只能统计到“面”,营销方式多采取以产品为中心的“广而告之”,为客户提供各类产品的说明信息,由客户根据自己的需求进行选择,这种被动的营销方式提供的产品和服务千篇一律,效果和效率都不尽如人意。基于大数据构建客户360度统一画像后,可以精确到“点”,分析粒度将从客户群体精细化到每一个客户个体,使金融机构可以实时分析每一位客户当前的需求,准确及时地把握客户的行为偏好,从而使金融机构改变原有粗放、被动的营销方式。在结合决策树、贝叶斯算法等规则模型后,可进一步构建以数据为驱动、以模型为核心的“千人千面”精准营销模式,及时组织相匹配的产品与个性化服务来响应客户的需求。另外,这种新的营销模式还可引入客户交易信息反馈的量化分析与评价机制,真正达到“想客户之所想,荐客户之所需”的营销效果,进一步降低服务成本并不断提升客户的转换率、用户的留存率以及交叉渗透率,实现传统营销模式革命性的变革。
创新数字风控:核心是充分利用大数据技术,通过与合作机构平台对接和数据共享等方式获取并分析处理客户业务项下的交易、资金、物流等数据,降低信息的不对称性与不透明性,根据客户360度统一画像建立基于数字信用的信用评级模型,改变前期金融机构仅按照“三位一体”审批流程以及利用单一客户财务经营信息、抵质押担保信息等的传统授信审批模式,实现面向业务场景、面向交易过程的授信。例如,结合小微企业等长尾客户“额度小、期限短、需求频繁、办理要求快”的贷款需求,金融机构可在贷前、贷中和贷后等全流程丰富风险管理措施,包括基于自然语义分析( NaturalLanguage Processing)的客户动态关联图谱等,推出高效便捷的“自动化、直通式”融资服务模式,提高融资效率,降低融资成本,服务实体经济。 实时侦测风险:主要通过大数据应用技术整合内外部收集的各种数据,尽可能消除申请及交易等环节的信息不对称问题,并与客户行为建立关联,从而更全面地了解客户、评估客户、发现可疑活动,不断通过金融大数据应用提升实时反欺诈的识别、评估、控制、缓释、监测和报告等关键能力。一方面,基于金融大数据应用创新建立丰富的反欺诈模型、规则以及反欺诈知识库(包括行业内外的欺诈信息、欺诈形式、影响范围和人群以及应急手段等),从多个维度(包括账户、设备、位置、行为、关系、偏好等)实时监测客户每笔交易行为并做出预警。另一方面,通过强大的数据分析处理能力,可以在20-30毫秒内实时识别每笔交易活动的潜在风险(目前比较常用的反欺诈分析识别手段主要包括规则判断、行为特征分析、模型智能识别、关联分析等),并根据风险识别的不同结果采取差异化的智能处置措施,包括“直接放行、拦截操作、增强验证、暂挂交易、账户冻结”等,實现实时高效、客户无感的反欺诈服务,切实保障用户资金和账户安全,实现风险防控和客户体验“双提升”。
除此之外,金融大数据还可以进一步应用到促进业务创新、优化运营流程、提升客户体验等多个方面,尤其是在进一步与人工智能技术结合起来后,前景非常广阔。为了确保金融大数据应用在全新的数字智能时代发挥更大作用,后续可能需要重点关注以下几方面内容。
首先,不断强化数据治理模式,尤其是要在个人数据保护和数据融合创新之间实现平衡。在持续丰富数据来源的过程中要重点关注获取数据的合规性与使用数据的合法性,避免出现数据泄露与侵犯客户隐私等问题。尤其是在个人数据隐私保护方面,要切实满足相关监管要求及规定,如欧盟执委会正式发布的《一般数据保护条例》(简称“GDPR”)以及中国正式发布的《征信业管理条例》等,在采集、使用等环节不断加强规范化管理,建立数据标准并不断提升数据质量,这也是有效开展大数据应用的基石与底线。
其次,加快推进数据的产品化与智能化,实现大数据应用与人工智能的有机融合,充分利用智能算法、机器学习、可视化知识谱图等工具建立更加完备的金融大数据应用体系,不断提升数据的挖掘分析能力以及可交互能力,创新基于数据驱动的全新产品与服务模式,使数据进一步成为业务前台的生产力,提升金融服务的覆盖率与智能化服务水平,如智能投顾、智能客服、智能风控、智能反洗钱等。
再次,革新企业文化,加大人才培养,避免出现“端着金饭碗要饭吃”的情况。金融机构一方面要加快建立内生培养机制,另一方面也要强化与外部专业服务机构的深度合作,让金融大数据应用真正嵌入各个业务过程和交易环节,逐步形成人机协作分析与以数据驱动业务发展的工作模式。
当然,金融大数据应用是一个综合、渐进、复杂的系统演进过程,其内涵与外延将在不断应用与发展的过程中得到丰富,随着数据产品化、智能化水平的不断提升以及交互建模能力与数据治理能力的不断提高,金融大数据将得到更为广泛的应用并逐渐成为金融机构赢得市场竞争优势的关键因素。
参考文献:
[1]大卫·麦克坎德莱斯.信息之美[M].电子工业出版社,2012.
[2]涂子沛.大数据:正在到来的数据革命[M].广西师范大学出版社,2012.
[3]凯文·凯利.失控:全人类的最终命运与结局[M].新星出版社,2013.
[4]曹汉平.互联网金融的新常态[M].清华大学出版社,2016
[5]雷·库兹韦尔,人工智能的未来:揭示人类思维的奥秘[M].浙江人民出版社.2016.
转载注明来源:https://www.xzbu.com/1/view-14850110.htm