产品
解决方案
产品说明
关于我们

Data Analytics

这是一款用于企业数据可视化分析的自助式敏捷BI产品,可以针对企业业务数据进行自由维度的探索式分析,释放IT压力,真正将数据分析工作交还给最懂业务的人,提高企业决策效率。

典型客户:小米、克丽缇娜、雀巢、联合利华.....

Data Analytics 点击试用

Data MAX

这是一款用于企业数据可视化展示呈现的标准+自由定制化产品,将业务数据经过处理后以实时的炫酷的可视化形式展示出来,广泛应用于领导驾驶舱、指挥中心、展览展会等场景。

典型客户:人民日报、富力集团、OPPO、民生银行.....

Data Max 点击试用

咨询电话

400-1024-262

关注DH小助手

可随时微信沟通

首页 > 关于我们 > 行业信息 > 文章详情
金融机构该如何利用大数据做好风控管理
2020-04-27
最近频发的黑天鹅事件让许多企业对风险控制的关注变得越发强烈,毕竟黑天鹅事件背后透着一个组织真正的抗风险能力、透着一个企业的风险管控能力,而后者就是我们通常说的“风控”。

 

 
一般来说,风险控制包含了两类工作,即风险管理和内部控制,但在不同类型的企业中,风控的管理及控制的方向也会有所不同。
 
如今许多企业都开始在内部设立风险管理或内部控制部门,对可能遇到的各种风险因素进行识别、分析、评估。不过,总体来说,企业中的风控工作大都集中于事后的检查评价。因此需求度最高、体系最完善的风控工作往往体现在金融领域。

 

金融领域的风控工作规划在中台部门中,需要参与到具体业务的事中风险评估及审核过程,而非仅仅事后的检查评价。通常涵盖的范围包括金融行业特色的信用风险、市场风险、操作风险等。
 
今天DataHunter数猎哥就来说说大数据在金融风控领域中的应用,以及金融企业该如何利用大数据做好风控管理。
 
 
一、金融机构的命脉能力:大数据风控能力
 
大数据风控能力重要到可以称为金融行业公司之命脉。众所周知,金融机构普遍肩负着社会经济的稳定健康发展的部分责任,同时又要作为商业单位存活,机构需要在兼顾监管层对金融机构的风险防控能力提出的高标准与严要求的同时提升盈利水平,靠的就是风控。
 
金融的本质是将风险偏好不同的资金供给方和风险不同的资金需求方匹配起来,因此风控是所有金融业务的核心。不论是银行还是消费金融公司,互联网小贷公司等其他金融机构,其核心竞争力就是风控能力。
 
典型的金融借贷业务例如抵押贷款、消费贷款、供应链金融、以及票据融资都需要数据风控识别欺诈用户及评估用户信用等级。因此大数据风控能帮助银行的风控业务,从资产负债、信用风险、反欺诈、反洗钱等方面提供全方位完整的风险控制方案,利用数据挖掘模型、外部征信模型、欺诈侦测模型等功能模块帮助金融企业更好的预测及管理风险,从而使得金融企业在风险和收益中寻求平衡。

 

DataHunter为企业制作的“资金交易-实时监控”
 
 
二、什么是大数据风控
 
传统金融的风控主要利用了信用属性强大的金融数据,一般采用20个纬度左右的数据,利用评分来识别客户的还款能力和还款意愿。
 
与信用相关程度强的数据纬度有10个左右,包含:年龄、职业、收入、学历、工作单位、借贷情况、房产,汽车、单位、还贷记录等。金融企业参考用户提交的数据进行打分,最后得到申请人的信用评分,依据评分来决定是否放贷以及放贷额度。其他与信用相关的数据纬度还有区域、产品、理财方式、行业、缴款方式、缴款记录、金额、时间、频率等。
而大数据风控并不是完全改变传统风控,而是丰富传统风控的数据纬度,首先还是利用信用属性强的金融数据,判断借款人的还款能力和还款意愿,然后在利用信用属性较弱的行为数据进行补充,一般是利用数据的关联分析来判断借款人的信用情况,借助数据模型来揭示某些行为特征和信用风险之间的关系。

 

最终利用大数据的能力,促进金融企业在金融业务的全生命周期中,不断提升效率和服务能力。

 

 
三、大数据在金融风控领域中的应用方向

 

总的来说大数据在金融风控领域的主要应用在于两点:

 

一是利用用户社交行为记录实施信用卡反欺诈。例如:用户信息是否被盗用或虚假注册。在反欺诈上,通过大数据储存用户与各种ID对应的数据库,在用户进行借贷时进行身份匹配,能够及时辨别潜在的欺诈嫌疑用户。并对卡组织交易数据进行清洗补齐,提取风险特征,再将风险特征载入神经网络和业务规则,对交易进行欺诈判断,对可疑交易实施拦截,并发送验证码核实。
 
二是利用数据分析报告实施产业信贷风险管理。在风险管理上,依托基于用户行为分析的风险引擎,实时快速分析网络金融渠道客户交易行为细节,建立电子化、流程化、规范化的管理方式,对海量的数据进行比对、甄选,主动识别异常行为,采集异常行为数据,进行实时分析判断,挖掘欺诈团伙作案特征和规律,根据风险形势变化,实时动态部署智能化监控策略,扩大风控覆盖范围和拦截半径,实现精准识别高风险网络金融交易,有效保障客户资金安全。

 

 
四、金融机构该如何做好大数据风控?
 
金融机构所包含的业务种类较多,做大数据风控首先需要梳理业务逻辑,也就是将传统金融机构信贷审批流程,让计算机自动计算替换原来需要人为判断的规则,所以最基础的一步就是定义抽象出传统人工审批的业务流程及方法论。
 
人工审批的方法论分为以下几个环节:①准入政策(做的客户在法律范围内);②反欺诈(防止客户骗钱);③信用评估(对于好用户能借给他多少钱)。基于这样一套业务逻辑,大数据风控的基本流程分为4个部分:数据收集、数据建模、构建用户画像和风险定价。
 
 
1.数据收集
 
数据是大数据风控的核心,数据的量级大、维度多、迭代快才能体现数据的真正价值。大数据风控所用到的数据包罗万象,主要是以下几个方面:

 

①基础信息数据:最基本的用户四要素信息(姓名、身份证、银行卡、手机号),除此之外可以搜集用户学历、收入、家庭地址等基本信息;
②用户的征信数据:这里的征信数据包括该用户是否在其他平台有过多头借贷行为,在非银机构是否有过逾期行为、有没有上过征信系统的黑名单等等;
③运营商数据:通过运营商数据可以判断用户的设备是否有异常,比如入网时长、入网状态、每月消费情况、通话记录、短信情况等。
④用户行为数据:包括用户的搜索记录、购买记录、社交数据等,通过这些数据可以判断识别该用户是一个什么样的人、有多强的消费能力、社会关系如何等等。

 

2.数据建模
 
数据建模是大数据风控重点的核心,帮助我们最终输出拒绝这个申请或是借多少钱。

 

(1)模型包含四大方面的数据:
 
①个人/公司的基本信息:包括个人资历、个人/公司的信用信息、公司财务指标、家庭结构关系、家庭社会地位关系、个人社交关系、工商注册信息等;
②个人/公司商务信息:包括线上零售交易信息、专利信息、个人/公司资质、土地出让/转让信息、质押抵押信息等;
③个人/公司社会公众信息:包括涉诉信息、专利信息、被执行人信息等;
④个人/公司社会关联方信息:包括自媒体、证券社区、行政监管/许可、行业背景、商标、招中标、行政处罚、抵押担保等。

 

(2)常使用的模型:
 
①聚类:比如常见的相似文本聚类,大量用户发相似帖子是常见的灌水行为,需要处理;
②分类:比如我们根据已经识别的有风险和无风险的行为,去预测现在正在发生的行为,根据关键字动态去识别预测效果不错;
③离群点检测:比如登录行为,当同ip登录大量登录失败,这种行为可能是暴力破解,当同ip登录基本全部成功,这种行为可能是机器登录,采用离群点检测发现这两类行为并处理等。

 

(3) 应用案例:
 
①欺诈风险用到模型主要是社会关系网络模型,通过每笔案件之间的关系,判断新案件是欺诈申请的可能性;
②信用风险主要用到模型是逻辑回归建立评分卡(也有的用决策树),量化新申请人可能违约的概率,根据评分高低制定不同的授信规则和催收策略;
③贷后管理也用到行为评分卡,例如额度调整和客户风险分池管理等。

 

(4) 风控数据分析对模型的挑战:

 

①模型的泛化能力:复杂的特征和模型可以增强模型的泛化能力,采用复杂特征和更多维度的特征是很有效的;
②模型的可解释性:风控模型识别出来的数据需要做相应的处理,任何机器识别处理都不可能完全避免用户的投诉和异义,对于模型一定要了解业务特征,能够转化为客服和用户可以理解的语言去解释,使得任何处理我们都有理有据;
③模型的更新速度:高对抗性场景下,模型快速更新是关键。
 
3.构建用户画像
 
用户画像的底层是机器学习,那么无论是要做客户分群还是精准营销,都先要将用户数据进行规整处理,转化为相同维度的特征向量,诸多华丽的算法才可以有用武之地,像是聚类,回归,关联,各种分类器等等。对于结构化数据而言,特征提取工作往往都是从给数据打标签开始的,比如购买渠道,消费频率,年龄性别,家庭状况等等。
 
好的特征标签的选择可以使对用户刻画变得更丰富,也能提升机器学习算法的效果(准确度,收敛速度等)。一般在项目中根据不同维度提取了数十个多个标签,下图展示了其中的一部分。这些标签主要有三个来源:

 

①是在IT系统中可以取得的信息,比如办会员卡时留下的信息(性别,年龄,生日),购买渠道,积分情况等;
②是可以通过计算或是统计所获得的,比如用户对某类促销活动的参与程度,对某种颜色/款式商品的偏好程度,是否进行过跨品牌的购买等;
③则是通过推测所得,比如送货地址中出现“宿舍”,“学校”,“大学”等字样,则用户身份可以推测为学生,出现“腾讯大厦”,“科技园”等信息时,则可判断是上班族,并有很大概率是技术从业者。

 

对于已经打好的标签,根据不同的分析场景进行离散化,或将分类类型的标签拆成多个0/1标签,就可以进行一些机器学习的建模了,比如聚类,分类,预测,或者关联性分析,最终生成的向量维度在数千个。
 
4.风险定价
 
量化风险管理的一个核心是风险定价,根据银行自身的风险偏好来对资产进行定价,高风险资产定价较高,低风险产品定价较低,根据风险高低来制定资产收益,RBP(基于风险定价)已经成为主流。虽然对技术的应用日趋成熟,但现实的情况是,行业的业务模式仍然大量基于人海战术,与上世纪八九十年代传统金融企业的业务模式类似,在信用评级和风险定价方面过多依赖人的经验,总的来说风险定价可以采取以下两种方式:
 
(1) 多维度的风险定价系统
 
通过对数据的整合、补充、调用、评判等,多维度评判个人信用数据,使风控模型运算结果更加准确。
 
(2)定制化的风险定价系统

 

不同的业务场景,产生了不同的数据,不同的数据包含的规律,体现在数据分析中就是模型、参数和评分。这也要求评分的模型在设计之初,就要考虑如何更加智能。
 
 
五、小结

 

总而言之,大数据风控本质上是基于数据的力量防范欺诈,它可以灵活多变地采取不同的应对策略,甄别出有欺诈风险的用户,帮助机构为真正有需求的用户提供高体验的金融服务。

 

但是对于大部分金融机构来讲,风控和业务是互斥的,为了提高业务量,就必须降低准入标准,想在低标准下防范风险就要借助技术手段,就要求金融机构具备强大的大数据风控底层技术架构能力、良好的企业级产品输出能力,未来还需要结合Al等技术形成智能的风控和反欺诈能力。
 
除此以外,理财、保险、汽车金融、现金贷等金融服务对应的场景是不同的,因此对建模的要求也不同,模型并非“万金油”,只有对客户的业务场景非常理解的模型才能符合公司定位与需求。
热门文章
免费试用DataHunter产品
Data Analytics
业务驱动型BI工具
免费试用
Data MAX
极致性价比的大屏可视化产品
免费试用
Data Formula
敏捷型数据中台
免费试用
Copyright © 2018 北京数猎天下科技有限公司 | 京ICP备16063904号-1