毕友网

毕友网 > 分享 > 原创 > 大数据在互联网金融风险控制中的应用

大数据在互联网金融风险控制中的应用

2014-12-17 17:20:50吴桐 18117

  【毕友导读】在2014年12月12日举办的互联网金融西部巡回论坛(西南财大站)中,成都数联铭品科技有限公司CFO、数据服务部总监吴桐先生受邀出席并做了“大数据在互联网金融风险控制中的应用”主题演讲,本文为其主要观点摘录。

嘉宾简介:

  吴桐,成都数联铭品科技有限公司CFO,毕业于上海财经大学,中国注册会计师,在审计、财务管理、上市方面具有丰富的经验,是知乎粉丝最多的50位用户之一(MrToy),拥有16万粉丝,主要电子书《财务笔记》,合著畅销书《金钱有术》。

互联网金融改变了什么

  金融产品有三大要素,即风险、价格和期限,互联网金融并没有改变金融产品的这些要素,改变的只是信息的流动,缩小了信息鸿沟,解决了信息不对称,使金融产品更具便利性。比如P2P,有人说它提高了投资的利率,但实际上只是反映出了市场的真实利率,让金融产品的交易双方跳过金融中介来直接交易,本质上跟淘宝一样。

大数据的三个特点

  一是数据总量的飞速变化。数据总量飞速发展,已达到PB级,什么是PB级?一部超高清电影20G,普通家用硬盘1T,可以装500部。1PB=1024TB,是1024部家用硬盘,可以装50万部电影,可以储存人类发展史上所有的电影。阿里系的淘宝天猫,每天的数据量都是数百PB。

  二是数据形态的巨大变化,即从结构化到非结构化。结构化的数据如学生信息表,姓名、性别、电话、住址、生日、家庭成员,政治面貌、学科成绩、挂了多少科等,非结构化数据如照片、语音、浏览记录、校园卡消费记录等等。

  三是数据的关联性变化,即从因果关系变为相关关系,从为什么变为是什么。如著名的啤酒与尿布组合营销案例充分说明了这一点。

大数据的应用举例

  信息推荐是最简单和最常见的大数据应用实例。如在淘宝等电商网站查询过某些产品,下次登录时会自动推荐相关产品,这就是信息采集、信息推荐的典型应用。

  银联POS机项目。银联POS费率在不同行业的费率是不一样的,这样就会出现登记虚假行业以套利的情况。为此可通过对各个行业消费习惯的分析来对比和分析异常数据,从而发现和找到违规情况。

阿里小贷的“水文模型”

  对于阿里小贷,判断小微企业的信用等级、未来经营走向和融资需求(包括其需求出现的时间节点和量)已经成为重点。数据分析在此处于一个核心位置。上百个基于电商数据建立的模型交叉生效,构成整个风险决策体系核心。

  目前,阿里小贷的模型体系涵盖贷前、贷中、后管理、反欺诈、市场分析、信用体系和创新研究六大部分。在众多模型中,有一个特殊的模型,它像是一个水晶魔球,专门负责预测未来,我们把它叫做“水文模型”(水文模型,即通过降雨、水木蒸发、土壤散发、径流等来预测水流量)。

  阿里小贷的水文模型,就是预测淘宝每家店铺未来的现金流。每家店铺的销售数据就像一条条河道里的水文:市场的热度、客户的喜好、卖家的运营以及季节周期性的波动而忽高忽低。淘宝店铺尽管销售产品千差万别,但可以根据行业、主营类目、星级进行归类划分,这好比不同的店铺出现在河道里的不同位置,可以纵向对比他们的水位高低好坏。如果能提前预知店铺未来交易的变化,那就可以提前预判其资金需求的节点、量级,又能横向对比出店铺运营的好坏,尽早识别出店铺运营潜在的风险。

  水文模型的因素包括交易、流量、收藏、广告、评价、处罚、社交、运营等综合反映店铺经营情况的变量,并将单一变量,通过各种衍生获得一系列变量。将这些变量从原来的绝对值变量转变为相对值变量,剔除了季节性对绝对值的影响,就能使不同规模、类型的卖家具有相同的可比性。对于一个卖家来说,在不同的月份上,这些变量的表现就会如同水文一样呈现变动,我们称之为“水文变量”。

  目前,直接或间接反映店铺情况的基础指标就有70多种,涉及交易类、流量类、收藏类、广告类、评价类、处罚类、社交类、运营类等。我们按类目、星级分别统计一个“水文数据”库,且在库中记录过去的、静态的常数及其分布情况。有了总体的统计常量,就可以把每个店铺在各自所属的类目和星级进行比对,进行各种衍生,如同比、环比增长,以及在同行业对比的排名和变化趋势,总共几百种衍生方式,从而得到为数众多的相对性指标,同时对自变量进行标准化,使之脱离量纲,变得可比。目前水文库中存在的水文指标已超过三万个。不同于传统的风控模型,控制变量非常非常多,超出人的理解范围。只能依靠大数据算法实现。