数据赋能金融:实时的防欺诈和反作弊助力金融科技崛起

1月18日,由AI应用创新媒体《问见》主办的“2018中国智能风控创新大会”在上海举办。来自国内外科技界、金融界、投资界的专家学者围绕“AI赋能金融”“金融风控应用创新”等话题进行深入交流。热云数据CEO白冬立受邀出席并在峰会中发表《基于用户行为的营销实时监测与数据挖掘》演讲随着大数据、机器学习、图像识别等核心技术的发展,人工智能正在重构金融服务业态。从最初的理念渗透到运营的各个层面,金融机构的业务流程正在加速向智能化过渡。同时,通过数据、技术的驱动,实现高精度反作弊识别,对数据更多维度的深度挖掘,将提高金融与场景的融合,重构金融体验。

作为大数据领域的领先人物,白冬立从热云数据近年的的创新与实践成果出发,与参会人员和嘉宾分享了金融领域大数据营销、反作弊等前沿见解。

白冬立首先介绍了2017年移动广告点击数据,2017年热云数据所服务的1000多家2B客户,2017年在广告投放过程中的数据,也就是广告点击数据。大家可以看到我们所服务的客户2017年在互联网尤其是移动互联网营销这方面,投放量实际上是逐步在上升的。但是通过监测发现,75%以上都是欺诈流量。2017年所监测到的全网广告点击数量超过2000亿次。到12月份我们知道国内这么多的客户累计9.5亿的设备在移动互联网领域的用户行为数据,而这些用户行为数据是从广告点击开始跳转到应用的下载页面,从下载页面再到产品被使用、激活后续的行为数据包括付费,电商客户、金融客户也会把一些消费的数据或者说贷款数据报送给我们。

白冬立表示热云数据能够监测广告平台带来的客户的真实性,是否具有欺诈行为,也包括数据背后都有什么属性。当我们有了这么多互联网行为数据之后,这个服务到底能为客户带来什么样的价值?我们拿到的都是真实的每天上网、使用APP或者玩游戏,甚至是购物的真实行为数据,将会补充我们真实的数据模型。

另外,白冬立介绍到,在这基础上还做了反欺诈和反作弊的算法服务,因为我们积累了很多数据,所以我们认为基于历史数据行为其实是可以做这样的事情,由于我们有些设备的行为已经非常清晰了,不用做任何算法、不用做机器学习和人工智能处理就基于真实行为本身可以做一些参考,所以我们做了这样的服务,另外,各种各样的流量入口、流量来源、信息流、广告来檬、Adx/DSP、WAP站最上层的是真实客户、欺诈流量或者欺诈设备,有这样的体系我们就可以去为金融以及互联网客户从用户获取新增客户判断用户或者设备真假性。一旦我们已经知道这个人是谁了、知道真与假了,剩下的事情就是如何留存,或者说让他尽可能在我们这多消费、让我们维护他。

刚才我提到了过程当中的防欺诈和反作弊的算法服务,基于我们的统计和数据就可以做一些事情。首先第一个设备级的反作弊,因为我们知道现在我们的客户80%甚至90%以上都是通过移动设备去操作,我们做一件事情就是设备级反作弊是不是模拟器、机刷、是不是预装等等的,首先先把蓝牙识别出来。第二就是黑名单的反作弊,基于我们对用户历史行为数据的统计和分析得出来的数据库,经常作弊的设备做了一个黑名单,我们发现有很多这样的移动设备行为已经很清晰的知道作弊,一旦发现有这样一个设备我们潜意识就认为这是有问题的,所以我们会做标注,会打分评级降低,这个行为跟专家讲的基于单个用户的征信不一样的地方就在于我们数据的量级其实可以做到全网的反作弊模型,

这涉及两个方面:第一个是跨APP的机器学习,人工智能算法。判断的标准就在于假设说一个用户同时或者在很短的时间范围内再多家相同类型、不同类型APP当中都有异常行为,或者可能会伤害到客户利益的行为我们都认为有可能在作弊。

第二个就是跨推广媒体的学习,我们会在多家推广媒体有做线下的、做视频广告和信息流投放的,经过这几步设备级以及我们基于黑名单库、全网跨APP/跨媒体数据分析的话,我们就能够通过用户行为数据的角度帮助客户做防欺诈和反作弊工作。

DMP方面,白冬立介绍,把每个客户身上带的行为、属性都做了一些标准化,有了这样的一个标准化的系统我们就可以对外提供一些服务了,我们会把这些数据以标准API接口的形式开放出来,当然我们其实没有太多客户的隐私数据,都是一些互联网的行为数据去掉敏感的信息之后提供出来的,假设说有一个客户想要知道用户的互联网行为数据我们这里就有一些,我们跟运营商去做“三号合一”做唯一设备识别就可以获取到一些数据,都是一些什么数据呢?大概就是这样的8大类、62个标签以及400多个二级标签。基本属性大家都很熟悉了,行为习惯以及兴趣偏好,更多的我认为我们的价值停留在用户互联网行为数据偏好这块,如果大家对这块数据有诉求的话我们可以提供这方面的支持和保障。

基于数据、算力和新的人工智能算法的提升,白冬立认为,未来各行业将迎来人工智能爆发的时代,而热云数据作为第三方独立的大数据服务提供商,会在这个大趋势里有更加广阔的发展空间,为客户提供更多的优质数据产品服务。