金融与大数据有何新玩法?纵深扎根仍是不二法则

日前,2018年胡润新金融百强榜单揭晓,行业内外均认为,大数据、云计算、物联网、区块链等技术支撑对金融行业的推动和变革。在多种变革驱动力中,大数据对金融行业实现“数字化”的贡献和推动不可小觑,特别是在精准营销和智能风控上作用尤为突出。

面对金融行业纷繁复杂的个性化需求,只有脚踏实地沉潜下来的数据科学平台提供商才能走到最后,走的更远。

今天,赛迪网团队带着探寻金融与大数据的背后故事的初心,走进“北京九章云极科技有限公司”(以下简称“九章云极”,)与其CEO方磊博士深入交流,从公司的创立初心和心路历程了解如何“5分钟拥有大数据能力”,让我们对再熟悉不过的“大数据”有了深层理解。

九章云极CEO方磊

与“数据”的不解结缘立足“三个转变”“纵深”扎根金融 

在方磊博士介绍公司历程和产品平台之前,首先提及“数据”和“金融”两个关键词,这也让我们好奇为何公司在“金融行业”坚守至今。

后来得知,这离不开方磊之前的“数据”工作经历。作为早期参与微软云计算平台研发的团队成员,积累了对大数据不同的认知。而后来在微软必应(Bing)搜索任资深开发工程师经历让他深入参与了开发、设计基于下一代大数据技术的索引处理架构的研发工作。与“大数据”的不解之缘不仅具备了对大数据未来发展趋势和下一代处理架构的敏锐嗅觉,也让他在创立公司初期迅速找到合适赛道,选择为金融行业服务。他相信凭借金融行业目前的良好数据基础,可借助智能平台深挖“大数据”中蕴含的无限宝藏,这终将让企业焕然一新、壮大发展,同时也让九章云极拥有行业内的一席之地。

选定金融行业的海洋后,接下来就是对“智能分析”的漫漫攻关之路。虽然大数据分析平台在人工智能、企业信息化、数字经济的概念下被炒得火热,但早已不是报表、统计表的时代,现如今的“智能”更应符合行业信息化和数字化转型的刚需和痛点,这背后可用 “三个转变”概括,这也是攻关克难之路上的指路灯。

方磊博士介绍到,现在大数据分析模型需要着重提供大量可视化服务、从离线服务变为实时、在线服务为主,从单机管理到分布式管理,这三个转变意味着传统的人工“看报表”、“审核”的模式亟待转型。简单的人工如何高效准确处理“大数据”,特别是金融行业每秒产生成千上万的交易数据,这无疑是巨大挑战。

以银行为例,原来是多个独立数据库存储业务数据和运维数据,形成数据仓库,一旦有调用需求则由人工选取数据生成报表,最终交给审核人和企业领导查看。可以看到,人工操作贯穿始终。

但现在,日常业务数据、报表数据和运维日志数据会采用SQL查询,通过Hadoop新一代超融合架构,查询性能单机数据扫描量可达到350MB/秒,这正是九章云极核心明星产品——DataCanvas智能数据平台,让金融行业面对业务高峰不再无所适从,而是集中整合数据资源从而改进营销活动、激发客户新需求。

DataCanvas

在数据预处理之后可大浪淘沙留下最有价值的元数据,接下来是金融业对大数据分析最为渴求的“可视化展现”。数据科学家借助平台提供的超过140个的机器学习算法模块和可视化图标创建及数据预览、数据准备、数据建模、算法运行等多种功能一体的管理界面。让企业用户拖拽算法模块即可完成数据分析流,自动构建用户画像、精准营销。

金融行业面对高峰业务量的另一刚需则是“实时处理”,以往批量化输出分析结果的做法早已过时,DataCanvas[zI5]  RT实时处理平台则借助机器学习、深度学习构成的数据模型实现流数据实时处理,离线系统对接功能还可全面贴合生产化业务场景,让企业随时随地享受便捷。

这一切塑造了全能型的DataCanvas 智能数据平台,这背后同样代表了“纵深战略”的另一层深意。方磊博士说道,很多公司都是横向战略,就像冲咖啡,不断加入各种配料,最终让用户可以一饮而尽。但九章云极的思路不同,纵深了解用户后,提供用户所需多个模块,之后不再需要“加料”,而是直接饮用,像 “喝咖啡”一样,便捷享受。

所以,方磊博士带领公司团队深入分析银行客户提供的交易数据、外汇储备数据、储户脱敏的可公开的个人数据、风险控制数据、信用评价数据等细分数据,看似领域“小”,但扎根进去会获得不一样的“大数据”。

直击“智能”核心完善“二次开发”

所谓人无我有、人有我优,数据服务平台琳琅满目,在“纵深”战略引导下,公司仍旧从“数据”本质研发核心优势,因此方磊博士提出,现在和未来的产品迭代还需紧贴金融行业面临每秒海量交易数据的实时处理之需,通过海量大数据不断训练计算机,数据科学家优化数据分析模型,让机器学会“智能、自主”。

自然语言处理、机器学习、神经网络、遗传算法等众多人工智能技术可用于金融新兴业务中。在股票价格、交易量、宏观数据、上市公司账目等数据量化成各类指标后,改进金融行业的多因子模型和理解文本的能力。大数据不断训练之后,数据分析模型可灵活处理更多维度数据和多样化场景,像人类大脑一样自主决策、自动触发相应指令。人力在此基础上可寻找深层规律,完成创造性工作,解放人工。未来还可开发出风险量化模型体系、精准营销模型体系、智能投顾模型体系以及用户洞察模型体系等,拥有更强智能。

凭借稳定性和标准化的服务流程,计算机在每个特定场景下准时触发指令,例如向高精准客户推送消息等,计算机可100%执行,这比人力贯穿的模式着实提效不少。

当然,“分析模型”需要不断迭代、优化升级,同时用户的需求也是纷繁复杂,这就引出公司研发的另一重点——二次开发功能。

众多银行客户都会出于安全考虑将数据布置在私有云之上,甚至每个分公司的数据并不连通。方磊博士谈到,这意味着此前简单的一个借口、一个指令、一行代码可以迭代的应用和服务,现在需要一个团队、多次完善、不断磨合和沟通才能完成,但其实是提高产品性能的绝佳机会。与不同金融企业的反复磨合、适应中痛并快乐着,方磊博士始终坚信,没有真正的捷径,捷径都是时间和心血的沉淀。

人工智能并非绝对至上

正如同产品平台和研发从数据出发一样,方磊博士对当下新兴技术的看法也从“数据”讲起。

在人类对“智能”的理解尚未深刻和统一之时,不能简单将人工智能摆在绝对至上位置,并非凌驾一切的神圣。目前,深度学习算法从2010年以来的确取得进展,但在可解释性上还存在前进空间,不能因为机器学会交互就判定具有智能,智能和行为不能完全等同。

信息化为行业提供大数据基础,智能分析平台让数据互联、与业务形成闭环,闭环提高企业产品和服务的迭代效率。人工智能的意义则是通过大数据不断训练计算机快速掌握自主学习能力,像人类大脑般可基于历史数据总结超乎想象的规律,达到资源的优化配置。

坚守纵深战略从一而终,以更优化的算法模型和更高性能的计算存储能力从容应对多样化、个性化金融行业用户需求,这是九章云极简单而独特的心路历程。大数据与金融的深度结合,势必会造就未来更大的产业变革,这也推动着“纵深”战略的继续加深,吸引行业内外随之深入了解更多细节。