创新有数,商业银行这样为数据存储“打底”

近日,由存储联盟、BanTech智库、百易传媒DOIT、浪潮信息联袂举办的“有数·对话”线上直播。本次对话,中国银行数据资产运营中心处长李东亚、中国农业银行研发中心专家赵存超和浪潮信息存储产品线总经理李辉三位专家,共同围绕金融科技发展的新潮流、新挑战、新底座展开交流,对话由BanTech智库焦卢玲主持。

在人民银行发布的《金融科技发展规划(2022-2025)》中,明确提出要“激活金融数据要素潜能”、“加强数据能力建设”、“夯实金融创新发展数字底座”,加速金融数据基础设施建设势在必行。与金融科技热潮相呼应,浪潮存储正迎来高速增长,一季度浪潮存储装机容量增长40%,七倍于市场平均增速,装机容量约为1.5EB,占全球总装机容量的12%。快速增长背后,像浪潮这样的存储公司如何助力金融转型,金融新数据需求和存储新技术发展能否双向奔赴,未来如何再攀高峰呢?

 01道: 加速金融科技创新为什么

主持人:银行业作为数据密集型行业,数据是推动其转型发展的关键抓手和核心引擎。在您看来,发挥数据的创新引擎作用,对于银行业推进数字化转型的意义集中在哪些方面?

赵存超(农行):以数据为核心推进数字化转型,在银行业主要体现在四个方面。

 第一是“全”。农业银行有一个战略是服务乡村振兴。比如茶叶种植、生猪养殖等等,不同三农领域的金融需求不一样,我们通过遥感卫星、物联网采集数据,通过牛脸识别、智慧耳钉等方式获得数据,基于内外部数据分析推出了面向不同三农产业的金融产品。这背后有三千多种数据产品的支持,是数据赋能了银行的产品研发。

第二是“准”。现在银行在推数字人民币,数币推广过程中需要线上线下协同精准营销。这背后是数据中台和营销中台的合力,数据中台可以准确提供客户画像、筛选出合适的客户,营销中台在合适的时间推销合适的产品、额度,以数据推动客户精准服务。

第三体现在“深”。风控智能化非常重要,需要用数据的能力提升银行业风险控制的能力。例如,一些集团客户是隐形的,没办法直接识别,我们利用数据,基于知识图谱建立可以“往下深钻十层”的能力,通过分钟级数据分析可以看到其中的关联,识别隐性、潜在的集团客户、控股关系。

最后是“快”。对于银行业而言,用数据来支持管理决策已经大众化了;但如何让数据能力快速支持决策,这个要求是很高的。银行需要准确地、实时地感知行内的生产经营变化,把提示、预警、监控信息发送给经营管理者。

总之,银行需要从全、准、深、快四个维度出发,以数据赋能产品创新、精准营销、风控和管理决策。

主持人:银行在探索新技术、抢抓数字经济红利方面有哪些经验?

李东亚(中行):新技术的发展为银行数据价值创造带来了无限机遇,过去数据加工和存储成本过高,银行无法对海量数据进行处理,无法从数据中获取价值。现在IT技术快速发展,在数据加工、存储、智能分析等方面都可以满足银行的需求,过去银行汇总海量数据要花几天时间,现在在大数据技术支持下,几个小时就可以完成。

赵存超(农行):新兴技术的发展对银行深度利用数据提出了很多挑战。比如,隐私计算对底层安全硬件、上层算法提出了很高的要求,我们曾经在苏州分行和当地人行、其他十几家金融机构一起尝试隐私计算,实现了信息要素的流动,做到了只有一家银行无法做到的事。还有数据编织,银行现在有很多数据,这些数据如何资产化,资产化之后如何进行数据管理是很大的挑战;尤其现在是云时代,数据可能分布在远端或其他公司,不同地方的数据需要进行分布式管理。为了能够智能的查找到所需的数据,我们采用了一个比较超前的技术——数据编织,把分布式环境下的数据在不同区域分开算、分开存,但在逻辑上又能够通过语义解析技术获得元数据信息,从而组建数据地图。这说明在大数据时代,银行可以用创新技术来解决数据资产利用、价值挖掘中遇到的难题。

 02法:  数据要素如何支撑数字转型

主持人:结合人行发布的《金融科技发展规划(2022-2025)》,谈谈农行在金融科技创新发展方面的总体规划和独特见解?

赵存超(农行):农行也在积极探索,行里提到建设数据友好型系统,基于数据中台、业务中台形成闭环。数据中台类似“生鲜超市”,能够把所有领域的数据汇聚、融合在一起,形成数据动产;业务中台则是“米其林厨师”,基于数据中台提供的数据能力,为前台提供敏捷的服务,支撑数字化转型。

围绕数据闭环,我们总结出“产、采、建、用、管”五个步骤,覆盖从数据形成到使用再到价值创造的各个环节。首先,产就是数据从哪里来,不管行内还是行外的数据,产生过程中都要有标准、有规范、保证质量。同时互联网数据非常重要,之前银行的数据相对来说比较单薄,以后需要获得更多的客户行为数据。第二是采。有了数据之后需要按照标准化的方式、接口把数据采集起来,放到数据湖里。第三是建。把数据建设成为资产,通过数据模型化把数据资产沉淀下来,给后续应用提供基础。第四是用。银行需要提升数据使用能力,包括使用AI、BI、知识图谱、隐私计算等技术,让这些技术成为数据资料深度应用的加速器。最后是管,从数据流转过程来讲,管能够支持整个数据流转过程,保证数据质量不断迭代优化和流转过程有序进行。

主持人:深挖数据资产价值离不开数据基础设施建设,请您分享对于金融科技创新中“有数、有底”的解读。

李辉(浪潮信息):刚听了两位专家对金融行业数字化转型的分享深有感触。金融行业越来越依赖数字化手段,这些数字化手段其实要回到一个本质就是数据,而数据需要物理载体,就是数据存储基础设施。浪潮作为IT基础设施提供者,需要为数据的闭环处理提供一个数据底座,有效支撑端边云新兴技术架构下数据采集、传输、处理、使用和管理的整个业务流程,这称之为“有底”,即我们会提供数据存储基础设施。

同时,从数据底座的能力维度看,金融需要的是安全、可靠、经济、高效的底座。这样的底座能够保证金融业务(包括刚才提到的金融创新产品)服务永远在线、数据永不丢失、性能永远满足、容量永远够用,这也是有底的第二个含义,就是数据存储底座要能够更好地支撑前台的创新应用,支撑数字化转型过程中的数据全业务操作流程。

李东亚(中行):李总讲的非常好,“有底”从基础设施来讲,就是要保证数据有底气。现在监管一直在强调数据的加工能力和数据价值的创造,这些都是建立在良好的数据架构以及强大的数据基础设施之上的。没有一个好的数据基础设施,不可能保证数据加工的时效性、完整性和可用性。数据价值是经过大数据汇总、分析而产生的,数据价值挖掘要依赖于数据底座,包括像浪潮存储提供的数据能力。

 03术: 以新存储应对金融新数据挑战

主持人:银行数字转型过程中,遇到了哪些数据存储方面的挑战?

李东亚(中行):数据存储是一个永恒的话题,随着IT技术的发展,数据存储访问能力越来越高。同时银行业务服务范围越来越广,产品创新不断增加,银行数据量不断增长,如何保存银行业务历史数据,将对未来智能化分析产生重要影响,所以可以说银行业务对于数据存储和访问的需求是无限的。

在银行成本管控之下,数据存储既要满足当前业务需求,也要满足未来长远数据战略。银行需要制定合理的数据架构和存储模式,按照数据应用优先级进行合理管控,但这也带来数据管理和架构设计的复杂性。如何在确保数据完全性的前提下,满足数据高效访问的需求,是未来存储面临的一个挑战。

赵存超(农行):银行业对数据的需求越来越旺盛,我们想要的、需要的、获得的数据越来越多,我们要去强化数据底座。转型过程中,数据容量、性能要求越来越大,这里面有一些矛盾的,怎么解决呢?我们正在推进数据湖建设,引入了存算分离的架构,把AI计算这种耗内存、耗CPU的计算能力分出去,把大量历史数据沉到对象存储里去,轻者为上升为天,浊者下降为地。存算分离模式能够很好地发挥底层大容量存储的能力,同时上层又能发挥高速运算的能力,再加上中间网络能力的提升,能够在一定程度上解决数据爆炸式增长带来的挑战。

主持人:随着金融业务不断创新,数据发生了怎样的变化?

李辉(浪潮信息):其实刚开始对话之前我认为金融行业不需要过多的依赖于机器采集,但刚才赵处讲了农行的一些业务场景,比如农行需要借助遥感卫星、物联网等机器采集手段来采集数据,这是颠覆了我的认知。另外,银行需要在整个服务过程当中采集数据,这些数据相当于次生数据,对下一步提升线上线下服务的时效性和质量有重要作用。

赵存超(农行):金融行业的数据呈现了几个不同的特点。一是实时化程度提升,数据采集、利用的实时性要求提升了。第二是多样化,不只是数据的结构多样,结构化、半结构化、流式等等,还包括数据的来源不同,可能源自行内,也可能是外部物联网设备的信息。而且越往前走,随着元宇宙时代的到来,虚拟世界里拿到的数据会越来越多,数据变得越来越丰富。第三是数据价值方面,银行所需要的数据深度越来越高,需要做深度分析和挖掘。所以要“有底”,银行需要用新的算法和技术,对数据进行多次的加工、汇总、整合,形成数据资产,把价值充分发掘出来。

李东亚(中行):随着金融管理程度越来越高,银行本身的基础数据是远远不够的,需要深入挖掘客户信息。这些信息一方面是通过银行核心业务系统进行数据的采集,另一方面也要和外部机构进行合作,引进工商、税务、海关等外部机构的数据,把这些数据跟银行自己的数据整合在一起,形成客户的全面风险数据。另外,非结构化数据也很重要。怎样将非结构化数据引进来、使用好并产生数据价值,需要在数据整合和应用上有比较好的应对方式,这一方面需要银行自身的创造,另一方面需要像浪潮这样的存储公司提供支持。

主持人:浪潮存储在推进金融数据基础设施建设方面有哪些先进方案?

李辉(浪潮信息):刚才两位专家提到了一个金融行业对存储的关键需求,就是数据饥渴,即需要用更多的数据来满足智能转型、场景服务、产品创新的需要,也就是围绕数据全方位创新的需要。

从数据存储上来讲,金融行业从过去关键应用到未来智能化应用发展过程中,整个架构在发生着变化,要用新的理念来看待存储公司提供的存储基础设施建设方案。

首先要坚持一些原则:安全、可靠、经济、高效。在安全方面,金融行业对安全的要求越来越高,不光数据底座需要具备安全能力,里面的组成模块也要具备。在可靠方面,金融系统要求业务和数据7×24小时在线。当然还有经济性和高效性的要求,金融行业的数据量,现在是PB级,未来会有更大的发展,浪潮存储会为金融行业提供更高效、更经济的存储平台。

在基础要求之外,结合金融业务场景的复杂化以及整个基础设施的变化,我们提供三个方面的解决思路:场景化、平台化、专业化,这三化是纵横结合的解决思路和方案。

其一,纵指的是金融行业的应用场景,像刚才农业贷款产品、金融监管产品等等,我们要坚持场景化,围绕场景化来构筑对于银行来讲好、合适的系统。

其二,在PaaS或DaaS层面,我们还应坚持平台化,刚才讲到的数据湖、数据仓库、数据编制、分布式数据处理和计算,以及围绕“产、采、建、用、管”的数据处理和汇聚过程,都需要平台化方案,让数据打通和流动。

其三,IaaS层的基础设施需要专业化。刚才赵处也在提存算分离,不同场景和平台对于计算和存储的要求各有各的特点。金融核心应用要求高可靠、高安全、高性能、低时延,金融渠道和服务业务需要敏捷、弹性,不同场景下需要有专业化的产品。面向核心业务浪潮提供全闪产品;面向渠道业务、微服务业务,我们提供云化基础设施,存储产品要具备超强的云化对接能力,提供更具弹性、横向扩展的架构,符合未来两地三中心甚至三地四中心的需求。

主持人:如何看待未来应用的变化,数据基础设施如何满足上层应用的变化?

李辉(浪潮信息):未来应用至大的变化是需要越来越多的借助于数据。金融应用正在从自动化到智能化、从线上到线下、从无人化到人性化,其核心是更加有效率、有质量、更安全可靠,比如线上的人性化,会在留客方面变得更加重要,将是银行非常重要的竞争力。再往下到技术层次,数字化、数字孪生和元宇宙这三个技术会促进金融产品、服务、商业模式的创新,这些都需要数据的支撑,需要数据基础设施来存储、保管数据。

浪潮希望通过全方位的数据存储产品,更好地支撑金融数字化转型,支撑像中行和农行这样的数字化先锋用户,释放数据要素价值推动数字经济发展。