在2013年11月27日阿里云的发布会上,阿里云白培新解读一下阿里金融云目前服务的状况。以下是全文:
这一年来我们做了什么?今年早期我们就开始有反思,如果要避免银行的客户,因为自身的技术能力不足,当面对海量业务压力时,他们自身的IT积累传统方式没有办法满足互联网的压力,所以我们总结了他们的需求。第一从阿里云角度来讲,要接入更多银行,提高金融速度,所以首先要求是快速。以前我们部署一套生产环境,可能要花费一个月时间,当我们在互联网时代,特别是快速接入的时代,对于一个生产环境的部署可能容忍的时间是一个小时。
第二,这些银行和金融机构接上来之后,他们面临的互联网的特性是高并发高峰值,当峰值来临时你要准备很高的资源,峰值降下来的时候要考虑系统的投入。所以要求对底层IT资源做到弹性,金融机构和其他客户一样,当使用IT资源的时候一定要安全,第三是系统可用性一定很高,做到可靠。金融行业对于整个IT架构的快速、灵活、弹性、安全可靠的需求,其实传统的IT架构很难满足他们,针对于这个问题,我们今年年初成立了一个项目组叫聚宝盆。今天我们所说的聚宝盆是阿里金融云计算服务,我们取这个名字就是不仅希望云计算给金融客户能够带来云计算本身的好处,比如说高并发量、安全可靠这个特性之外,可能还有另外的一种例子,即我们希望金融客户用了这个东西以后,像天弘基金一样真的像投入聚宝盆一样,我们聚宝盆里也生成了很多的东西,包括像今天的天弘基金。整个聚宝盆是我们今年双11里的幕后英雄,整个聚宝盆项目保障了很多关于双11的项目,像天弘基金今年也参加了双11,今年通过天弘基金交易量达到1679万笔。因为天弘基金是一家基金公司,当天还有1288万笔的申购,所以将近3000万笔的交易,对他部署在云里的清算系统提出了很高的要求,那么天弘基金部署的清算系统在46分钟之内完成了。
还有众安保险,在11月6号才上线发布的公司,就要面临双11的挑战,他们推出的了运费险。一家公司新开业,一个系统新上线5天后面临双11这样的挑战,是什么让他们有这样的信心?众安保险双11产生了160万笔保单,他们系统处理了160万笔保单花了两个小时。另外还有八家银行,包括工行在内,在聚宝盆里的客户,今年在双11期间安全稳定渡过整个双11。
到底聚宝盆是什么?其实它有五部分组成,第一部分是最下面的物理集群,再上面是阿里云的云计算,就是我们的飞天,之后是标准的云计算服务,再之后是金融行业特殊的需求,我们提供相应的增值服务,最上层就是今天在座的客户和合作伙伴。
其中,考虑到金融客户特殊的监管要求,特殊的安全性,对于安全合规有很高的要求,阿里云第一次为一个行业单独定制了三个集群,单独在杭州的三个地方建设了三个独立的集群支持整个金融云的业务,阿里云机房里全部采用X86的,非常整齐。在这种物理数据中心之上,是我们整个阿里云最核心的东西,也是区别其他所谓云计算产品的部分,那就是飞天。飞天是大规模分布式的操作系统。简单来说,第一,提供计算和存储资源,这个计算资源到底多大?我用一个例子来说明,我们知道动画片的渲染,其实是高性能计算很典型的例子,对于传统的渲染工厂花一个月渲染的量,阿里云飞天平台只需要40分钟。今年8月份在手机上有一个动画片叫(昆塔总动员),效果完全不逊于好莱坞。这个动画片就是在阿里云上产生的。
第二,它还可以提供海量的存储能力。飞天可以供很多的客户来用,同时保证每个客户数据是完全隔离的。整体来说,飞天可以理解成一个集群的操作系统,就是可以把上千台的集群和起来,像一台计算机一样工作。飞天的特点:第一,是五千台计算机规模,可能很多人没有概念,那么一般的分布式的计算系统,几十台、上百台,一般都可以叫做大型的分布式系统了,上千台是超大型的,而五千台应该是超大规模的分布式计算系统,五千台是阿里云很重大的技术突破,阿里云投入人力花了4个月的时间。说起难度,举个例子,因为飞天是完全的分布式系统,分布式系统没有中控机,比如单个节点的状态变化都要同步到机群里的机器。单个集群的规模不仅仅是代表了技术实力的象征,更是代表了一家互联网公司对大数据存储能力或者分析能力的极限。
7月3日,阿里巴巴集团内部迎来了历史上最大的断电规模演习,阿里云有四千多台机器参与了测试,断电之后所有业务运营正常,但是服务器有十几台没有运转起来,大规模集群下的小概率事件是存在的,所以很多设备损坏的情况下依然没有丢失一笔数据,这就是我们做到的事情。这个事情在当今世界只有四家公司可以做到,其中就有我们阿里云。整个飞天是我们完全有自主知识产权的,阿里巴巴投入这么多人力和钱研发出来的产品。在很多领域都实现了零的突破,我们解决了这个领域里很多世界级的难题。目前整个飞天是支撑了整个阿里云所有的云计算服务,现在阿里云里已经有了超过十万家的中小企业。
有了飞天技术做保证之后,上面是标准的云计算服务,第一我们常见的是云服务器(ECS),阿里云提供的云服务器不用担心硬件的损坏。第二,它非常的安全,还有整个非常良好的网络环境。第三是云服务器,对于有些金融的客户,比如像天弘的清算需要大量的云服务器,前面一定需要负载均衡,我们也提供了负载均衡,我们还具备了更高的安全性,我们的负载均衡其实是虚拟的负载均衡。第四个是数据库,我阿里云提供了两种数据库引擎,其中一个是我们多年优化过的引擎。另外它也是非常的弹性,阿里云用户在买RDS的时候,随时可以根据自己的要求调整要的数据库的容量和磁盘空间。除了这个之外,阿里云还有云盾和云监控。云监控的好处在于,金融云的用户不需要花任何一分钱就可以享受到很好的监控服务。而且用户也可以基于云监控写自己的插件,然后让阿里云的监控平台获取到业务平台的监控数据,这样用户就可以省去一笔监控平台的开发服务。
那么云服务之上是整个为金融行业的客户定制的服务。比如支持金融客户是通过专线方式接入使用云服务,金融客户来讲我们是支持金融客户使用专线,通过私密的加密信道的方式进来使用自己的云服务。第二是灾备,有很多人知道,在座的金融朋友们,在美国9.11事件发生之后大家都认识到灾备的重要性,德意志银行在灾难发生之后很快通过灾备系统恢复,而纽约银行破产。所以在银监会、在整个商业银行的数据中心监管里,就有一条指出,商业银行在取得金融服务许可之后,两年之后要设立生产中心,生产中心设立两年之后一定要设立灾备中心。但是实际我们在和金融客户聊的过程中,我们发现很多金融客户对灾备又爱又恨,爱的是不怕一万就怕万一,万一系统出问题还可以有一个抓的地方。恨的就是整个灾备系统造价太高,所以很多金融客户只是核心系统做了灾备,而边缘性的系统只能接受被动式的中断。
另外,我们银监会还出了银行业信息系统灾难恢复规范,要求灾备系统每年要做一次实际的切换。在金融行业里有很多系统只做灾备系统的验证,但是很少做实际的切换演习,阿里云希望能够借助我们的技术,在灾备领域的经验,我们希望把这个东西包装成非常简单的产品,让阿里云的小的金融客户,包括基金客户,使用这种非常专业的灾备能力。厦门银行就是一个例子,厦门银行在今年10月22日做了灾备演练的切换。整个历时不超过5分钟。所以我们在整个RTO里达到第六级。除了灾备之外还提供护航。云计算对于金融客户的业务非常重要,比如说双11期间会面临系统的业务峰值,这个时候我们后端会有团队24小时保证他整个系统平稳渡过,这就是护航。今年我有幸参与了整个护航,包括和天弘基金的樊总和金证开发人员一起在一个屋里度过了48小时。
对于金融客户来讲,存放到云里首先会担心数据会不会丢,我的数据是不是安全,我们从数据私密性的角度来讲,因为底层使用了飞天,从功能上来讲就是很安全的架构。每个硬盘即使拿出上面的数据全是碎片化的,而且坏的影片机房里出来之后都要通过脱磁的处理。这些东西也是因为我们有完善的安全体系,阿里集团有着国内最优秀的安全团队,这个安全团队从整个云计算的系统,从物理层、到网络层、应用系统、再到数据层,每个层面都做了很多安全的设施,这些设施通过了像公安部颁发了三级等的认证,还通过了ISO001的认证。这是我们为金融客户做的思考,就是我们有独立的集群,有很完善的成熟的飞天系统,再加上经过几年的验证,标准的云计算服务,包括为金融客户量身订作,这就是我们聚宝盆做的事情。
聚宝盆从开始到现在,短短几个月,在它的上面已经产生了很多的客户、很多的合作伙伴,这些客户来自于基金、证券、银行、保险,像天弘基金今年比较火,包括众安保险,很多家的农村银行、村镇银行,包括招商证券,其实这些客户已经成为了第一个吃螃蟹的人,除了这些之外,阿里云是云计算公司,不可能直接服务于金融客户,更多的是需要和金融领域里已经领先的合作伙伴一起,来为金融行业客户提供更加完善的服务,这些合作伙伴,像金证、恒生,这种在整个金融行业里拥有很大市场份额的合作伙伴,和这些合作伙伴一起,他们提供针对于整个金融行业的解决方案,我们提供云计算平台,比如和科蓝,他们提供软件的解决方案,我们提供云计算的资源。
说了这么多,阿里巴巴这么多年来,我们是一家互联网公司,我们随着自己业务的发展,从传统的IT架构转到互联网架构,这也是互联网架构能够允许我们今天的业务做到这么大的原因,我们也相信未来互联网金融也一定需要互联网化的技术做支撑,所以云计算一定可以帮助到互联网金融的客户去创新。