中华网科技 发表于:13年11月29日 08:59 [转载] DOIT.com.cn
在2013年11月27日阿里云的发布会上,阿里云白培新解读一下阿里金融云目前服务的状况。以下是全文:
这一年来我们做了什么?今年早期我们就开始有反思,如果要避免银行的客户,因为自身的技术能力不足,当面对海量业务压力时,他们自身的IT积累传统方式没有办法满足互联网的压力,所以我们总结了他们的需求。第一从阿里云角度来讲,要接入更多银行,提高金融速度,所以首先要求是快速。以前我们部署一套生产环境,可能要花费一个月时间,当我们在互联网时代,特别是快速接入的时代,对于一个生产环境的部署可能容忍的时间是一个小时。
第二,这些银行和金融机构接上来之后,他们面临的互联网的特性是高并发高峰值,当峰值来临时你要准备很高的资源,峰值降下来的时候要考虑系统的投入。所以要求对底层IT资源做到弹性,金融机构和其他客户一样,当使用IT资源的时候一定要安全,第三是系统可用性一定很高,做到可靠。金融行业对于整个IT架构的快速、灵活、弹性、安全可靠的需求,其实传统的IT架构很难满足他们,针对于这个问题,我们今年年初成立了一个项目组叫聚宝盆。今天我们所说的聚宝盆是阿里金融云计算服务,我们取这个名字就是不仅希望云计算给金融客户能够带来云计算本身的好处,比如说高并发量、安全可靠这个特性之外,可能还有另外的一种例子,即我们希望金融客户用了这个东西以后,像天弘基金一样真的像投入聚宝盆一样,我们聚宝盆里也生成了很多的东西,包括像今天的天弘基金。整个聚宝盆是我们今年双11里的幕后英雄,整个聚宝盆项目保障了很多关于双11的项目,像天弘基金今年也参加了双11,今年通过天弘基金交易量达到1679万笔。因为天弘基金是一家基金公司,当天还有1288万笔的申购,所以将近3000万笔的交易,对他部署在云里的清算系统提出了很高的要求,那么天弘基金部署的清算系统在46分钟之内完成了。
还有众安保险,在11月6号才上线发布的公司,就要面临双11的挑战,他们推出的了运费险。一家公司新开业,一个系统新上线5天后面临双11这样的挑战,是什么让他们有这样的信心?众安保险双11产生了160万笔保单,他们系统处理了160万笔保单花了两个小时。另外还有八家银行,包括工行在内,在聚宝盆里的客户,今年在双11期间安全稳定渡过整个双11。
到底聚宝盆是什么?其实它有五部分组成,第一部分是最下面的物理集群,再上面是阿里云的云计算,就是我们的飞天,之后是标准的云计算服务,再之后是金融行业特殊的需求,我们提供相应的增值服务,最上层就是今天在座的客户和合作伙伴。
其中,考虑到金融客户特殊的监管要求,特殊的安全性,对于安全合规有很高的要求,阿里云第一次为一个行业单独定制了三个集群,单独在杭州的三个地方建设了三个独立的集群支持整个金融云的业务,阿里云机房里全部采用X86的,非常整齐。在这种物理数据中心之上,是我们整个阿里云最核心的东西,也是区别其他所谓云计算产品的部分,那就是飞天。飞天是大规模分布式的操作系统。简单来说,第一,提供计算和存储资源,这个计算资源到底多大?我用一个例子来说明,我们知道动画片的渲染,其实是高性能计算很典型的例子,对于传统的渲染工厂花一个月渲染的量,阿里云飞天平台只需要40分钟。今年8月份在手机上有一个动画片叫(昆塔总动员),效果完全不逊于好莱坞。这个动画片就是在阿里云上产生的。
第二,它还可以提供海量的存储能力。飞天可以供很多的客户来用,同时保证每个客户数据是完全隔离的。整体来说,飞天可以理解成一个集群的操作系统,就是可以把上千台的集群和起来,像一台计算机一样工作。飞天的特点:第一,是五千台计算机规模,可能很多人没有概念,那么一般的分布式的计算系统,几十台、上百台,一般都可以叫做大型的分布式系统了,上千台是超大型的,而五千台应该是超大规模的分布式计算系统,五千台是阿里云很重大的技术突破,阿里云投入人力花了4个月的时间。说起难度,举个例子,因为飞天是完全的分布式系统,分布式系统没有中控机,比如单个节点的状态变化都要同步到机群里的机器。单个集群的规模不仅仅是代表了技术实力的象征,更是代表了一家互联网公司对大数据存储能力或者分析能力的极限。
7月3日,阿里巴巴集团内部迎来了历史上最大的断电规模演习,阿里云有四千多台机器参与了测试,断电之后所有业务运营正常,但是服务器有十几台没有运转起来,大规模集群下的小概率事件是存在的,所以很多设备损坏的情况下依然没有丢失一笔数据,这就是我们做到的事情。这个事情在当今世界只有四家公司可以做到,其中就有我们阿里云。整个飞天是我们完全有自主知识产权的,阿里巴巴投入这么多人力和钱研发出来的产品。在很多领域都实现了零的突破,我们解决了这个领域里很多世界级的难题。目前整个飞天是支撑了整个阿里云所有的云计算服务,现在阿里云里已经有了超过十万家的中小企业。