IBM李永辉:智慧运算的软硬之道

“Power智慧随需 运算决胜千里-2011 Power Unix World论坛”于4月27日在北京索菲特酒店举行,会上IBM展示了智慧运算在医疗、金融、通信等行业的美好愿景,更将战胜人类智慧而名声大噪的职能机器沃森(Watson)请到现场,让广大朋友全面地认识了超级电脑沃森。

沃森是由90台IBM Power 750服务器、360个计算机芯片驱动组成的计算机系统,拥有15TB内存、2880个POWER7处理器、每秒可进行80万亿次运算。在沃森智慧运算能力背后的秘密被揭示以后,IBM系统与科技事业部技术经理李永辉发表了名为“AIX+Power7软硬兼施打造完美的企业级系统”的主题演讲,分享了Power平台与AIX搭配实现智慧计算的最佳实践。

IBM系统与科技事业部技术经理李永辉

以下是演讲全文:

大家上午好!

IBM的Power平台已经发展二十年了,我先跟大家分享一下什么是Power,什么是AIX,然后讲一下企业主的需求,Power是IBM中的一个服务器,它的定位在Unix平台来讲是属于高端主机和X86之间的一个平台。如果今天的客户面对的挑战是需要扩展性能更高的平台,Unix平台是一个不二的选择。

Power的定位在X86以上跟主机之间一个平台,这个图就罗列了IBM在2011年Power7整个产品线,之前李红老师跟大家已经介绍了,IBM在Power有一个Cloud-Box,2011年发布了很多刀片,密度提高一倍,703、704的 机器这个非常适合做云架构的环境。同时大会邀请了我们的客户,采用了Mason Box,我们还有一些高端的服务器,我们最高端就是780的机器,未来我们会发布性能更高的一个平台。这就是AIX Power的现状。

AIX是IBM 开发的一个加强版的Unix系统,回想一下Unix发展由来,在市场上推出二十多年,Unix为什么在二十年前开始这么蓬勃的发展呢?它是一个开放的平台,它是多个厂家来共同支撑Unix平台,不管你采用哪个厂家的硬件架构、操作系统,只要它属于Unix,你都可以很轻易把应用迁移过去,Unix内核是多操作系统的一个操作环境,它可以让你很有效的,很简化把你的多个应用同时跑在一个平台里面,非常有效,非常快,非常安全可靠。这就是Unix的一个好处。

大家根据Unix 在市场里面占了很大比例,好象没有太多人在用,这是一个非常错的看法,我们看一下IT行业,过去几十年IT从来没有只有一个操作系统,我们客户需要有多个选择,客户会需要比X86性能更高的操作系统。 

我们回头看看今天的IT环境,苹果的操作系统是一个BST的核心,如果苹果操作系统颠覆了操作系统平台,我们AIX为什么不能颠覆整个IT环境。

Unix有很多种,加强版的AIX主要是针对 企业级的客户,它很好配合IBM的Power处理器,Power处理器是IBM Power平台的核心,IBM在十几年前决定了,我们要主宰IBM Power核心的开发,我们不停开发新的操作系统,新的Power处理器,发展到今天已经是第七代了,跟我们友商不一样,友商让别人开发,我们坚持了 Power的开发,以至于我们才有Watson的机器,使用了Power的芯片。AIX是非常具有生命力,我们有Watson系统,还有许多新功能的加入。

2011年Power已经发展到第七个版本,我们扩展性最高2560的内核,1254的线程。IBM今年发布里面也提到 AIX,我们也听了广大客户的需求,已经把我们支持时间从两年提升到三年。AIX7.1C,C是大版本,7.1是小版本,7.1里面每年会推出补丁包的更新,我们允许我们的客户在同样的版本里面支持三年。这种是没办法让其他非企业级的平台提供支持的。

说回到今天的主题,企业级的平台,到底我们的客户对IBM企业级平台有什么要求,可以规律到以下五点:

第一,性能与扩展性,作为企业级的平台,你的性能不能说跟PC服务器一样,不要说跟X86工作站一样。Power平台实际上做了很多的性能改进,我们可以让我们的用户用更少的机器,实现更少的性能,同时在中国我们的客户群,我们处理得数据量,还有我们的交易量在很多领域,很多领先的行业,我们发现已经突破的全球领先的需求。Unix在中国是一个非常好的平台,来支撑中国客户,未来面对十二五的发展等等。

第二个,可靠性的要求,作为企业级的系统,我们要比X86可靠性很高。如果企业单位服务器出现故障,还要跟上级报告。

第三个,系统灵活性,市场是动态的,同时间技术的发展,我们发现CPU芯片的发展超过核的发展是没法改变的事实。这时候无法用一个有效的应用满足所有用户的需求。我们怎么可以用有效虚拟化的技术整合到企业级的平台,IBM有一个自主开发的平台,我会给大家讲到这方面的技术。

第四个,系统的管理性,刚才处理一个《危机边缘》的游戏,IBM用了90台的Power750机器搭建一个系统,你怎么在机房里面搭建这样一个基础环境,已经是一个非常重要的考虑。我们企业客户已经管理上千个操作系统的环境。几百台物理机器,如果没有很好的整合系统管理工具,企业级的平台是没办法筹建的。

第五个,如果选择企业级的平台,一定那个平台是具有生命力,一定要有一个长远发展的应用,像我们Cloud-Box应用,还有合作应用,云的技术,这都需要企业级的平台有这样一个特色。我们相信未来几十年,这会是我们企业级用户新的需求。

IBM的Power的平台配合AIX怎么帮助各位建立一个新一代的企业级的数据中心。Power芯片其中重要的P,代表性能,我们的性能要保障在市场中的先进性,其中包括X86平台。黄色代表业界最好的,除了IBM以外最好性能指标,蓝色是代表IBM同样测试指标的一个测试值,多个数据和测试值,ERP的测试值,正点计算,否定计算,我们比另外一个平台高两三倍性能的提升。你的业务性能响应时间可以加快,你要处理一个报表,那些都是CPU捆绑类型的应用,我们可以处理比友商快很多倍。现在软件费用也越来越高,随着我们可以用更高性能的CPU,可以大大节省各位在软件上面的投资。这就是为什么我们需要更高效能的服务器,完成你们更快、更关键的应用。

IBM的Power定位在主机和X86之间,我们可靠性最接近主机。只有IBM有主机的经验,只有IBM才能跟客户讲,我们的机器是接近主机,我们设计理念里面已经把很多主机功能带到小型机上面。我们虚拟化的平台叫Power VM,这跟我们主机虚拟化设计都是同一个技术。IBM的Power 虚拟技术可以做的非常快速、方便,我们机器还加入了热插拔的功能,还避免非计划停机。去年Power团队给我们总裁做了未来产品的汇报,我们提出对未来 Power平台的看法。我们提出的要点是希望未来的Unix平台,有机会做到接近非计划挺进到零, 我们机器设计会陆陆续续潮着高可靠的分享发展,同时间除了我们已经有的功能性以外,IBM作为企业级的供应商,我们非常关心到我们客户发生到每一件事情,我们IBM内部有一个把所有记录拿出来分析,到底我们的机器里面还有什么样的可以创新的,加强的地方,理论上我们发现有一个问题,当时没有考虑到,这个会有,开发者会抓取我们客户发生过的事情,来看一看怎么解决这些问题,再继续反馈给我们的开发者发布更新的功能。 

我们减少了操作系统层里面内层的重复,两个底层驱动器同时写在页面,我们在CPU里面加强了重复的功能,增加CPU的可靠性高达100倍,我们高端设备有双时钟,不需要停机,这些功能都可以加强进去。

我们看到Unix服务器平台比其他平台要好十倍的可靠性,一台机器99.997%的可靠性,你们都不满意,我们还可以透过PowerHA,通过双机互备的方式,还有一个BB2的主机架构带到小型机数据库环境,搭建一个非常高可靠的平台。那个可靠性比99.997%还要高很多。

可靠性作为企业级应用非常大的关键,IBM做了很多事情,你们平时看不见,包括这个,这证明IBM产品质量是非常好的,某型号的机器会把测试环境放在里面,模拟地震里面的状态。这台机器是一台高端IBM的Power 服务器,整个过程里面可以模拟3.8级地震,还可以正确运作。这台机器是一个机柜选件,你可以让你的机柜软件倒在地上,做测试。

3月份IBM东京数据中心状况就是这样子,经过地震以后,我们机器都是塌下来了,东京的同事告诉,整个机器都是平躺着的,有趣的整个数据中心正常运作。这是经过地震考验的一个结果,你们回去不要把这些故意推倒。

这个经验里面他们也提了一个很有趣的经验,如果要避免地震对你们造成的影响,企业级虚拟化不可避免,IBM虚拟化是主机虚拟化的工程师来设计的,PowerVM性能是业界最好的,无论是你到未来256个CPU跑应用,整个分区可以从5个CPU延展到250个CPU,同时我们在一个机器里面划分 1024个分区,这是硬件的分区,还没有算到软件分区,那个技术是非常可靠的。作为我们分区的功能,我们能提供计划外停机状况下的从一台物理机到另外一个物理机,可以作系统维护和升级。

Power是IBM自主开发的,Power芯片也是IBM自主开发的,我们可以设计很多功能是别的虚拟化不能做到,我们能做到共享内容的功能,我们能做到内容压缩的功能,我们现在一提机器分很多分区,往往是CPU用光了,你的内存没用光,也可能反过来你的应用对内存需求越来越高,你的内存已经用光了,我们可以虚拟处一些内存供给你。

我们服务器采用VM做了一些虚拟化平台的时候,它发现机器可以采用软件仿真很多小的分区,很多分区放在一台的时候,你的IO就出现瓶颈了,这个机器也变得不可用了,IBM设计功能的时候,考虑到CPU的虚拟化,还有内存怎么有效的贡献,IO虚拟化有三种,可以采用专享的,共享,还有可以采用虚拟IO方式,提供IO吞吐量和承诺不同业务的需求。

这也是一个测试,我们在IBM虚拟化来讲,我们采用了IBM的PowerVM,配合AIX750的机器,来跟一般的X86 架构做一个对比。这是四个插槽的机器,跑虚拟化的时候有很大的差异。

第一个,IBM的PowerVM更有效,蓝色的性能比绿色的性能高,在同样的CPU数量下面。PC机技术有扩展到上线,可以拓展到八个CPU以上,没办法拓展上去,如果你今天有一个很关键的业务来跑你的应用,可以在很多分区里面,VM扩展不能超过八个物理CPU的功能,如果你是企业级的应用,你希望一个PowerVM的功能,可以从一个CPU到几百个CPU,或者切换到一个物理的机器。这也是提高CPU的利用率。

IBM的虚拟化技术,因为采用硬件实现的,PowerVM是软件实现, 可以提高效率,我们可以把所有的CPU资源提高到90%,相对于PC虚拟化技术,尽管你把CPU用满了,你所有的性能顶多用到50%,你可以看到,从虚拟化来讲,IBM的Power是根据企业级方案来讲的。

企业级另外还有一个方向,就是管理,我们看到企业级管理客户数据中心已经是一个非常重要的问题,我们客户 往往要管理上千台物理机器,IBM开发Power平台的时候,同时间我们会有系统管理工具统一开发,这个管理工具不是设计一台机器的管理,而是设计一个资源池的管理,Watson 90台机器都可以用一个平台管理。

2011年的版本我们也整合了硬件平台整合在里面,可以透过一个平台提供系统的管理和硬件分区管理划分等等,同时我们也有一些插件做一些有效能源管理,可以帮你监控,数据中心的耗电是非常庞大的,如果你没有办法可以收集到机房的耗电,你根本没有本身管理数据中心,新的Power全线产品,包括最高端的产品,我们可以提供一个能源管理模块,收集持续功能。

Power7也有一些节能的功能,可以提高主频130%,或者把性能降低,把能耗降低40%到50%。

你选择一个企业级的应用,不希望若干年不能持续用,应用开发商和一些中间件软件等等,还有刚才听了很多云计算平台,Power提供一个很好的架构,给你一步一步走向云的平台。

刚才介绍了企业级的平台的特性,IBM为了让我们更多的客户感受到企业级的平台好处,希望他们能够从X86PC服务器迁移到Power的平台,IBM开发了一个天工计划,配合我们的合作伙伴,把更多的应用搬到Power的平台上,让我们的客户感受到企业级平台的好处,天工计划采用了中高端的机器,这里非常高兴请到我们一个合作伙伴,汉铭信通有限公司的杨番女士,给我们介绍他们的企业级应用。