前不久,曙光刚刚推出了第三代刀片服务器-TC2600之后,这款刀片服务器不仅承载了曙光人3000万元的研发费用,也是第一款符合我国刀片服务器标准的服务器产品。众所周知,高性能计算是曙光公司的主打方向,在推出新一代刀片产品之后,我国刀片服务器标准的具体含义、曙光如何看待刀片服务器市场、以及新刀片服务器的特点等等,都是我们非常感兴趣的问题,就这些目的,我们对曙光信息产业公司研发中心总经理曾宇进行了专访。
未来的刀片是竞争重点
曾宇总经理首先介绍了目前国内外刀片服务器在高性能计算领域的产业格局:
IDC预测,到2009年刀片服务器在市场的份额将达到25%,总出货量将达280万台,市场总额将达90亿美金,所以今年很多企业在刀片服务器方面做了大量投入。IBM在2004年就开始与英特尔创建刀片产业联盟,其他一些国际服务器巨头也把他们的目光和视野定焦在刀片服务器上。与此同时,由于能满足用户高密集部署的需求,大量的企业和学术机构也把他们的目光定位在刀片服务器。2006年11月份,全球超级计算机Top500排名中就有70套超级计算机系统使用了IBM的BladeCenter刀片服务器。
在中国运算速度排名前10的超级计算机中,我们可以看到六台是刀片,而在中国超级计算机的TOP100中,刀片服务器更是占到67%,这个比例非常惊人。尤其是地球物理、生物计算、气象等等这样一些领域,几乎是清一色的IBM、惠普的刀片产品,没有自身的技术优势,就无法让用户使用自己的刀片服务器产品。
刀片的整体性与排他性
曾宇表示,刀片服务器有整合性的特点,另外具有排他性,你如果用IBM的刀片服务器,以后只能用IBM的框架和技术架构。所以谁占领了这个领域的制高点,谁就可能掌握了在服务器领域的主动权,所以去年IBM专门用了一亿美元来做推广,另外一家在加州的企业获得了3200万美元的风险投资,主要的领域就是虚拟计算,绝大部分我们的对手,在国外的企业,都把刀片作为他们主要的技术选择方向,曙光面临这样的现状,只有研发自己的刀片,没有别的选择。
我们看国内外的排行榜里面,大量的企业使用刀片服务器来构建高性能计算机,所以未来大量的三、四百万亿次计算机将以刀片服务器作为载体,所以我们必须作出自己的选择,要做刀片服务器,而且做出我们的特色,能够在当前非常纷杂的环境里面有自己的一席之地。
去年曙光决定成立研发团队来研发刀片服务器,正是曙光看到了这些在市场、技术上面的发展趋势,看到一些国外的公司的野心,曙光才决定投入巨资做这样的项目。
同时支持AMD/Intel/龙芯异构
曾宇对曙光刀片服务器的概要介绍,TC2600属于7U10片的结构,最高的带宽是42.5G,支持冗余散热系统,能根据温度控制风扇转速,还支持刀片异构,支持AMD、Intel,以及基于龙芯的刀片异构。并且在业界首次实现20G的交换,这个指标在业界是领先的,曙光刀片服务器的整体功耗为4000W。
曙光刀片服务器是完全具有自主知识产权的,已经申请了50多项专利,其中30项是发明专利。
积累成就“曙光”
刀片服务器有整合性和排他性,需要有深厚的技术实力,不是有几个基架、有一个机箱就可以,曙光还有操作系统和文件系统,这些软件方面的工作也需要大量人力和物力进行研发。
曙光的刀片服务器是真正意义上具备做一个机群,做一个单一系统来运作的刀片服务器,而且曙光有很多的很深的行业积累,刀片服务器不是一个简单的产品,不像笔记本一样,要进行配制、管理、定植化,根据用户的特点来进行定制,所以IBM投入一个亿美金来支持用户,所以我们应该有资金的积累、解决方案的积累。
曾总着重表示,从这几个方面,曙光具备研发一款完全自主知识产权刀片服务器的能力,是一种必然。
曙光刀片服务器六大技术特色
接下来,曾宇总经理介绍了曙光服务器六大技术特色:
1.一体化远程监控
通常情况下谈服务器监控,也有谈全局资源监控管理的,很多企业没有做到把这二者结合起来,但曙光做到了。曾总举例说:我们可以在今天会议室可以实现远带洛杉矶的一台曙光服务器的监控,可以通过这种图形化的截面,所见即所得,来直观看到我们在全球的软件信息、性能信息等等。
其次我们可以做到一体化的监控截面,既可以整合我们的KVM界面,其次还可以做到图形化的信息的直观显示,一个交换机的状态是好是坏,在这个图象里面可以显示,同时还可以透明化操作,不用管我们的刀片插在哪个位置,它和别的方面是什么关系,我们可以直接基于浏览器来做到透明化的管理,包括控制。而且链接是通过一种远程加密进行安全控制,可以有效地保证,信息不会对其他人监听。
曙光刀片服务器之间可以进行互联,如果构建一个机群的话,可以做到基于角色的统一管理,同时可以有效地审计我们用户的监控行为。我们强调我们具备这种一体化的远程监控功能,所谓一体化,一方面是KVM信号的本地化,另外一种是远程化、图形化监控,这是我们的一大特色,事实上我们可以看到,大概是这样的状态,我们可以通过我们的界面方便地去看每个刀片的KVM信号。
2.基于策略的层次化管理
我们第二大技术特色节是可以做到基于策略的层次化管理,刀片服务器分成不同的部件,有电源、风扇、管理部件等等,不同的部件管理方式不一样,比如说对风扇来说,可能根据我们的机箱温度,可以低速运转,对电源策略等实施评估,我们要做到对不同的部件进行层次化管理,我们把刀片分成几个层次,整体可能是全局概念,实际上不同部分有不同层次,比如说管理模块有我们的DMC卡,也有我们本身的管理模块,事实上我们可以就不同的模块进行不同的策略共享,比如说上电策略,我们功率如何控制、散热如何控制,刀片控制策略怎么样,以及我们的交换策略、报警策略,是主动报警、还是其他的模式,其次也可以自己定制控制策略,并且我们可以做到基于策略的主动防护,如果一个系统遇到攻击,我们可能采取切断链接进行防护,比如说策略,如果温度过高,可以基于我们的策略来实施任务的牵引,或者我们的电源可以起动一些或者关闭一些。我们可以做到十个刀片共享一个USB口,也可以远程的USB本地化,方便对刀片和维护。
3.自适应功率管理
第三大特色,事实上也是在刀片服务器领域比较具备特色的功能,可以做到自适应的功率管理,包括四个方面,热平衡设计、自使用节能管理、智能风扇控制、基于策略的主动防护。这个特色是我目前在业界中,曙光是唯一一家的刀片。根据我们的温度状态,可以智能化控制我们的风扇,并且可以做到基于策略的主动防护。
在散热风暴设计方面,我介绍一下四个特四,针对自适应特色里面的四个特色,整体采用整体机箱散热方式,可以起到散热作用,同时对采用侧面吹风设计,这是我们整个风道的模拟。通过热平衡设计从专用领域通过。这是散热风道设计的方针,通过这个详细的软件访真,来保障我们的刀片服务器散热,刀片支持120W的高性能CPU,在温度方面,我们分成三个温度区域,一个是紧急关机,根据不同的区域有不同的策略实施主动防护,实施风扇的自适应控制。
一方面我们可以根据我们的实施功耗确定工作电源个数,我们使电源工作在最佳效率曲线上,同时调整任务队列,利用事件寄存器,保障我们的系统是节能的。
4.刀片操作系统
第四大技术特色就是刀片操作系统,很多企业提供的刀片服务器,更多是远程服务和管理,曙光整合和自己的操作系统,根据刀片服务器面对客户等需要的功能不尽相同,对技术人员需要来安装部署刀片上面的OS,针对系统管理,我们需要监控系统、文件系统等等,针对最终用户,可以进行商业计算,实际上我们囊括两大部分功能,第一就是刀片的技术功能,信息服务、监控服务、部署服务、配制服务、管理服务等等,构成一个有机的曙光刀片操作系统。
5.全方位虚拟化技术支持
第五大技术特色就是全方位虚拟化,也两个层次的虚拟化,节点界和应用级。软件模拟和硬件模拟叫做节点级。如果我们在每个层次再细分,可能有润间、硬件模拟,有基于网格等功能,实际上今天为止,曙光服务器支持全方位的技术,提升我们的适用性。
6.大规模可扩展高可用技术
第六大技术特色就是大规模可扩展、高可用技术。在我们这个刀片服务器里面,我们集成了大量的可扩展技术,包括冗余的5+1的模块,我们冗余的风扇控制模块,其次可以支持PCI-EXE,刚才我介绍的是曙光在高端领域的技术,同时也结合刀片服务器的特色,我们所研发的服务器的技术特点,包括一体化远程监控、基于策略的层次化管理、我们后面介绍的刀片操作系统,以及我们虚拟化运用、大规模扩展高可用技术,这些技术可以有效保障曙光刀片服务器的很多需求。
展望曙光未来
在对现状进行了充分介绍之后,曾总也对曙光刀片服务器的未来进行了展望,他表示第一要形成Intel、AMD、和龙芯为主流的服务器产品线。
第二协助高性能计算机委员会来建立标准,打造中国刀片式服务器原生态产业链。曙光有信心基于现有的技术,打造我们的标准,保护民族产业链。
第三就是要全面满足工业标准化100万亿次超级计算机能力。
今年7月,曙光服务器天津产业基地二期工程即将开展新一轮的建设,工程完成后,曙光将具备年产50万台服务器的能力,当记者问道刀片服务器将占到曙光市场多大比率时,曾总笑着表示,如果用户需要的话,这50万台可以全部是刀片服务器。
最后曾总深切表示在多核和节能技术的推动下,刀片是服务器必将是未来工业标准化的主流载体,这会对信息产业产生深远的影响。
刀片的中国“曙光”
高性能标准委员会是曙光倡导成立的中国高性能计算机标准化组织,所制订的标准并不仅仅是服务器生产企业的准入标准,也是企业采用的应用标准,高标委将在未来打造的一系列标准,包括气象标准、航空航天的标准,石油勘探的标准等等。以应用为指向,才会更有利于产业的进步,这对我国整个计算机产业也是意义深远。曾宇表示已经启动标准化推广工作,计划将在三年内将我国的刀片服务器标准打造为国际化标准。