服务器在线7月4日报道 近日,权威机构再次更新了世界超级计算机500强名单,但我们惊讶其超强性能提升的同时,不由再次也产生了对信息化产品能耗方面的担忧,最高的超级计算机耗电量已经达到了4.88 兆瓦,也就是说他一小时的耗电量几乎可以相当于100户普通市民一个月的耗电总合,这个数字给我们的震惊似乎已经不亚于那千万亿次的计算能力了!
当然我们并不是需要为了节能而放弃超级计算机的发展进度,因为毕竟超级计算机会给我们整个人类色会带来更大的贡献,我们向表达的是在发展超级计算机以及信息化进程中不要忘记节约能耗方面的公关,尽量做到鱼与熊掌兼得双赢理想结果!
鱼与熊掌可以兼得吗?答案当然是肯定的。现在已经有很多厂家在这方面下了很大的功夫,并已经取得了一些比较喜人的成绩,国内服务器旗舰企业曙光自主开发的刀片服务器自适应节能系统就是其中最好的解决方案之一,这套系统是针对整个高性能计算机的节能和监控软件,可以动态调整整个计算系统的状态,并在实际应用中的节能效果已经达到了35%以上,这对于超级计算机这样的"电老虎"来说可以有着划时代的意义。下面我们就来一起了解一下这套系统,看看它是如何让"电老虎"温顺下来的。
曙光刀片服务器自适应节能系统利用自带监控功能,扫描各集群节点工作状态(也可以使用作业调度或负载均衡程序提供的接口),根据负载特点,使用曙光开发的内核补丁(支持Linux和Windows)调整节点状态和内部任务队列,达到节能目的。具体来说整个系统解方案具有一体化远程监控、基于策略的层次化管理、自适应功率管理、刀片操作系统、全方位虚拟化技术支持、大规模可扩展高可用技术在内的六大特点。
1、一体化远程监控
服务器监控,也是全局资源监控管理,但很多企业没有做到把这二者结合起来,曙光可以实现对远在洛杉矶的一台曙光服务器的监控,可以通过这种图形化的界面,直观看到在全球曙光服务器的软件信息、性能信息等。
其次可以做到一体化的监控截面,既可以整合曙光的KVM界面,还可以做到图形化的信息直观显示,服务器状态的好坏,在这个图像里面可以显示,同时还可以透明化操作,不用管曙光的刀片插在哪个位置,它和别的刀片是什么关系,系统可以直接基于浏览器来做到透明化的管理,包括控制。而且链接是通过一种远程加密方式实现安全控制,可以有效地保证信息不会被其他人监听。
曙光刀片服务器之间可以进行互联,当构建一个机群时,可以做到基于角色的统一管理,同时可以有效地审计曙光用户的监控行为。曙光的一体化远程监控功能在实现KVM信号本地化的同时,实现远程化、图形化监控,通过系统界面方便查看每个刀片的KVM信号。
2、基于策略的层次化管理
系统第二大技术特色是可以做到基于策略的层次化管理,刀片服务器分成不同的部件,有电源、风扇、管理部件等等,不同的部件管理方式不一样,比如说对风扇来说,可能根据曙光的机箱温度,可以低速运转,对电源策略实施评估,曙光能对不同的部件进行层次化管理,把刀片分成几个层次,对不同的模块进行不同的策略共享,如上电策略、功率控制、散热控制、刀片控制策略、交换策略、以及报警策略模式等,也可以自定义控制策略,系统可实现基于策略的主动防护,当系统遇到攻击,可采取切断链接的方式进行防护。当机箱温度变化时,通过设定的策略来实施任务的牵引,或者控制电源的部分启动或关闭。曙光可以做到十个刀片共享一个USB口,可实现远程USB接口的本地化,方便对刀片和维护。
3、自适应功率管理
系统第三大特色是自适应的功率管理,包括四个方面:热平衡设计、自适应节能管理、智能风扇控制、基于策略的主动防护。根据曙光的温度状态,可以智能化控制曙光的风扇,并且可以做到基于策略的主动防护。
在散热设计方面,采用整体机箱散热方式,同时采用侧面吹风设计,通过热平衡设计从散热风道的设计,进行了详细的软件仿真,以保障刀片服务器的散热,实现刀片对120W高性能CPU的支持。在温度方面,曙光分成三个温度区域,根据不同的区域有不同的策略实施主动防护,实施风扇的自适应控制。
系统可以根据服务器的实施功耗确定工作电源个数,使电源工作在最佳效率曲线上,同时调整任务队列,利用事件寄存器,保障系统功耗最小化。
4、刀片操作系统
系统的第四大技术特色是刀片操作系统,很多企业提供的刀片服务器,更多是远程服务和管理,曙光整合了自己的操作系统,根据刀片服务器面对客户所需功能的不同,来安装部署刀片上面的OS,针对系统管理,曙光需要监控系统、文件系统等等,针对最终用户,可以进行商业计算,包括刀片的技术功能,信息服务、监控服务、部署服务、配制服务、管理服务等等,构成一个有机的曙光刀片操作系统。
5、全方位虚拟化技术支持
第五大技术特色就是全方位虚拟化,包括节点界和应用级。软件模拟和硬件模拟叫做节点级。如果曙光在每个层次再细分,可能有润间、硬件模拟,有基于网格等功能,实际上今天为止,曙光服务器支持全方位的技术,提升曙光的适用性。
6、大规模可扩展高可用技术
第六大技术特色就是大规模可扩展、高可用技术。在曙光这个刀片服务器里面,曙光集成了大量的可扩展技术,包括冗余的5+1的模块,曙光冗余的风扇控制模块,其次可以支持PCI-EXE,同时也结合刀片服务器的特色,曙光所研发的服务器的技术特点,包括一体化远程监控、基于策略的层次化管理,以及曙光虚拟化运用、大规模扩展高可用技术,这些技术可以有效保障曙光刀片服务器的很多需求。
现在该方案已经在涿州中国石油集团研究院数据处理中心,东方地球物理公司(BGP)使用,BGP在全球地球物理公司排名第四位,陆上地震勘探排全球第一位。
BGP的应用情况表明,目前BGP采用了曙光公司开发的针对整个高性能计算机的节能和监控软件,动态调整整个计算系统的状态,节能效果达到了35%,单个节点可节省60W的功耗。以1000个节点为例,一年可节电52万度,电费一项就为BGP节省近50万元。