邵宗有:曙光解决高性能计算三大难点

2012年10月29日-31日,由中国计算机学会主办的 “2012年全国高性能计算学术年会”(HPC China 2012)在湖南省张家界阳光酒店召开。本届盛会围绕着高性能计算技术的研究进展与发展趋势、高性能计算的重大应用等主题展开,促进信息化与工业化的深度 融合,为相关领域的学者提供交流合作、发布最前沿科研成果的平台,推动中国高性能计算的发展。

点击查看直播专题

高性能计算大会第一天来自曙光的副总裁研发中心总经理邵宗有介绍了曙光在高性能计算方面是如何突破,高性能计算在电力,规模,管理等三方面的。

 曙光副总裁研发中心总经理邵宗有

高性能计算的现状

在中国高性能计算的主要形式还是计算机集群形式发展的,所以集群的发展对于中国高性能计算的发展就变得至关重要,在当前发展如此迅速的高性能计算面前,我们如何解决一系列的问题,包括存储的问题,电力的问题,能耗的问题等等。这都是高性能计算在发展的道路上需要解决的。

高性能计算发展现状图

高性能计算的瓶颈

曙光副总裁研发中心总经理邵宗有表示,目前高性能计算面临的三大难题。

第一个就是电力、制冷和空间的问题成为制约系统规模的重要因素。

第二点是大规模集群系统的部署、管理和维护变得越来越困难。当你再部署了大量计算机之后,如何确保这些计算机的稳定性。

第三点就是可靠性降低,最终用户使用复杂。

高性能计算的未来

曙光从原来的上海超算,到现在的百度从他服务的对象不难看出曙光在未来的主要方向主要是针对IPDC、云计算和大数据,在多个领域研究交差影响,并在未来会为中小用户构建产业基础。

曙光在今年,发布了整机柜模块HPC系统TC5600-H,我们知道在高性能计算上,你所使用的节点越少越好,所以曙光把整个整个机柜当做一个节点,大大的简化了节点的数量。我们看看曙光是如何做到的。

曙光超级计算机TC5600-H

TC5600-H整机采用集中式电源模块为整机系统供电,减少电源损耗可达10%。第二点整机采用集中式风扇模块提供整机散热,单节点内无风扇设计,可减少风扇功耗50%。第三TC5600-H在传统风冷制冷模式下,实现节能达20%。

我们看到曙光在节能上花了很多的心思,解决的能耗的问题。接下来就是管理的问题了,曙光研发的以用户的用户为中心的管理工具——GRIDVIEW2.6,这套管理工具以用户的用户为视角来进行观察和管理。

高性能计算的另一个瓶颈就是存储系统问题像,大规模数据共享、多应用类型挑战、如何横向扩展、按需配置、高性能需求、提高可用性。在TC5600-H上这些问题得到了解决。曙光目前代表了中国高性能计算的最高水准,通过TC5600-H我们可以看出曙光对于高性能计算问题的解决,也看到了高性能计算未来发展的方向。