星盈超级刀片计算机突破运算极致

    在充满神奇的生命科学领域,高性能计算已经成为探究基因奥秘、蛋白质结构、生物信息以及医药设计等领域不可或缺的辅助工具。在这其中,将生命科学和信息科学进行结合,从而为生物医学提供有价值参考依据更是被一些主流研究机构视为重要的应用。


    作为中国生物医学领域最知名的研究机构,北京生物医学院研究所恰恰就是一个明显的例证。为了改善和提高自身信息化应用水平,展开更加广泛的生命信息学、计算生物学以及信息技术等方面的研究与实践,北京生物医学院研究所与全球运算效率最高的服务器领导厂商蚬壳星盈(www.galactic.com.hk)合作,引入了星盈亿万次实时协作式超级刀片计算机系统并建立了具备国际领先水平的生物科学超级计算和研究中心,为科研人员的研究课题提供了强大计算服务平台。


    一般的服务器机群相比,星盈超级刀片计算机采用了更加灵活和易于管理的刀片技术,构成了分布式内存的并行机群结构。利用刀片支持热拔插、具有更高的安装密度和可靠性、更低的耗电和散热量、更易于管理以及具有更低的总拥有成本等特性,该计算平台实现了出色的可扩展性以及对大量生物计算程序的支持,体现出了卓越且不可比拟的性能优势。


    据了解,并行机群的网络互连结构和数据存储是影响生物信息学和计算生物学程序性能的重要因素。通常的服务器机群多采用100Mb 或1000Mb 以太网互连,只能满足一般速度要求和任务并行程序的要求。而星盈超级刀片系统则在所有节点之间都采用了10Gbps的InfiniBand交叉开关高速互连,可以和传统的MPP(大规模并行处理)计算机媲美,可同时满足高通量计算和高性能并行计算应用的需要。这使得该超级计算机的实际运算能力超过1 万亿次浮点结果/秒,是目前安装在我国生物医学研究机构中性能最高的系统。


    为了实现最佳的运算效果,星盈超级刀片计算机设计了132 个计算节点,1 登录节点和I/O 节点,为每个节点提供了双2.8GHz至强处理器、2GB内存以及36GB本地硬盘的强大配置。与此同时,为便于管理和访问生物序列数据库,星盈还将所有计算节点都通过NFS共享磁盘,并通过2个2TB的高速磁盘阵列确保了高性能计算对于硬盘速度和容量的需求。


    不仅如此,星盈超级刀片计算机还对整个系统进行了大量的优化,为每个节点安装了经过定制优化的RedHat Linux AS 3.1 操作系统。为了将整个机群作为一台超级计算机管理和运行,诸如计算资源管理、任务调度、性能监控、网络文件共享、并行环境等软件也被广泛采用,使系统在实现单一映像(SSI)的同时,每个节点都能够获得非常优异的运算速度。


    对如此规模庞大的计算系统,确保每个环节的顺畅运行是一项非常关键的工作,因此星盈超级刀片计算机为管理员提供了Web界面的实时性能监控程序,使之能够方便地察看任务负载、CPU 利用率、网络、内存、存储的使用情况以及当前系统整体运行状态或单个节点的运行状态,包括同时可以分析历史数据,使超级计算机的运行万无一失。


    卓越的计算性能和完善的系统结构使星盈超级刀片计算机的表现令人惊叹。在该研究中心对基因转录和可变剪接等问题的研究中,仅利用超级计算机的56 个计算节点并行运行Blat程序耗时7.5个小时就完成了UniGene数据库中五百多万条人类EST序列对基因组数据库的比对,而工作人员透露,过去用双CPU的PC服务器完成相同的任务需要3周时间。而在另一项在另外一项基于神经网络的结构预测程序研究运算中,在3天内完成了16万个基因序列的突变比对和结构预测,这在一般PC 服务器上则需要连续计算6 个月。


    这一切也让星盈超级刀片计算机在高性能运算应用中的优势体现得淋漓尽致。正如生物科学超级计算和研究中心工作人员所说:“这个强大、便利、高效的计算平台让以往高不可攀的生命科学计算变得随时随地。”