刀片当道 揭秘国内知名大学计算中心(图)
ZDnet 发表于:11年06月16日 10:00 [转载] 至顶网
南京大学高性能计算中心的建设背景
据周庆林老师介绍,南京大学从事高性能计算方面的建设始于1980年天文系的应用需求。随着科学技术以及教育需求的提升,各个院系也相继开始购买服务器解决自己的计算需求。但是各个院系由于成本、人力等原因自己建设科研教学用高性能计算节点过于浪费,且不符合资源利用最大化的需求。
因此,在985工程二期的项目中,南京大学拨出了专门款项购置和更新全校所需的共享大型计算设备,力求为全校理科院系提供更强大的计算能力。到了2005年左右,x86架构高性能计算集群开始升温,大大动摇了传统共享内存模式的小型机地位。因此,南京大学打算做小规模的小型机,另一部分做x86集群--但是有两个问题:第一是机房选址问题,第二是到底选择什么样的x86服务器。
周庆林老师表示,当时再机房选址时主要考虑了两个方面的问题:1、机房的承重问题,由于每个机架塞满服务器之后有数吨重,建设在高楼层需要对楼层进行加固,因此最终选择了建设在一楼。2、机房的制冷和走线问题,南京大学当时选择了物理系1层做数据中心机房,但是问题在于电力配给不够,考虑到增容需要对楼宇进行改造,因此最后选择在天文系的楼宇建设机房。
机房选址的问题解决之后,究竟选择机架服务器还是刀片服务器做高性能计算中心的计算节点呢?周庆林老师表示,当时专家组也经过了一些讨论,并结合学校有些院系的使用经验,最终选择了刀片服务器。据周老师介绍,刀片服务器至今已经经过了几代的发展,日趋成熟。而机架服务器相对来说存在布线、管理较复杂的问题。
南京大学高性能计算中心从选用IBM HS22刀片服务器以来至今,没有出现过任何计算节点的问题,稳定性方面不弱于机架服务器(甚至更好)。散热方面,目前高端刀片机箱由于计算密度高,计算资源集中,因此只要做好冷热通道就能很好的解决散热效率,满足系统需求(第三节有机房的具体介绍,会着重介绍散热)。