宾西法尼亚州立大学构建了一个128节点的Dell群集,其中配置了Intel处理器并运行Linux,扩展了高性能计算服务
挑战: 减少高要求的大学环境中的高性能计算的成本
解决方案: 一个128节点的DellTM PowerEdgeTM 1550服务器群集,每个节点配置了Intel® Pentium® III处理器,并运行Linux® 操作系统
优势: 节省费用;超级计算机等级的性能使新的研究类型成为可能;计算机资源供更多的研究人员使用;更高的可用性
大学研究者传统上都使用大量的计算资源。在建模从天气到经济理论的各种事情,他们可能会使用成千上万的MIPS(每秒数百万条指令)。但在大多数学校,都不能提供足够的计算资源。传统上用来进行数字密集型研究的超级计算机需要花费数百万美元?而且需要专业化的昂贵的管理和维护。
宾西法尼亚州立大学(宾州大学)开创了一个新的途径。他们利用DellTM PowerEdgeTM 服务器中数百个现成的Intel® 处理器提供超级计算机的处理性能,但成本仅占超级计算机的一小部分。
宾州大学在1998年夏季使用Dell PrecisionTM 工作站进行了第一次评测。在确认了扩展性之后,学校使用33个Dell PowerEdge 4350 服务器构建了一个完整的群集。64处理器 LION-X 群集 – 以学校的吉祥物和群集的操作系统命名 – 为30多个研究者提供计算能力,这些研究者从事的工作不尽相同,从材料的设计到天气的建模。
以四分之一的空间提供两倍性能
在2001年,宾州大学通过构建它的第二个Dell-Linux群集,提高了性能,降低了价格。这个群集包括Dell PowerEdge 15501 服务器,其中的CPU是第一个群集中的CPU的性能两倍,但空间是以前的服务器的四分之一。
“我们的两个LION-X群集对于我们支持并行计算和增强计算研究人员的环境的能力来说非常关键,”高级研究程序员Jeff Nucciarone说,”充分利用Dell PowerEdge服务器的可靠性和性能以及基于标准的计算环境经济高效的特点,我们可以使研究人员访问具有强大运算功能的硬件系统,帮助他们解决复杂的计算问题。”
图1:机柜优化Dell PowerEdge服务器在小空间内最大化了计算能力
群集作为可扩展的企业计算和一个经济、价格具有竞争力的学术研究和科学计算方法的一个新模型,正在快速赢得大家对它的关注。Dell服务器构成的一个群集,再加上分解和在网络上发布处理任务的计划软件,使得基于标准的日用设备即可以提供可与专用的、更为昂贵、高性能的计算机相媲美的计算速度。
每平方英寸的性能是原来的八倍
宾州大学在评测过程中考虑了很多因素?初始价格,易于维护,可靠性,占用面积和外形,最后选择了Dell作为供应商。”我们已经与Dell建立了稳固的联系,因此我们确信我们将会得到很好的支持,”宾州大学高性能计算和可视化部门主管Vijay Agarwala说,”Dell的定价极具竞争力,而且他们的服务器的范围满足了我们的需求规范。他们的系统具有足够的冗余性满足我们对运行时间和恢复的需要。最后,我们需要一个机柜安装的系统来满足我们的物理空间需要,PowerEdge很好地满足了这一类型的配置需要。”
新的LION-XE群集包括128个PowerEdge 1550服务器,每台服务器配置了两个1GHz的Intel Pentium® III处理器,配备了2GB内存和36GB SCSI硬盘。其它的特性还包括一个快速64位、66MHz的外设部件互联(PCI)总线,连接到两个Gigabit 2 网络,并在主板上集成了两个以太网适配器。
超薄的1U外形是PowerEdge 1550的另一个优势。”因为PowerEdge 1550很薄而且处理器的性能比我们第一个群集中的处理器更高,我们现在每平方英寸的能力是以前的八倍,”Agarwala说,”在专用系统世界中您不会看到如此快速的改进性价比。”
开放源码Linux的自由
Linux® 操作系统在软件方面提供了同样的自由、低成本和快速创新。”因为Linux是开放源码软件,我们可以轻松进入Linux世界,”研究编程人员Jason Holmes说,”我们不会受到专用系统的限制。开放性使我们能够与其它人合作,贡献和利用其它人员开发的解决方案。我们不用等待提供商开发我们需要的应用。”
由于在线提供,LIOX-X和LION-XE群集的性能已经超过了预期值。宾州大学研究计算的工作人员运行的基准测试同样证明了它们的出色性能。这些基准提供在LION-XE网站上(http://gears.aset.psu. edu/hpc/systems/lionxe/performance/)。
高需求
来自校内的各个系的需求非常高,因此Holmes实现了一个计划系统来容纳每个人的项目。LION-XE群集实际上是由宾州大学的13个不同的研究小组和学术计算中心共同购买的。没有提供资助的其它研究者也可以使用它。
“这些小组认识到可以将他们的资金集中起来购买一个大型的共享计算机,而不是每个小组购买一台小型的机器,”Holmes说,”现在他们都可以使用一个更为强大的系统,因为群集在各个任务之间会出现休闲时间,所以我们实现了一个计划系统,允许运行较短的任务,另外还支持其它的小组在群集没有被优先的团队使用时使用群集。”
一切都与数据相关
总体看来,大约80%的研究者在全时地使用LION-XE群集。LION-XE群集为大量的研究性工作提供支持。
昆虫学和生物学教授Ottar N. Bjornstad使用LION-XE群集来研究传染性疾病流行性的升降,重点是了解感染的空间分布和预测本地流行的范围。他的研究工作广泛使用了群集来估计空间网络和随机模拟时空模型。对于设计干预战略和控制人类的疾病和bioterror agents来说,这项工作有着十分重要的切实可行的结果。
而Garrison小组利用LION-XE群集进行分子动态(MD)模拟,从而对能源的快速分解过程进行建模。其中的一个过程是激光切除。这个小组已经开发一个新的呼吸球模型,使他们可以延长仿真的时间和长度。激光切除应用中包括对大型生物分子进行大量的光谱测定、薄胶片分解以及医疗过程,例如眼睛手术LASIK。
“我们十分吃惊地看到使用现成的技术能够使科研团体更好地访问并行计算资源,”学术计算中心的高级主管Kevin Morooney说,”利用LIOX-XE群集,我们已经采取了一个均衡的方法,提供了不仅具有非常快的并行计算周期而且具有高可用性的环境。”
宾州大学正在评测基于Intel新的64位架构的Dell的服务器。”毫无疑问,它是我们的未来,”Agarwala说,”64位架构是很多大规模计算的理想选择。Dell服务器的发展速度是惊人的。”