早在5年前,曙光就有建立高性能实验环境的规划。但是由于种种条件限制,无法建立大规模的实验环境。在前年的4月份,曙光公司成立了高性能实验室,旨在为用户方案提供免费测试服务,推进高性能计算平民化进程。实验室共部署了一台128CPU的高性能服务器,整体浮点运算峰值为每秒5632亿次,并在当年中国TOP100的排行榜中名列第80名。
2006年10月,曙光毅然决定在原有“曙光高性能实验室”的基础上大规模扩容,建立曙光应用体验中心。整个体验中心共投资近一千万,占地160多平方米,主体高性能计算的浮点运算峰值达到了每秒3.1万亿次。这样规模的应用体验中心在国内绝对属于佼佼者。
应用体验中心-门口
1.需求迫切,应运而生
近几年,X86架构高性能服务器和计算机市场增长非常迅速,它逐渐的挤占了由RISC机和向量机所占据的高端服务器的市场。目前X86架构机群系统已经成为高性能计算机的主流。在去年的TOP500排行榜上,有三分之二的系统都是X86架构的机群系统,并且这一比例在不断的增加。在国内,2005年高性能服务器销售了共计近50万台,销售金额接近170亿元,其年复合增长率高达10%以上。在操作系统方面,Linux系统已经逐渐的取代了Unix成为高性能计算机的主流操作系统,Windows也开始进入高性能计算机的领域。
另一方面,用户对于高性能计算机的需求也增长非常迅速,但由于高性能计算机作为高端产品在易管理性和易使用性方面与PC机等低端计算机方面还有一定的差距,同时各种不同应用领域对高性能计算机的要求也有很大的区别,所以整体解决方面、应用的测试和实力以及高性能计算机厂商的技术和服务实力是用户在采购高性能计算机时所必须考虑的方面。“方案”、“考察”、“测试”已经成为HPC用户的购买3部曲。
同时,作为国产高性能计算机和服务器领导厂商,曙光有责任感也有能力协同众多ISV合作伙伴一起来搭建一个HPC沟通和交流的平台,提供一流的测试、试验环境,推动HPC技术的发展,提高应用水平与推进产业发展。
所以在2006年,曙光毅然决定在原有“曙光高性能实验室”的基础上大规模扩容,挂靠高性能计算专家委员会和高性能计算机标准委员会,并联合AMD、微软、Mellanox、Anasys、MSC、Foundry等众多世界一流ISV合作伙伴共同搭建中国首家规模最大的HPC试验交流平台,建立“曙光服务器应用体验中心”。
2.体验“应用体验中心”
曙光应用体验中心主体包括HPC服务器性能评测和应用体验区、PC服务器性能评测和应用体验区、曙光VIP用户系统监控和管理服务区三个部分。
应用体验中心-机房
HPC服务器性能评测和应用体验区是整个体验中心核心部分,它包括一台每秒3.1万亿次浮点运行性能高性能服务器,该高性能服务器由128台四路节点机、8台八路节点机、十六路节点机组成,并配置了20TB的存储和Infiniband高性能网络。操作系统采用以Linux和WCCS为主体,并辅以Solaris。在机群软件方面,全面最新的DCMMII曙光远程一体化网格监控系统、DCOS曙光机群操作系统、SKVM over IP远程控制系统,并部署了先进的DCFS2、PVFS2和Lustre并行文件系统。
在应用方面,曙光联合了各个ISV厂商,部署了目前HPC各个主要领域中的主要HPC应用软件,并且对主要应用软件进行了优化。主要包括:
0) 性能评估:LINPACK、HPCC、NPB等等
1) 石油领域:Geoeast、paradigm、cgg、omega、VSS
2) 气象领域:MM5、Grapes、WRF
3) 有限元领域:Ansys、LS_Dyna、MSC
4) 流体力学:fluent、CFX、Star_CD
5) 结构力学:ABAQUS、NASTRAN
6) 物理化学:VASP、Gaussian
7) 材料化学:Materials Studio
8) 分子动力学:NAMD、GROWMACS、AMBER
9) 生物计算:BLAST、FASTA、MEME
10)并行文件系统和数据库:DCFS2、PVFS2、Lustre、Oracle RAC
11)机群管理和监控系统:DCOS、DCMMII、Rocks、OSCAR
PC服务器性能评测和应用体验区主要是用于PC服务器的应用性能评估研究和用户应用体验。PC服务器的性能评测包括采用SPEC CPU、SPEC Web、TPC-C、TPC-H、IOZone、IOMeter、Netperf等通用的服务器测试标准测试工具对服务器进行性能评测,同时进行服务器中主要部件,包括CPU、内存、硬盘、网络、RAID等,进行性能评测和性能分析。另外,在这个体验区,还可以进行上述评测工具和评测的体验。
另外,在曙光体验中心设立独立监控和控制中心,通过曙光远程一体化监控技术DCMMII、曙光远程管理技术SKMV OVER IP和曙光机群操作系统DCOS,进行曙光VIP用户曙光机群系统的远程监控和管理。在曙光VIP用户系统监控和管理服务区,不仅实现了对VIP用户机群系统的远程监控和管理,同时也让来到体验中心的用户可以零距离接触机群系统的远程管理和控制技术。同时,我们也欢迎更多对可靠性要求高的用户申请曙光VIP远程监控管理服务。
3.变被动为主动、由封闭到开放的转变
从单纯的HPC测试实验室到曙光服务器应用体验中心,这其中最大的变化就是变被动为主动、由封闭到开放。
以前的用户有测试需求,然后到实验室进行测试。而现在,体验中心不仅能提供以前的测试服务,同时联手其他ISV厂商搭建各种HPC应用的展示、演示、测试平台,并向用户推荐最适合不同用户需求的系统解决方面,为用户的采购提供最全面的指导和体验。同时,在体验中心,还能体验先进的机房管理、高性能计算机管理等,帮助用户解决在使用过程中的种种问题。
另一方面,我们打破了以前由曙光单独提供服务的情况,我们联合硬件提供商和HPC软件提供上共同建设体验中心。目前已经有AMD、Microsoft、Mellanox、Foundry、Anasys、MSC等厂商加入了共同建设的行列,同时还有许多厂商正在进行洽谈。
应用体验中心-会议室
完全开放、充分展示是应用体验中心最大的亮点和特色。在这里,我们展现的不仅仅是曙光服务器的产品,还有各行各业的成熟解决方案和管理经验,仿真到99%的应用演习将综合呈现曙光在服务器领域内厚积薄发的技术力量。最后,对一直以来大力支持并参与曙光服务器应用体验中心建设的合作伙伴表示最诚挚的感谢。
应用体验中心-监控室全景
开放的曙光服务器应用体验中心,随时欢迎用户来体验中心进行参观、考察和测试,一起来讨论研究相应的解决方案,集体学习、共同进步。同时也随时欢迎HPC相关厂商加入我们的行列。
应用体验中心-展示区正视