清华大学用HP动能服务器建网格计算平台

        清华大学是中国最著名的高等学府,也是国家教育部直属的全国重点大学。随着中国教育科研网格计划的推动,清华大学作为该网格的主要网格节点,需要全面提高计算能力,快速满足网格计算和科研工作中对大型、密集的高性能计算的日益增长的需求。目前,清华大学采用了130台基于Intel安腾处理器的HP Integrity rx2600动能服务器,构建基于IA-64架构的高性能计算平台。其中,128台rx2600服务器作为计算节点,部署超级计算机集群系统,该集群系统运行RedHat Linux操作系统,拥有高达每秒13300亿次的峰值浮点运算能力,并已做为主节点之一并入由中国教育部部署的中国教育研究网格。
  
    ChinaGrid计划全面启动
  
    中国教育科研网格(ChinaGrid)计划是教育部“十五”211工程公共服务体系建设的重大专项。ChinaGrid计划同时作为国家高技术发展计划(863计划)高性能计算重大专项的典型应用,也得到了国家科技部的大力支持,是迄今为止由政府推出的最宏大的网格工程。
  
    ChinaGrid将充分利用中国教育科研网CERNET和高校的大量计算资源和信息资源,开发相应的网格软件,配合网络计算机(NC)的使用,将分布在教育与科研网上自治的分布异构的海量信息资源集成起来,实现CERNET环境下资源的有效共享,消除信息孤岛,提供有效的服务,形成高水平低成本的计算服务平台,将高性能计算送到教育与科研网用户的桌面上,成为国家科研教学服务的大平台。
  
    ChinaGrid2003年1月进入实施阶段,预计于2005年底完成第一阶段建设。参加ChinaGrid计划第一期建设的高校包括华中科技大学、清华大学、北京大学、北京航空航天大学、华南理工大学、上海交通大学、东南大学、国防科技大学、西安交通大学、山东大学、东北大学、中山大学等12所高校。
  
    清华大学领衔教育网格应用
  
    ChinaGrid计划第一阶段的建设目标是:在上述12所高校建立ChinaGrid网格主节点,每个主节点的计算能力至少达到每秒5000亿次、存储空间至少达到5TB,最终形成聚合计算能力超过每秒6万亿次量级、总存储空间超过60TB的教育科研网格;并开发一整套ChinaGrid公共支撑平台软件(CGSP),作为ChinaGrid网格中间件;提供面向五类教育及科学研究应用的专业网格及其开发环境;加强网格学科建设,为高等院校培养高素质网格人才。
  
    作为中国教育科研网格项目的领头院校,清华大学的一个重要使命就是继续发展高速网络,确保清华大学能够向全国学术界和产业界的研究人员提供尽可能强有力的计算工具和应用程序,推进教育网格的发展。因此,学校决定建设科学计算平台,作为全校性的公共服务基础设施之一,为全校提供高性能计算和人才培养环境,积极推动清华大学在基础科学和应用科学领域的研究。
  
    HP Integrity援手清华网格计算
  
    惠普在高性能计算领域具有雄厚实力。在全球top500中,惠普现在占有131套,百分比达26.2%。在中国top100,惠普占有的比例是58套,百分比是58%。这两个数字充分说明惠普在高性能计算领域的发展和强大。
  
    在清华网格项目中,惠普从前期跟清华分析其运算模型,并联合Intel,和清华大学郑纬民教授一起合作设计了一个完整的解决方案。清华大学最后采用了130台基于Intel安腾处理器的HP Integrity rx2600服务器来建设整个项目。清华大学高性能中心利用HP Integrity rx2600服务器,构建集群系统,节点数达到了128个,共有256个安腾CPU。该集群系统运行RedHat Linux操作系统,峰值运算速度达到了每秒1.33万亿次。该系统已经作为主节点并入了清华校园网格和ChinaGrid。
  在清华这个项目上,HP与用户进行广泛深入的交流。对于项目实施过程中的各种问题,双方紧密合作一一化解。期间,郑纬民教授用了业界很多非常知名的应用去测试系统,例如在HP Integrity的机房环境里面,让一个应用联系运行20小时,或是72小时,给系统施加巨大计算压力,包括给CPU、内存,以及I/O都施加超负荷压力,检验系统表现。最后系统运行正常,表现相当出色,赢得了清华大学的高度认可。
  
    清华大学为什么会选择HP Integrity?
  
    清华大学为什么会使用HP Integrity的安腾平台呢?首要原因就是服务器的性能,130台服务器的整体浮点和计算的理论峰值大概是1.3万亿次左右。
  
    第二,清华大学认为安腾服务器一个显著特性是开放性。HP Integrity动能服务器现在支持最多的操作系统,包括linux、windows、unix,以及OpenVMS都支持,可以非常简单地从以前老的平台、老的应用以及合作伙伴的诸多应用,都能很方便地移植到Integrity平台之上。
  
    第三,清华大学比较看重安腾服务器的稳定性。清华大学网格计算项目对稳定性提出了非常高的需求,进行了很多项针对性的压力测试。测试结果很令人满意。
  
    第四,安腾服务器的可扩展性。目前清华大学网格计算系统的cpu总共是260个,如果采用惠普专有的网络技术,今后可以很容易扩展到几百个甚至几千个,从而能满足用户未来海量的高性能计算需求。
  
    不仅如此,HP在各个行业的解决方案也十分丰富完备。HP已经进行了深入高效的高性能计算、网格计算等研究,包括生命科学、材料科学、计算机辅助工程、地理信息系统、数字化影视、电子设计自动化、天气预报等方面的解决方案。HP都已经提供了整体的解决方案。
  
    清华网格运行稳定,推动ChinaGrid发展
  
    基于HP Integrity的清华大学校园网格计算系统运行良好,已经作为主节点并入了清华校园网格和ChinaGrid,推动了ChinaGrid的快速发展。郑纬民教授说,基于Intel安腾处理器的HP Integrity动能服务器在高性能计算领域很有优势。用64位安腾2作为HPC节点具有两个突出特性,一是浮点运算性能很好,二是内存很大,对内存有特殊需要的应用特别适合。
  
    20所第一批参加ChinaGrid的学校已经建立了校园网格系统,其中大部分采用了安腾技术,基于Intel安腾处理器的HP Integrity动能服务器占据垄断地位。许多正在计划中的网格,HP Integrity动能服务器被列入采购的优先对象。除了清华大学外,华中科技大学、中国科学技术大学、国防科技大学、西北工业大学等也采用了基于安腾2处理器的HP Integrity动能服务器构建HPC,并把其作为校园网格的节点。
  
    目前,ChinaGrid的五大专业应用已取得一定进展。一是生物信息学网格,也即用网格实现高校之间生物信息资源共享,如基因序列分析、匹配等;二是图像处理网格,目前有三维虚拟人的重建、遥感图像处理、医学图像处理等;三是流体力学网格,主要开展飞行器遗传优化设计、分子动力学研究、大型地质灾害预测等;四是以数据密集型为背景的海量信息处理网格,如高能物理数据处理及大学数字博物馆网格等;五是远程大学课程在线网格,集中了各校的精品教学,已有3000小时的课程,每天有1万人浏览。今天,全国高校的各个用户都可以通过各校门户访问中国教育网格,并提供计算任务,十分方便地获得大型计算服务,实现异构环境的计算和研究的协同工作。