木屐 发表于:14年11月07日 12:00 [原创] DOIT.com.cn
2014年11月6日-8日,由中国计算机学会主办,广东工业大学、北京中科超算信息咨询有限公司协办,中国计算机学会高性能计算专业委员会、中山大学共同承办的 “2014年全国高性能计算学术年会” (HPC China 2014)”已于昨日成功召开,全国高性能计算学术年会CCF HPC China创办于2005年,至此,大会已是第九次成功举办,来自学术界、产业界的专家齐聚在一起共同探讨中国高性能计算机的发展。
中国工程院院士 李国杰也来到了HPC China 2014大会现场并且发表了题为《高性能计算的困境和出路》的精彩主题演讲。演讲的主题分为三部分,分别谈到了高性能计算为什么会陷入困境、E级计算如何满足国家战略需求、高性能计算如何找到出路。
高性能计算为什么会陷入困境
首先李国杰院士回顾了历史上牺牲的性能“英雄”,对应用面过窄、发展战略失策、不重视生态构建、不重视市场等等导致失败原因进行总结,追忆、缅怀过去的性能先烈的失败经验,吸取教训,以儆后人。
高性能计算的发展已经从追求性能优先的90年代、发展到后来的市场优先阶段,如今正在进入以效率为优先的第三阶段。
市场优先的第二阶段,机群一统天下,代表技术Cluster。
P级之前,速度和应用性能每十年提高三个数量级。
到了效率优先的后P级时代遭遇了“效率墙”,性能增长缓慢,功能接近了极限。
高性能计算机发展面临三大困境。
E级计算如何满足国家战略需求
用20亿元做一台E级机器,什么重大应用配得上这个投入?对国家战略需求的贡献是什么?20亿元投入之后,对产业技术提升的拉动作用是什么?
列举HPC对产业技术拉动的案例引出什么应用才配得上这样规模的投资。
对E级计算投资的合理性必须是通过这种具有战略意义的变革是计算来实现。
候选E级应用:航空技术模拟
候选E级应用:国家点火工程
候选E级应用:平方公子阵列(SKA)项目,SKA即世纪最大规模的射电望远镜阵列。
候选E级应用:气候研究。
提高计算机性能的技术变迁
如图中标示处所示,实际应用的效率非常低。
高性能计算如何找到出路
解决效率问题的途径之一:协同设计
计算所和曙光发展HPC的思路。基于协同设计的体系结构设计理念;计算所提出的第三代机群-Elastic Cluster设计;Elastic Cluster的三大核心技术包括算法曾、互联网络层和计算部件层。
Elastic Cluster三大核心技术之算法层,算法层的编程框架WPI。
Elastic Cluster三大核心技术之互联网络层,也就是Fusion Fabric。
Elastic Cluster三大核心技术之计算部件层,计算部件层又包括SPU、DPU、IPU三部分。
李国杰院士最后总结了效率优先的时代要坚持的四项基本原则:算得快、应用广、易产业化、核心技术创新。
李国杰院士简介
1943年5月生于湖南邵阳,1968年毕业于北京大学,1981年获中国科学院工学硕士学位,1985年获美国普渡大学博士学位。 1985~1986年间在美国伊利诺依大学CSL实验室作博士后,研究计算机体系结构。1987年回到中国工作于中国科学院计算技术研究所,1989年被该所聘为研究员。1990年被国家科委选聘为国家智能计算机研究开发中心主任。近十多年,主要致力于并行处理、计算机体系结构、人工智能等领域的研究并发表了100多篇学术论文,合著了4本英文专著。目前担任英文版计算机学报主编。
几年来,主持研制成功了曙光1号并行计算机,曙光1000大规模并行机曙光2000、曙光3000超级服务器,领导计算所研制成功龙芯CPU并主持科学院重大项目IPv6网络研究。其中,曙光1号获1994年中国科学院科技进步特等奖和1995年国家科学技术进步二等奖;曙光1000获得 1996年中国科学院科技进步特等奖和1997年国家科学技术进步一等奖。曙光2000和曙光3000分别获得2001年和2003年国家科技进步二等奖。1994年获得首届何梁何利基金科技进步奖,1995年被选为中国工程院院士。2000年被评为全国先进工作者。2001年获得美国普度大学杰出校友奖。2002年当选第三世界科学院院士。