四连冠只是新起点,与AI亲密无间,才是联想HPC新追求

没有任何悬念,就像中国的神威·太湖之光和天河二号毫无悬念排名冠亚军一样,在美国丹佛举办的2017年全球超级计算大会(SC 2017)上,联想以87套份额的绝对优势,毫无悬念地连续第四次荣膺HPC TOP500榜单全球第二、中国第一。就连中国以202套HPC入围首次赶超美国,也同样没有什么悬念,这是早晚的事。

SC2017联想四连冠

如此看来,SC 2017还有哪些新看点呢?HPC和人工智能AI应该是看点之一。

有多少人能够把HPC和AI联系在一起呢?实际上,HPC/大数据一体化一度成为HPC领域的热点。熟悉技术的朋友知道,如今,所说的人工智能AI,其实可以理解为以大数据处理为基础,结合神经元网络+机器学习的算法,既然如此,HPC、AI亲密无间,也是自然而然的事。

SC2017联想展区

HPC和AI相同点

·相同点之一,它们都需要巨大计算和处理能力。

·相同点之二,它们都需要高可靠性。可以简单计算一下,如今HPC集群规模动辄上万台,如果单台服务器的故障率是万分之一,这就意味Linkpack测试无论如何是完不成的,万分之一故障率,意味着HPC系统100%失败。

·相同点之三,它们都需要借助GPU或者APU的处理能力,不用多解释,请参阅神威·太湖之光的配置。

·相同点之四,它们都关注能耗,造得起用不起,这是HPC领域一直以来的话题。两个维度,一个让HPC更加节能;第二个就让HPC做更多的事情,大数据、AI就是很好的对象,物尽其用。

看联想如何拆招

HPC和AI能够真正做到亲密无间吗?

今年4月,杨元庆提到联想要投资1.2亿美元在AI这个产业上,也因为这个承诺,目前有超过100位AI方面的科学家,在联想位于美国莫里斯维尔、德国斯图加特以及中国北京的创新中心投入AI的研究。每一个中心都有自己的特色,客户可以连进来使用这些中心,同时也会有专家帮助引导客户一起来完成其中的操作。这是一个开放的架构,只要有想法,就可以利用此种架构跟联想的专家一起去做讨论。

联想将用户的AI之旅分为三个阶段:

·发现:帮助发现人工智能在广泛应用中的潜能和优势;

·开发:提供专为人工智能优化的硬件和人工智能框架选择,以加速人工智能应用的开发;

·部署:利用简化的端到端解决方案和专业服务知识,快速完成部署。

联想数据中心业务集团副总裁兼人工智能与高性能计算业务总经理Madhu Matta表示:“AI是一项复杂的工作,它需要优异的处理能力和一定程度的技术专业知识和人才,而此类资源往往是客户最缺乏的。”为此,联想创建了一个端到端生态系统,能够在AI的每一步使用进程中为客户提供重要支持。

联想数据中心业务集团中国区企业级营销产品营销总监李炜表示:对比其他友商方案,联想最大的优势就是自主研发,以及对机器性能、可靠性的严格要求,因此能够向用户交付更好、更优质量的产品。

SD530和LiCO,为AI优化

在联想看来,HPC如果想要满足AI、机器学习和深度学习等工作负载需要,就需要在灵活、敏捷性加以提高,为此,联想推出了两款专为未来工作负载设计的卓越产品:

·用于ThinkSystem SD530的全新GPU : 支持最新基于NVIDIA Volta架构的Tesla V100 GPU加速器和英特尔至强可扩展处理器系列,ThinkSystem SD530可以按需调整,可以根据计算规模的需要灵活扩展性,同时保持HPC系统可靠性和可用性。

通过采用全新Tesla V100,ThinkSystem SD530为AI应用提供了一个强大选择,适用于大规模训练工作负载和推理工作负载等的需要。

·智能超算管理平台(LiCO):熟悉联想HPC的用户,对于LiCO肯定不陌生,这是一套这是一款功能强大的管理套件,同时这也是一套对外开源的软件;为了满足AI应用的需要,联想强化了上一代LiCO的全部功能,更在HPC软硬件平台上整合支撑了各种深度学习应用,融合了主流的人工智能框架,比如谷歌的Tensorflow、脸书的Caffe、微软的MXNET等。

此外,LiCO分布式的资源调度系统,可以从容应对各种深度学习训练对于不同规模计算的需求,如:人脸识别、自然语言处理;LiCO所提供的任务模板可以让初学者、专家、数据科学家,都能够快速上手; 而LiCO提供的数据预处理、训练、参数调整、过程监控、测试等端到端解决方案,更可以让用户能够集中精力在AI算法和业务应用,无需要为硬件集群管理分心。

ThinkSystem数据中心基础设施和解决方案产品组合展示

为了控制能耗,联想提供了第二代温水水冷技术,将水温从45℃提升到50℃,冷却效率从80%上升到了90%。技术之外,更加重要的是,联想的温水水冷是唯一一个有全球案例,而且做到非常大集群的产品,在国内外都有成功案例,在参观中可以看到一个城市都在使用联想的水冷产品。

未来HPC要挑战E级计算,联想水冷技术将会是一项非常重要的技术。如今,以神威·太湖之光的计算能力,E级计算将是其规模的10倍,耗电量将需要一个中型发电站来专供,这还没有考虑空间上的占用。而采用联想温水水冷技术,就可以压缩90%能耗和占地水平。应该说,这也恰好满足了AI应用的需求

小结

以智慧计算为依托,在推动HPC商用化进程中,AI让多样化、个性化、定制化的联想HPC解决方案有了更多用武之地。可以预计,AI市场的深入应用也必将反哺HPC系统应用,迎接E级计算的新突破。