红帽与NVIDIA联合开发开源解决方案,推动新兴工作负载的处理

全球领先的开源解决方案提供商红帽公司(纽交所代码:RHT)近日宣布与NVIDIA(英伟达)合作,围绕人工智能 (AI)、深度学习和数据科学等新兴工作负载,将新一轮开放式创新带到世界各地的企业数据中心。这项工作的推动力是在NVIDIA DGX-1系统上对世界领先的企业Linux平台 — 红帽企业Linux进行认证。该认证为包括红帽OpenShift在内的红帽产品组合奠定了基础,让它们可以在NVIDIA的AI超级计算机上进行部署并获得联合支持。

对于希望通过数字化转型获得竞争优势和市场差异化的企业而言,人工智能通常被视为一种支持技术。研究公司Ovum强调了业界对人工智能日益增长的兴趣,调查显示:“对人工智能举措(即规划、试验或部署)积极关注的企业比例从去年的62%上升到今年的77%[2018年]。”

随着NVIDIA DGX-1系统进入数据中心提供强大的AI平台,IT团队希望在现有运营流程中管理和维护这些系统,而这些运营流程通常基于红帽企业Linux。在NVIDIA DGX-1硬件上使用红帽企业Linux不仅可以提供熟悉的控制面和安全的SELinux用户环境,使IT团队能够将这些融合到现有的工作流程中,而且还可以作为催化剂,推动AI的进一步创新和深度学习。

现在,包括公共部门、石油和天然气、金融服务等领域的企业都能够更有效地将NVIDIA架构集成到现有基础架构环境中,而红帽企业Linux在这些环境中充当共同的 “桥梁”。为了使企业环境具有更大的灵活性,目前的红帽企业Linux企业用户将能够在NVIDIA DGX-1系统上使用现有的订阅,该系统由红帽企业Linux和NVIDIA共同支持。此外,在NVIDIA DGX-1系统上使用红帽企业Linux的组织也将在红帽OpenShift中拥有业界最全面的企业Kubernetes产品系列作为基础,从而将云原生支持能力扩展到新兴工作负载。

ISV可以将现有的通过红帽企业Linux认证的应用程序迁移到NVIDIA的新系统当中,几乎不需要做出任何更改就可以更轻松地访问高级AI和深度学习功能,支持更多智能工作负载。

在高性能计算领域,红帽和NVIDIA都提供了技术和专业知识,为世界上最快的两台超级计算机Summit和Sierra提供支持。作为众多行业领导者群体的一员,红帽帮助这两个系统上线运行,这不仅为性能敏感环境中的下一代高性能计算 (HPC) 提供了模型,而且为未来的企业数据中心提供了模型。

除了在NVIDIA DGX系统获得红帽企业Linux的认证并受支持,两家公司还打算在更广泛的开源项目上展开合作,包括:

基于红帽OpenShift的NVIDIA GPU云 (NGC) 容器 – 红帽和NVIDIA计划提供NGC容器,为用户提供基于红帽技术的AI和HPC GPU优化软件工具,使双方客户能够充分利用NVIDIA GPU的性能。

异构内存管理 (HMM) – 红帽和NVIDIA计划继续进行异构内存管理 (HMM) 特性的上游开发。此内核特性允许设备访问系统内存并将其映射到自身内存中,从而显著提高使用GPU的应用的性能。

引用语录

红帽首席技术官Chris Wright:“业界对性能敏感工作负载(如人工智能和知识学习)的兴趣日益提高,这需要采用不同的企业计算理念,而NVIDIA已经借助NVIDIA DGX-1在架构层面上帮助解决了这一问题。通过红帽企业Linux和红帽OpenShift,红帽正在为NVIDIA强大的硬件增加企业级软件创新,帮助企业推动新兴工作负载的处理,同时保持其生产系统的稳定性、可靠性和熟悉度。”

NVIDIA DGX系统高级总监Charlie Boyle:“NVIDIA DGX系统与NVIDIA优化的AI软件相结合,为从桌面到数据中心的数据科学工作流程提供了强大的性能、生产力和价值。通过红帽企业Linux在DGX-1上获得的认证,对于那些期望在软件堆栈的各个层面获得企业支持的客户,我们使企业IT部门能够满足这些客户不断增长的需求,同时又不会妨碍客户轻松地进行AI探索。”

Livermore Computing首席技术官、Lawrence Livermore国家实验室高级技术系统主管Bronis Supinski:“Sierra超级计算机配置的NVIDIA GPU对红帽企业Linux的支持为我们的系统提供了通用性,极大地提升了我们的用户充分利用世界上速度排名第三的计算机的强大能力。由于我们使用红帽企业Linux作为我们产品技术系统上软件堆栈的一部分,因此,GPU的启用减少了将应用程序迁移到Sierra所需的工作量,我们预计,这一能力将惠及其他基于GPU的系统,例如DGX-1。”

SAIC首席技术官Charles Onstott:“通过我们的创新工厂,以及我们与红帽和NVIDIA的重要合作伙伴关系,SAIC展示了在快速测试和集成GPU上部署堆栈元素,以及优化我们分析引擎性能方面的敏捷性和协作能力。我们设计、部署和演示产品的时间缩短为数周,并将继续以真正DevOps的方式进行迭代。”