近日,VMware(NYSE:VMW)宣布与英特尔合作,通过拓展双方二十多年的创新成果,帮助客户加速人工智能(AI)应用,并在数据中心、公有云和边缘环境等所有地点部署Private AI。VMware和英特尔正致力于提供一个经过联合验证的AI堆栈,支持客户使用现有的通用VMware和英特尔基础架构以及开源软件简化AI模型的构建和部署。VMware Cloud Foundation通过与英特尔的AI套件、内置AI加速器的英特尔至强处理器以及英特尔Max系列GPU组合,将为数据准备、模型训练、微调和推理提供经过验证和基准测试的AI堆栈,加速科学发现并丰富企业和消费者服务。
全球已有30多万家客户部署了VMware Cloud,VMware 虚拟化软件已被部署到企业中几乎所有创建、处理或消费数据的地点。这使得 VMware Cloud 成为了一种可将AI加速计算和模型带到任何业务地点的快速手段。同样,英特尔也为成千上万的客户提供了开放、可扩展且值得信赖的解决方案。在企业中随处可见的VMware和英特尔产品将强强联手,共同提高数据科学的可访问性,支持全球企业机构采用Private AI,一种平衡AI带来的业务收益与实际隐私和合规需求的架构方法。
VMware AI Labs 副总裁 Chris Wolf 表示: “关于AI,我们已经无需在选择、隐私和控制方面争论权衡问题。Private AI能够同时为客户提供这三方面的能力,支持他们在加快AI部署的同时,构建具有前瞻性的 AI 基础架构。VMware Private AI with Intel将帮助我们的共同客户大幅提高工作者的生产力,加速主要业务功能转型,同时提升经济影响力。”
英特尔执行副总裁兼数据中心与人工智能事业部(DCAI)总经理Sandra Rivera表示:“几十年来,英特尔和VMware一直在提供从数据中心到云的新一代功能,支持客户提升行动速度、创新力和运营效率。AI可以带来更多强大的可能性,改善全人类的生活,英特尔和VMware完全有能力带领企业进入这个由芯片和软件驱动的AI新时代。”
提升AI性能,并以更低的总体拥有成本获得更安全的AI基础架构
无论是在公有云、企业数据中心还是在边缘,VMware Private AI 都能将算力和 AI 模型带到创建、处理和消费企业数据的地点,从而为传统 AI/ML 工作负载和生成式 AI 提供支持。VMware 和英特尔可在数分钟至数小时内对特定任务模型进行微调,并使用客户的私有企业数据实现比人类交流速度更快的大型语言模型推理。现在,VMware 和英特尔可以对更小、更经济的先进模型进行微调,这些模型更易于在共享虚拟系统上进行更新和维护。当批量AI工作完成后,这些模型又可以被送回 IT 资源池。现在,AI辅助代码生成、体验式客户服务中心推荐系统和经典机器统计分析等用例可以在运行应用的相同通用服务器上共存。
VMware 和英特尔正在设计一种参考架构,以便将英特尔的AI软件套件、英特尔至强处理器和数据中心GPU与VMware Cloud Foundation 相结合,支持客户在其基础架构上构建和部署Private AI模型,从而降低总体拥有成本,解决环境可持续发展问题。采用英特尔AI的VMware Private AI参考架构将包括:
配备Intel Advanced Matrix Extensions(Intel AMX)的第4代英特尔至强处理器,使用标准行业框架和库、端到端数据科学生产力工具以及经过优化的AI模型,提供高达10倍的开箱即用性能。
Intel Data Center GPU Max包含多达128个 Xe核,是英特尔针对要求最苛刻的AI工作负载推出的基础 GPU 计算构件。英特尔Max系列GPU将提供多种外形尺寸,以满足不同客户的需求。
英特尔的AI软件套件包含端到端开源软件和可选许可组件,支持开发人员运行从数据准备、微调到推理的完整AI管线流程、加快构建多节点扩展,并在企业IT基础架构上部署AI。开放式 oneAPI 框架可实现与处理器和硬件加速器无关的软件开发,支持开发人员只需编写一次代码,即可在不同的架构上运行,无需使用多个代码库和专用语言。英特尔的Transformer Extensions和PyTorch Extension与开发人员最喜爱的开源Hugging Face库深度集成,为微调和压缩模型提供经过自动优化的配方,从而实现高效推理。
VMware Cloud Foundation通过以下功能,为 VMware Private AI 带来一致的企业级基础架构,操作简便,同时增强安全性。
VMware vSAN Express Storage Architecture可为I/O密集型 AI/ML调整和推理工作负载的加密等重要功能提供高达30%的性能提升1和最小的开销。
vSphere Distributed Resources Scheduler帮助有效利用空闲算力进行AI模型训练和推理,充分利用其他AI应用所使用的集群,最大程度地提高容量,并降低总体拥有成本。
VMware NSX 用于构建微分段和高级威胁防护功能。
安全启动和虚拟TPM可确保模型和数据的保密性。
VMware Private AI 将由戴尔科技、惠与和联想的服务器提供支持,这些服务器运行带有英特尔高级矩阵扩展(英特尔AMX)的第四代至强 CPU 以及英特尔 Max 系列 GPU。