英伟达推出Peta级DGX SuperPOD超算集群云订阅服务,月租费55万元左右

小编有话说:在国内,并行科技很早就在做超算云平台,对接国内超算资源到终端用户。云桌面也可视化界面,和英伟达的超算集群租借有什么区别?如果英伟达这种租借方式进入国内,刚好NetApp也有合资公司联想凌拓成立,会不会对并行科技造成影响?

一套DGX SuperPOD超算集群系统,售价至少数百万美元起,企业未来也能够以云订阅模式租用,英伟达推出每月收费90,000美元起的按月计费方案,相当于台币240万元(折合人民币55万元左右),甚至不只能租整套集群,企业用户一次也可以只租DGX SuperPOD里的一部分计算集群。

今年Computex期间,英伟达正式推出订阅制的DGX SuperPOD超算集群新服务,让企业训练庞大的AI应用模型,该服务预计今夏稍晚推出上线,但仅开放北美用户先采用。另外该公司也宣布将扩大Nvidia Certified认证适用范围,不只是内含GPU的AI伺服器,还包括了内含DPU的设备,明年更要扩大提供基于Arm架构的设备认证。

DGX SuperPOD是Nvidia去年所推出最新的AI超算集群系统,在单一模组整合了至少20台DGX A100建立高效能运算集群,其AI计算效能可达100 petaFLOPS,最高可扩充至700 petaFLOPS。但价格相当昂贵 ,一套系统至少数百万美元起,门槛与进入成本很高,因此,目前只有少数大型企业才能够采用。

新推出订阅制的DGX SuperPOD云服务,面向有超大型AI模型训练需求的AI新创或中小型企业,可以用它提供的高效能计算,加快完成如大型自然语言AI模型的训练与应用开发,加速将服务推向市场。

至于订阅收费,英伟达表示,未来将采用按月计费方式,每月收费90,000美元起,大约是单机DGX A100一半的价格,但具备更高算力及扩充能力,甚至不只能整套租,企业用户一次也可以DGX SuperPOD里一部分计算集群做租用,在节省成本的同时,也有助于降低进入门槛。

另外,所有硬体设备都托管在Equinix云数据中心,该集群计算服务也使用了存储厂商NetApp提供的全闪存储设备,作为大量数据存储和管理之用。DGX SuperPOD订阅服务,预计今年夏季稍晚推出上线。目前已开放早期测试,但仅在北美提供。

为方便管理DGX SuperPOD计算集群,英伟达还推出了一个Base Command(基本命令)软件管理界面,不仅提供多租户、多团队AI应用开发的支持,企业用户在使用与调度DGX SuperPOD资源用于AI开发也更容易,同时简化SuperPOD的丛集管理。界面操作简单,不仅提供GUI界面,还配备Jupyter Notebook等各种工具,能使用专属Registry和训练模型,整合AI生命周期人员协作的MLOPs API。另外还提供一个监控和报告的可视化仪表盘,方便使用者管理。

此外,Base Command界面本身也可支持在AWS和谷歌两大公有云平台上使用,让用户用单一界面就能够提交AI任务,并且跨本地或多云混合云。