摩尔线程推出首款数据中心级全栈功能GPU:MTT S2000

2022年3月30日,摩尔线程正式推出首款基于其先进架构MUSA统一系统架构(Moore Threads Unified System Architecture)打造的数据中心级多功能GPU产品MTT S2000。

摩尔线程MTT S2000基于其第一代MUSA架构GPU芯片苏堤研发制成,内置渲染、音视频编解码、人工智能加速和并行计算等硬件模块,能够提供图形图像渲染、视频云处理、AI和科学计算在内的全栈功能。

据了解,MTT S2000可用于云桌面、安卓云游戏、视频云、云渲染和AI推理计算加速等应用场景。

先进架构,打造数据中心绿色多维算力

MTT S2000采用12nm制程,使用4096个MUSA核心,最大配置32GB显存,单精度算力最高可达到12TFlops,支持H.264、H.265、AV1多路高清视频编解码,以及各种AI模型算法加速。MTT S2000采用被动散热、单槽设计,满足数据中心高密度GPU配置方式。

为提升MUSA架构产品在实际生产环境中的表现,摩尔线程还为MTT S2000系列产品推出了针对硬件架构进行专门优化的统一编程模型、运行库、驱动等软件工具,可方便开发人员完成应用的移植和适配,充分调用MTT S2000的硬件资源和算力。

MTT S2000支持OpenGL、OpenGL ES、DirectX、Vulkan等图形API;通过FFMPEG和VA-API/DXVA等兼容支持音视频处理生态;并通过OpenCL及Vulkan满足AI和科学计算的程序兼容。

摩尔线程MTT S2000兼容X86、ARM等CPU架构以及主流Linux操作系统发行版,并已着手与多家服务器合作伙伴开展合作,包括浪潮、新华三、联想、清华同方、长城超云、思腾合力(排名不分先后)等OEM厂商的多款通用服务器及GPU服务器型号,可以在众多硬件和应用环境中完成部署。

  • 加速PC云桌面:摩尔线程MUSA架构所采用的MT Mesh 1.0 GPU虚拟化技术使MTT S2000能够在虚拟化架构中获得更高的性能和效率。MTT S2000是国内率先基于硬件的GPU 虚拟化解决方案,以行业标准SR-IOV(单根I/O 虚拟化)技术为基础,实现每个物理GPU 上容纳多个虚拟化用户远程工作。

MTT S2000虚拟化技术将极大地促进云桌面用户体验提升。

用户既可以按照传统GPU直通式方案,将一个GPU与单个虚拟机进行绑定以获得单应用的最大性能;也可通过GPU虚拟化的方式将GPU分配给众多虚拟机,以实现尽可能高的算力资源使用率。

在虚拟机中,摩尔线程提供了对Windows和Linux操作系统的同时支持,并兼容DirectX、OpenGL、Vulkan等渲染API,保证了用户应用程序的兼容性。同时,借助摩尔线程DirectStream技术,MTT S2000可以一体化更快速完成渲染编码,以及并发支持多路的视频编码,有效降低CPU负载和系统时延。

  • 原生Android云游戏加速:MTT S2000支持ARM架构,并支持鲲鹏、安培、飞腾等CPU的服务器产品。MTT S2000直接提供对OpenGL ES接口的原生支持,并支持ETC/ETC2/ASTC/S3TC等纹理材质的硬件处理,这使得MTT S2000显存带宽的使用效率能够获得2.4倍提升,从而让摩尔线程GPU在云手机和云游戏中展现出更好的渲染效率。同时MTT S2000还搭载了摩尔线程第一代安卓云加速平台(Android Cloud Accelerator,ACX),通过安卓驱动透传和GPU硬件编码大幅提升了安卓云手机、云游戏应用的计算效率并极大提高了安卓系统兼容性。
  • 加速视频云计算:基于独立的硬件编码器和解码器,MTT S2000能够完成多路并发的硬件编解码,大幅提升视频云的计算效能。在格式支持方面,MTT S2000不仅能够实现H.264和H.265等视频格式的硬件编码,更率先提供了对下一代编码标准AV1的硬件支持。在解码方式方面,MTT S2000则能够对H.264、H.265、AV1、VP9/VP8等格式提供硬件支持,在云端视频转码、视频压缩、网络视频、直播、远程会议、监控等行业有着极广的适用范围。
  • 云端Unreal/Unity应用渲染:MTT S2000针对Unreal和Unity等应用渲染框架,在驱动上进行了深度适配和优化,以保证充分发挥GPU内部的硬件能力。无论是传统渲染框架的渲染,还是AI辅助的渲染,摩尔线程全栈功能的GPU都能够予以支持和加速。
  • 加速AI计算:得益于丰富的模型库支持和先进硬件设计,MTT S2000能够满足计算机视觉、自然语言处理等多种智能应用场景的模型训练和推理应用,并对包括DBNet、CRNN、FastRCNN、Yolo V2/V3/V5、PSENet、Mask RCNN、Resnet 50/101、Inception、Vgg、Alexnet、Densenet、Unet等在内的众多主流深度学习算法提供支持。同时,MTT S2000也支持用户使用PyTorch、TensorFlow、PaddlePaddle等深度学习框架进行算法开发及应用搭建。此外,用户也可通过应用更广泛的OpenCL及CUDA环境进行开发,大幅降低了新硬件的学习及应用门槛,提升开发速度。