2016年12月12日,加利福尼亚州桑尼维尔讯 —— AMD公司(纳斯达克股票代码:AMD)今天公布了全新战略,即在服务器计算当中使用硬件和开源软件套件,加速机器智能新时代,从而大幅度提升深度学习性能和效率,同时让工作负载更易实施。全新Radeon™ Instinct加速器将为客户提供基于GPU的强悍解决方案,用于深度学习推理和训练。伴随这款全新硬件产品,AMD宣布推出MIOpen,一款用于GPU加速器的免费开源库,用于实施高性能的机器智能,为AMD ROCm软件提供全新优化的深度学习框架,为机器智能持续进化提供基础。
大容量存储越来越廉价,传感器相关数据和用户生成的内容呈指数级增长,它们都在全球驱动数亿字节数据。在机器智能算法方面取得的最新进展和相关高性能GPU,让数据处理和理解呈现数量级加速,从而近似实时地产生见解。Radeon Instinct是针对机器智能的开放软件生态系统的蓝图,有助于加速推理洞察和算法训练。
AMD总裁兼首席执行官苏姿丰博士表示:“Radeon Instinct是一款高性能GPU加速器,结合MIOpen和ROCm之中免费开源软件,大大提高了机器智能发展步伐。结合高性能计算和图形能力以及我们的多代路线图实力,我们是唯一拥有GPU和x86硅芯片专业知识的公司,可以满足数据中心广泛需求,并帮助推动机器智能持续发展。”
在上周举行的AMD技术峰会上,来自1026 Labs、Inventec、SuperMicro,多伦多大学CHIME无线电望远镜项目和Xilinx的客户和合作伙伴对Radeon Instinct推出赞赏不已,讨论了如何利用AMD机器智能和深度学习技术,以及它们如何从Radeon Instinct中受益。
Radeon Instinct采用被动式散热、符合SR-IOV(单根I / O虚拟化)行业标准的AMD MultiGPU(MxGPU)硬件虚拟化技术,并且具有大基址寄存器和64-bit PCIe寻址功能, 支持多GPU点对点运行。
Radeon Instinct加速器用于处理各种机器智能应用:
ï Radeon Instinct MI6加速器基于备受欢迎的北极星GPU架构,采用被动散热,为工作/时间/功耗进行优化,板卡功耗150瓦,FP16峰值性能达到 5.7 TFLOPS,板载16GB GPU内存。
ï Radeon Instinct MI8 加速器利用高性能,高能源效率的“ Fiji”Nano GPU ,打造小尺寸HPC和推理加速器,FP16峰值性能达到 8.2 TFLOPS,板卡功耗低于175瓦,配备4GB高带宽内存(HBM)。
ï Radeon Instinct MI25加速器将使用AMD下一代高性能Vega GPU架构,专为深度学习训练而设计,针对求解整体时间进行了优化
各种开源解决方案助力Radeon Instinct硬件:
ï MIOpen GPU加速库:为了帮助实施高性机器智能,免费的开源MIOpen GPU加速库计划于2017年第一季度上市,为卷积、池化、激活函数,归一化和张量格式等标准例程提供GPU优化。
ï ROCm深度学习框架:优化ROCm平台,用于加速Caffe,Torch 7和Tensorflow *等流行的深度学习框架,允许程序员专注于训练神经网络,而不是通过ROCm丰富的集成进行底层性能调整。预期ROCm将作为基础,让机器智能问题集继续发展。除了开放的编译器和语言运行时,预计它也将具有专用编译器,用于线性代数和张量领域。
AMD还投资开发超越当今PCIe Gen3标准的互连技术,以进一步提高未来机器智能应用性能。 AMD正在合作开发一些开放的高性能I/O标准,支持广泛的服务器CPU架构生态系统,包括X86、OpenPOWER和ARM AArch64。 AMD是CCIX,Gen-Z和OpenCAPI创始成员,致力于为Radeon Instinct开发未来的25 Gbit/s phi加速器以及机架级互连。