2013年3月,备受瞩目的图形计算盛会GTC 2013(GPU Technology Conference)在美国加利福尼亚州圣何塞麦克恩利会议中心举行。期间NVIDIA首次清晰地描述了GRID产品及相关技术, NVIDIA GRID™产品主要用来加速VDI(Virtual Desktop Infrastructure)虚拟桌面基础架构下的图形处理效能,透过NVIDIA GRID™技术可以将图形处理任务从CPU移交给虚拟化环境中的GPU 来处理,从而克服大型3D设计建模软件无法在VDI架构下使用的问题,继而可以改善VDI架构下的整体3D应用体验。
众所周知,华硕ESC超算产品家族拥有丰富的产品线,涵盖桌面级与集群级两大阵营,更切近用户的使用环境,目前第二代ESC G2家族产品已几乎成为科研用户在CPU+GPU混合超算应用领域的不二之选,拥有多个领先的身份标签:超高的稳定性;优秀的散热系统;全面支持NVidia® Tesla® 、AMD FireProTM 、Intel® Xeon PhiTM计算加速卡;独家EPU DIGI+VRM节能技术;极致的超高计算密度与性能等等。
针对NVIDIA GRID™技术,华硕率先提出了支持,NVIDIA GRID™产品中的核心产品为GRID显卡,目前主要有两款产品分别对应不同的应用场景,GRID K1和K2,其中GRID K1主要设计满足Power User及Knowledge Worker用户群,提供768个CUDA核心;而GRID K2主要设计面向传统Quadro 应用的Designer/Engineer,提供3072个CUDA核心。通过NVIDIA官方网站可以发现:华硕ESC4000G2系列产品已经过NVIDIA总部实验室验证,单个ESC4000G2最大支持3片GRID K1或4片GRID K2;同时官方数据显示目前只有华硕ASUS、IBM、戴尔正式通过官方认证,其中华硕ESC4000G2提供比其他厂商2倍的GRID显卡支持密度。
近期华硕集团总部开放实验室和InCG针对ESC4000G2+2xGRID K2,在Citrix XenDesktop桌面虚拟化架构下进行了合作验证,并公布了相关值得参考的数据。
▲ESC4000G2 + GRID K2
▲NVIDIA GRID VGX software diagram
验证场景一:Viewport 显示速率
首先是3ds Max 实时显示测试,使用面数为5百多万面的场景,贴图占显示适配器内存1736MB,在View Port上使用Realistic+ Edged faces时,虚拟主机每秒可以达到26fp以上,对照组的DIY工作站配备i7-920 + Quadro 4000每秒约7fps,可见NVIDIA Kepler架构确实让显示效能有非常大的跃进,但ESC4000 G2在同时四台虚拟机都开启同一个档案操作时依然能够有相同的效能表现令工程师非常惊讶,有了NVIDIA GRID K2与VGX Hypervisor技术加持让ESC4000 G2变身成为绘图工作站中的叶问,”一个打十个”这经典画面在CG界真实上演。
▲实体工作站i7-920 + Quadro 4000
▲虚拟机 ESC4000G2 + GRID K2 + Citrix XenDesktop
验证场景二:虚拟主机VS实体工作站
验证iRay这款全物理运算并使用CUDA技术的彩现引擎,因为CPU资源分配的关系所以仅使用两部虚拟主机,虚拟工作站各分配了四核心的CPU资源与一颗NVIDIA GRID K2拥有1536个CUDA核心与4G GDDR5显示内存,图文件大小为Full HD规格1920*1080,两部虚拟主机同时算图计算1024次所耗费的时间分别为46m59s与47m05s,而对照组的工作站因为仅有2G GDDR5的显示内存,不足场景所需而跳出了警告讯息,整体算图过程系统崩溃了好几次,最后成功计算出来的时间为4h30m36s,足足是虚拟工作站的六倍之多。
▲虚拟绘图工作站在效能上是可以超越实体工作站的
验证场景三:VDI模式下网络图形渲染
验证VDI模式下网络图形渲染的功能,因为每部虚拟主机都可以视为单独的工作站,这对想要制作动画的使用者来说是非常有利的,因为组Render Farm通常需要多部主机与大空间才能达成,现在只需要少量的主机就能达到多部主机效率的话,那真的是一大福音,工程师使用了Backburner控制渲染工作,测试1920*1080与电影规格的4096*2304并分隔为10个计算单位,假设单台单张1920*1080花费46分钟来计算,那理论上两台同时计算应该会低于这个时间才是,但结果出乎意料的反而是花费了55分钟17秒,可是成像的质量却大大的提升了,原因可能是在做Ray Tracer受影像大小的影响不大,仍旧需要要花那么多时间去计算光影的数值,但由于影像大小变小反而提高了成像的质量,基于这样的结论测试4K图档的算
图结果应该不需要花四倍的时间才是(因为影像是四倍大),结果花费2小时47分钟41秒,成像质量也与前一次的差不多,所以证明使用GPU算图利用iRay彩现会比传统CPU算图在影像大小日益膨胀的未来更具有竞争优势。
▲VDI模式下网络图形渲染可有效的消除白点
验证场景四:After Effects 加速
Adobe After Effects的加速测试,Adobe CS6版本有多项软件都已经是64位的版本了,并且提供水星引擎在图像处理上有硬件加速功能,而图像处理最耗时的不外乎是加入特效之后的预览与最后输出影片时编码所需要的时间,而强大的NVIDIA GRID K2提供了最佳的解决之道,比起单纯使用CPU编码的速度提升了约8倍的时间(H.264编码),在测试的过程中都是同时使用两部虚拟主机在做运算,强悍的效能表现一点都不受到影响真的很令人印象深刻。
验证场景五:ESC4000G2+ GRID K2压力测试
最后还是要做一下压力测试才能知道这样的虚拟主机方案能不能真的使用在工作上而不流于研究阶段,还是一样使用iRay来做测试,把算图质量设定为Unlimited就能够永无休止的算下去,经过了36个小时连续测试下来ESC4000 G2依然平顺且正常的工作着,GPU温度也都保持在摄氏50度的稳定状态,散热效率与稳定性都非常值得信赖。
▲全速运转时的GPU 状态
▲闲置时的GPU 状态
最后
得益于华硕ESC 4000 G2对NVIDIA GRID显卡超高密度的支持能力,在具体的企业应用场景中,假设原有10名员工都必须在个人工作站上安装专业显卡来工作,为满足这部分需求就必须购置10台绘图工作站产品,成本支出异常昂贵,但使用NVIDIA GRID K2搭配NVIDIA VGX Hypervisor技术则可以将GPU资源共享给多部虚拟主机,以GRID K2内含两颗GPU并可以安装四片的数量来计算,一台ESC4000 G2最少可以分配给8位专业工程绘图人员来使用,而若是搭配像是CITRIX的XenDesktop与XenServer分享的数量将可以超越16台以上,这样的解决方案对于有大量绘图需求的企业不但成本更加节省,而且管理上也能方便许多,另外操作的平台也可以扩展到其他行动装置上,因为透过虚拟主机操作的方式只要在能够接受画面与输入指令平台就能作业,平板电脑或是其他装置都能变成绘图工作站。
正如业内人士所表示,在GRID之前,我们确实没有任何可以直接使用的GPU硬件虚拟化应用,让客户能够对其多路工作负荷进行虚拟化,而NVIDIA GRID技术让华硕解决方案能够在运行设计与图形密集型应用时表现出更强的性能,并且降低成本,使企业实现增长。以ESC4000 G2这样高集成GPU运算仅需要2U空间的服务器来说,在功耗效能比上同级产品确实无人能敌,不论是要用在单一系统当作个人超级计算机来使用,或是成为多人使用的绘图计算中心功能都可以灵活搭配应用在各个领域上。
为了保证ESC4000 G2超级计算机计算的可靠性,华硕ESC4000 G2搭载了优化的散热解决方案:华硕独家的设计将系统分为三个独立的散热区块,再配合华硕独家智能风扇技术与AIR-ThroughTM热空气导流架构的机构设计,这样CPU和GPU所产生的气流、热空气可被独立且迅速的排出机壳之外,达到最佳散热目的。ESC4000 G2超级计算机还配备了具备电源管理功能的1620W 1+1高效能冗余电源,该款电源通过80 PLUS 白金认证,有效提升电能利用率,实现节能性绿色计算。ESC4000 G2超级计算机内搭最新一代EPU数字绿色能量引擎,实现全数字化的供电控制,根据实际的系统负载自动调节中央处理器供电相数,从而实现智慧型电能管理,有效改善客户在数据中心能源管理方面的效能,同时也在保护环境降低碳排放上作出更多的贡献。
此外值得一提的是,华硕ESC4000G2还是唯一通过Citrix虚拟化Ready认证的超算服务器http://www.citrix.com/ready/en/asus/asus-esc4000-g2
更多华硕ESC产品,请访问:http://event.asus.com.cn/2012/1119yServer/