联泰集群助力西安交通大学人工智能与机器人研究所项目

联泰集群服务于各类AI行业用户。

西安交通大学人工智能与机器人研究所成立于1986年,其前身是自动控制专业计算机控制教研室。是”视觉信息处理与应用国家工程实验室”的支撑单位,并在教育部、国家外国专家局”高等学校学科创新引智计划”的支持下与国际知名学者合作组建了”认知科学与工程国际研究中心。

微信图片_20180522181539

联泰集群在西交大现场实施

微信图片_20180522174104

产品图片

研究所作为”模式识别与智能系统”国家重点学科,是西安交通大学培养高层次人才的重要基地。主要进行以计算机视觉与模式识别为基础的智能信息处理结合学科发展前沿,重点进行视觉信号统计特性、初级视觉模型、计算机图形学和机器视觉信息计算模型研究;智能系统的数理机制探索与模型化;计算视频及面向图像和视频处理的超大规模专用集成电路设计;基于图像信息的智能控制与识别系统和各种图像处理方法与技术。

项目需求

计算机视觉里经常使用卷积神经网络,即CNN,是一种对人脑比较精准的模拟。卷积神经网络对计算机的运算要求比较高,需要大量重复可并行化的计算。而在目前使用的工作站上进行卷积神经网络的训练往往需要几十个小时甚至几天的时间。迫切需要具备高浮点运算能力,能提供大规模并行密集计算能力的设备来加快科研项目的进程。

解决方案

联泰集群经过与西安交通大学人工智能与机器人研究所相关研究人员的沟通,充分了解计算需求后提供软硬件一体化的计算平台解决方案 :该方案可以提供 226TFLOPS的理论单精度计算能力,可支持不同用户使用不同开发环境的需求并相互隔离,提供可视化的联泰集群 VisualAI Cloud 人工智能计算平台,可以对系统计算资源进行调度及排序以更好的满足不同用户、不同任务的计算需求。

T-4028GR-TR2 GPU服务器

– 4U双路GPU服务器平台,最多可支持10张GPU计算卡

– 英特尔双路至强E5-2600 v4/v3 系列CPU(最大TDP 160W)

– 24个热插拔2.5″ SAS/SATA 硬盘位,  6个内置3.5″ SAS/SATA 硬盘位

– 12+12 DDR4 内存槽,支持2400MHz ECC RDIMM内存,  最大可支持3TB ECC 3DS  LRDIMM,1.5TB ECC RDIMM

– 10个 PCI-E 3.0 x16 插槽 (支持10张双宽GPU卡)

1个 PCI-E 3.0 x16 插槽

1个 PCI-E 3.0 x16 插槽(x8信号)

– 2个 RJ45 千兆以太网络接口(英特尔 i350 双口网络芯片)

– 1个 RJ45 专用 IPMI 网络接口

– 2000W 高效钛金级 2+2 冗余电源

 

1

 

联泰集群VisualAI Cloud人工智能云计算平台

联泰集群 VisualAI Cloud 人工智能云计算平台通过整合高性能计算、云计算、大数据和人工智能等多学科的关键技术,提供从训练到推理的一站式人工智能云计算应用服务解决方案,能够帮助用户快速构建人工智能研发服务环境,大幅降低人工智能准入门槛,提升人工智能研发效率。

2

VisualAI Cloud集成图像分类、物体识别、图像分割、文本分类等多个基础应用场景,提供从数据集管理、模型管理、模型训练到模型预测的全流程AI计算服务,用户无需编程也可获得强大的AI服务能力。

3

4

异构资源虚拟化

采用Docker容器技术为基础实现,原生支持对CPU 、内存等计算资源的虚拟化,针对人工智能领域的特定需求提供GPU 等异构资源管理接口,实现 CPU 、GPU等异构计算资源的虚拟化统一管理。

资源动态调度

提供动态资源调度管理系统,全面支持CPU、GPU等异构资源的混合调度,提供FIFO、作业优先级、资源配额等调度策略,支持自动选择性能最优的作业部署拓扑,同时内置高可用方法应对硬件失效问题。

深度学习框架

集成Tensorflow、Caffe、Torch、Caffe2、Pytorch等主流深度学习计算框架,全面支持单机多GPU和多机多GPU的并行处理,支持模型并行和数据并行,可大幅提升计算效率。

网络模型算法

集成AlexNet、GoogleNet、VGG等常用CNN和RNN网络模型,并支持用户对内置算法的修改和优化,同时提供网络可视化等辅助工具。