安擎AI解决方案赋能智能驾驶
安擎(天津)计算机有限公司(以下简称:安擎)是国产服务器生产厂商,是行业领先的软硬件解决方案提供商。安擎始终致力于国产服务器的自主研发以及国产服务器品牌的大力建设,公司在云计算、大数据、高性能计算、人工智能等领域持续进行研发投入,并提供整体化的解决方案。针对人工智能领域的应用需求,安擎推出了软硬件一体化的AI解决方案,在结合安擎深度学习平台的基础上,借助英特尔®至强®可扩展系列处理器,显著提升用户的资源管理效率和研发效率。
背景
随着人工智能技术的进一步成熟,人工智能应用的云端化不断加速,全球人工智能产业规模在未来十年也将进入高速增长期。人工智能技术将作为核心角色,将引领新一轮科技和产业变革,并推动传统产业升级换代,驱动“无人经济”快速发展,在智能交通、智能安防、智能家居、智能医疗等民生领域产生积极正面的影响。
智能驾驶作为人工智能引领的创新生态布局的一部分,是信息化与工业化融合的典型代表。它不仅仅是新一代的交通工具,也是个性化需求和数据的收集终端与交互平台,更是全新的智能制造体系及产业价值链的核心环节。
挑战
如何才能高效地进行集群资源管理?
安擎此次合作的智能驾驶领域的知名AI企业,其核心优势是深度学习算法研发,但缺乏Linux经验和平台维护经验。因此,搭建深度学习软件栈耗费了该企业大量的时间。实际情况如下:该企业配置了10台GPU服务器,每台GPU服务器承载8块GPU卡。但因研发人员众多,且使用的深度学习框架有好几种,因此急需一套集群资源管理系统来统一管理所有GPU服务器,并且快速创建深度学习应用。
安擎AI解决方案
基于对AI发展趋势的把控以及对AI技术的持续关注和研究,安擎推出了软硬件一体化的AI解决方案。在硬件上,该解决方案依托于安擎人工智能服务器EG840G-G20,这款机器使用的即是英特尔®至强®可扩展处理器平台;在软件上,安擎AI解决方案采用了以容器技术为核心、可达秒级创建的安擎深度学习平台。
值得一提的是,配置了英特尔®至强®可扩展处理器保证了该款服务器具备卓越性能、高可靠性、高安全性以及较强灵活性的优势。而安擎深度学习平台在底层系统的驱动和软件库层面进行了足够的性能优化,充分发挥出了GPU集群的性能,并且能够针对不同的深度学习框架,通过镜像定制和分发平台,帮助用户定制化镜像和应用。安擎深度学习平台已在多个实际项目中得到验证,最大的节点规模可达上千个。
安擎深度学习平台
当前的人工智能主要发展为计算机视觉、自然语言理解与交流、认知与推理、机器人学、博弈与伦理和机器学习六大领域。在人工神经网络基础上发展起来的深度学习模型,是当前最为有效的机器学习算法模型之一,也成为了当前人工智能研究与应用的热点。
基本介绍
安擎深度学习平台是一套基于GPU服务器集群的用于深度学习的资源管理平台软件,它将GPU资源、CPU资源、内存、硬盘等资源虚拟化后进行统一管理,按需分配给不同用户和群组使用。安擎深度学习平台支持主流机器学习框架(如TensorFlow、Caffe、Torch、Keras等),提供深度学习的模型(算法)库(LeNet、MLSTM、Alexnet、Googlenet、ResNet、GAN、Faster R-CNN等)、标准数据集(ImageNet、COCO、PASCAL VOC、CIFAR、Open Image、Youtube-8M)、Demo演示程序(人脸识别门禁程序、手写数字识别、快速多目标识别等)。
系统功能架构图
客户价值
l 快速部署 一键部署,快速搭建AI训练集群;
l 节省投资 提高IT设备利用率,按需分配;节省研发时间,缩减研发成本;
l 提高效率 支持分布式,显著提高训练速度;
l 教学实训 降低技术门槛,聚焦深度学习算法,加快科研速度。
价值与收益
缩短管理周期,资源利用率显著提高
安擎AI解决方案部署后,将所有服务器统一管理,解决了从集群部署到资源分配和监控的整个生命周期内的管理需求。图形化界面,简单易用,一键秒级创建主流机器学习应用(Tensorflow、Caffe、Torch等),且应用之间相互独立,互不干扰,资源得到了有效利用。
训练及研发效率有效提升
安擎AI解决方案实现了跨GPU节点分布式运行Torch训练,大大提高了训练效率,节省了90%的训练时间。
总结
安擎AI解决方案能够助力科研单位、高等院校、人工智能企业更快地进入深度学习研发领域,更好地聚焦算法本身,更快地推出能够解决实际问题和需求的产品。此外,安擎提供7×24h技术支持服务,有效帮助客户提高研发效率。