英特尔发布开源AI参考套件

开源设计简化了用于医疗、制造、零售和其它行业解决方案的AI开发。

英特尔正式推出了首套开源AI参考套件,旨在让企业能够在本地、云端和边缘环境中都更易于部署AI。这些在英特尔On产业创新峰会(Intel Vision)上率先公布的参考套件包括AI模型代码、端到端机器学习管道说明、库和用于跨架构运行的英特尔oneAPI组件,让数据科学家和开发者能够学习如何更快速、更简单地在医疗、制造、零售和其他行业部署准确性更高、性能更优和总落地成本更低的AI。

在开放和众创的环境中,创新才能蓬勃发展。不管是包括各种已优化的流行框架的英特尔加速开放AI软件生态,还是英特尔的AI工具,都建立在开放的、基于标准的、统一的oneAPI编程模型基础上。此次推出的参考套件是用英特尔的各项端到端AI软件产品打造而成,将让数百万的开发者和数据科学家能够轻松快捷地将AI加入应用程序,或改善现有的智能解决方案。

  ——李炜博士  英特尔副总裁   兼人工智能和分析部门总经理

随着视觉、语音、推荐系统等领域的用例出现,AI工作负载正不断增长并变得更加多样化。与埃森哲联合开发的英特尔AI参考套件旨在加速推动AI在各行业的应用。这些套件是开源的预置AI,可针对各种重要企业应用场景,支持新AI的引入和现有AI解决方案的战略调整。

本次英特尔将推出四款套件供下载:

● 公用设施资产健康:随着全球能源消耗的持续增长,电力传输资产的数量预计也将增长。这一预测分析模型被训练用于提高公用设施的服务可靠性。通过英特尔 oneAPI数据分析库(Intel oneAPI Data Analytics Library),它使用经英特尔优化的XGBoost算法,基于34项属性和超过1000万个数据点,对电线杆的使用状况进行建模。①数据类型包括资产使用年限、机械性能、地理空间数据、检查报告、制造商、先前的维修和维护历史以及断电记录。该预测性资产维护模型会不断学习新提供的数据,如新的电线杆制造商、断电和其他条件变化。

● 视觉质量控制:质量控制是所有制造业务中的必需环节。计算机视觉技术的挑战在于它们在训练过程中往往需要大量的图像算力,且需要随着新产品的推出频繁地重新训练。这一AI视觉质量控制模型是用包括英特尔 PyTorch优化版的英特尔 AI Analytics Toolkit和英特尔 发行版OpenVINO 工具套件训练而成,二者均由oneAPI提供技术支持。针对跨CPU、GPU和其它基于加速器的架构的计算机视觉工作负载,与现有的未经英特尔优化②的埃森哲视觉质量控制套件相比,这一模型的的训练和推理速度分别提高了20%和55%。利用计算机视觉技术和SqueezeNet分类算法,这一AI视觉质量控制模型可通过超参数调优和优化检测药品缺陷,准确率达95%。

● 客服机器人:对话式聊天机器人已成为支持整个企业发展的关键服务。用于对话式聊天机器人交互的AI模型是规模庞大且高度复杂的。这款参考套件包含了进行意图分类(intent classification)和命名实体识别(named-entity recognition)的深度学习自然语言处理模型,使用BERT和PyTorch。英特尔 PyTorch扩展包(Intel Extension for PyTorch)和英特尔 发行版OpenVINO 工具对该模型进行了优化,实现了跨异构的更高性能,与现有的未经英特尔优化的埃森哲客服机器人套件相比,推理速度提高了45%③,同时,还让开发者通过最少的代码改动就能重新使用模型开发代码进行训练和推理。

● 智能文档索引:企业每年需要处理和分析数百万份文档,许多半结构化和非结构化文档都需要手动操作。AI可以自动处理和分类这些文档,以提高速度并降低人力成本。此款套件使用支持向量分类(SVC)模型,并通过oneAPI技术支持下的Intel 发行版Modin和英特尔 Scikit-learn扩展包(Intel Extension for Scikit-learn)进行了优化。与现有的未经英特尔优化④的埃森哲智能文档索引工具包相比,这些工具将将数据预处理、训练和推理的时间分别提高了46%、96%和60%,能以65%的准确率审阅和分析文档。

开发者希望能将AI加入其解决方案,英特尔此次发布的AI参考套件则有助于这一目标的实现。这些套件建立在英特尔端到端工具和框架优化AI软件的基础上,并完善了这一产品组合。基于oneAPI开放的、基于标准的、异构的,可在多种架构上运行的编程模型开发,这些工具能克服专有环境限制,帮助数据科学家以更快的速度和更低的成本训练模型。

未来一年,英特尔还将发布一系列新开源AI参考套件,提供各种已训练好的机器学习和深度学习模型,帮助各种规模的企业进行数字化转型。

① 预测性公共设施分析参考套件(Predictive Utility Analytics Reference Kit),测量于2022年6月29日。

硬件配置:微软Azure Standard D4_v5,操作系统:Ubuntu 20.04.4 LTS(Focal Fossa),8 X英特尔 至强 Platinum 8370C CPU @ 2.80GHz,2线程/核, 4核/插槽,1插槽。

软件配置:配置1(Python v3.9,Scikit-learn v 1.0.2,Xgboost v0.81),配置2(英特尔 发行版Python 3.9.12 2022.0.0,Scikit-learn 0.24.2,英特尔 Scikit-learn扩展包 2021.5.1,Xgboost 1.4.3,daap4py 2021.6.0)。

② 视觉质量检测参考套件(Visual Quality Inspection Reference Kit),测量于2022年6月29日。硬件配置:微软Azure Standard D4_v5,操作系统:Ubuntu 20.04.4 LTS(Focal Fossa),4 X英特尔 至强 Platinum 8370C CPU @ 2.80GHz,2线程/核,2核/插槽,1插槽。软件配置:配置1(PyTorch v1.8.0),配置2(英特尔 PyTorch扩展包 v1.8.0,英特尔 神经网络压缩器v1.12,英特尔 发行版OpenVINO工具2021.4.2)。

③ 客服机器人参考套件(Customer Chatbot Reference Kit),测量于2022年6月22日。硬件配置:微软Azure Standard D4_v5,操作系统:Red Hat Enterprise Linux Server 7.9,4 X英特尔 至强 Platinum 8370C CPU @ 2.80GHz, 2线程/核, 2核/插槽,1插槽。软件配置:配置1(PyTorch v1.11),配置2(PyTorch v1.11.0,英特尔 PyTorch扩展包 v1.11.200,英特尔 神经网络压缩器v1.12)。

④ 智能索引参考套件(Intelligent Indexing Reference Kit),测量于2022年6月22日。硬件配置:亚马逊AWS m6i.xlarge,操作系统:Red Hat Enterprise Linux Server 7.9,4 X英特尔 至强 Platinum 8370C CPU @ 2.80GHz, 2线程/核, 2核/插槽,1插槽。软件配置:配置1(Pandas, Scikit-learn),配置2(英特尔 AI Analytics Toolkit v 2021.4.1,英特尔 Scikit-learn扩展包,英特尔 发行版Modin)。

实际性能受使用情况、配置和其他因素的差异影响。更多信息请访问www.Intel.com/PerformanceIndex。

结果可能有所不同。性能结果基于配置信息中显示的日期进行测试,且可能并未反映所有公开可用的更新。

  没有任何产品或组件能够保证绝对安全。

  您的成本和结果可能有所不同。

  英特尔技术可能需要启用硬件、软件或激活服务。

  英特尔不控制或审计第三方数据。在评估数据准确性时,请参考其它信息源。

英特尔公司,英特尔、英特尔logo及其它英特尔标识,是英特尔公司或其分支机构的商标。文中涉及的其它名称及品牌属于各自所有者资产。