基于英特尔® 边缘平台的蘑菇云高中人工智能教学方案助力普及人工智能教育
“蘑菇云高中人工智能教学解决方案是一套面向全国普通高中的人工智能教学解决方案。整体方案依据教育部发布的《普通高中信息技术课程标准(2017年版)》中《人工智能初步》教材要求,包含人工智能实践课程、及软硬件平台工具。整体人工智能教学解决方案采用超强算力的英特尔®至强®处理器,AI服务器本地化部署,避免网络传输问题,是云端上传速度的1000倍,解决了云端算力与网络带宽的问题。格物象课程实践平台,紧贴高中教材内容,极大降低老师备课时间。拿铁熊猫智能终端,基于英特尔®赛扬®处理器,可本地化模型训练,与海量开源硬件建立连接。本方案将创新性与实用性有机结合,让学生创造更具多元化。”张倩DFRobot市场总监 |
概述
人工智能 (AI) 技术被普遍认为是未来科技的制高点,从中小学阶段强化人工智能教育既是对接世界科技发展趋势、强化人工智能人才培养的必然需求,也对学校的课程建设、教学方法的改革有着特殊意义。在此背景下,越来越多的中小学校开展了人工智能教学,通过人工智能实验室/实训室、人工智能课堂等方式,帮助学生了解人工智能知识并培养学习兴趣。
针对这一发展趋势,上海智位机器人股份有限公司(DFRobot)旗下的蘑菇云教育品牌(以下简称:蘑菇云)推出了高中人工智能教学方案,融合了基于英特尔® 架构的“AI服务器”与“拿铁熊猫智能终端”,以及包含完整人工智能课程内容的格物象课程实践平台,能够提供从人工智能算法教学到人工智能软硬件项目实现的全过程,帮助学校一站式地搭建人工智能教学体系,提升教学效果。
人工智能教育的探索与实践
随着人工智能逐渐进入技术成熟度曲线 (The Hype Cycle) 中的生产成熟期(Plateau of Productivity),人工智能已在各领域得到广泛的应用,对行业的发展速度、内涵及质量产生 了深刻的影响,并成为行业实施数字化、智能化转型的基石。IDC 发布的《2021 年 V2 全球人工智能支出指南》预测,全球 AI 市场支出将在 2021 年达到 850 亿美元,并在 2025 年增至 2000 亿美元,复合年增长率(CAGR)约为 24.5%。根据最新预测,2021年,中国在AI市场的支出规模将达到82亿美元。2021-2025的五年预测期内,中国市场AI相关支出总量将以22%左右的CAGR增长,有望在2025年超过160亿美元1。
图1. 中国人工智能市场支出预测
与此同时,技术的飞速发展也带来了巨大的人才缺口。有统计数据表明,目前我国人工智能人才需求缺口达 500 万人2,在人才需求结构上,基础层人才需求尤为迫切。近两年,国内对于人工智能人才的需求更是呈现出水涨船高的态势。数据统计还显示,2021年人工智能行业人才需求指数较去年增长103%,其中算法人才缺口达170万3,这也成为人工智能教育行业发展的巨大动力。
图2:人工智能行业人才需求指数
在此背景下,强化面向青少年等群体的人工智能教育成为社会的广泛共识,人工智能教育也逐步被纳入到学校的教学规划中。2017年,国务院就印发了《新一代人工智能发展规划》,明确提出“人工智能成为国际竞争新焦点。在中小学阶段设置人工智能相关课程,逐步推广编程教育” 4,2019年,教育部印发《中小学综合实践活动课程指导纲要》,设计了人工智能相关主题活动。此外,多个省市的教育机构发文要求,各地要依托人工智能教育实验区和试点校,完善本地区中小学人工智能教育工作规划,细化工作分工,健全扶持政策,加快推进中小学校人工智能教育普及化。
教育部教育信息化专家组认为,应把人工智能列入必修内容,目标是素养培育,抓手是编程实践,需要着重从传授人工智能基础知识,进行人工智能启蒙教育;培养学生使用智能工具的能力;学习用编程解决实际问题,培养计算思维、创新思维等基本素养等多方面入手,深化教育体制改革5,6。
要推进人工智能教育,构建人工智能实训环境至关重要,人工智能实训可以帮助学生从简单、基础的人工智能模型训练、推理等流程入手,了解人工智能应用的相关知识。因此,越来越多的学校开始开设人工智能实验室/实训室,在人工智能算力基础设施之上提供人工智能教学课程。
由于人工智能教育的主要目标是培养学生的人工智能技能,锻炼学生的数据科学思维7。因此,与企业的人工智能应用相比,部署于 K12 阶段的人工智能实验室/实训室具备着以下特点:
- 提供全流程的人工智能应用实践能力
在K12 教育阶段,大部分学生并未接触过人工智能,因此,学校需要构建“从零开始”的课程培训体系,并支持全流程的人工智能应用,这包括数据准备、模型训练、模型部署、模型推理等各个阶段。
其中,在数据准备阶段,人工智能教育实验室/实训室需要支持对于给定的数据集进行处理,将其输入到模型之中;在建模阶段,需要为学生提供适合学习阶段的预置模型库,允许学生通过训练需求来选择合适的模型;在部署与推理阶段,学生能够利用训练好的模型,验证训练的模型能否在精度等方面满足预定的目标。
- 实现基础设施与人工智能课程体系的融合
人工智能教育实验室/实训室的基础是一整套的人工智能应用平台,核心则是人工智能课程体系。这套课程体系既需要符合信息技术教材等规范性要求,还需要针对学生的学习特点,提供重点明确、体系完整、功能强大的课程设计,支持学生使用简单的人工智能工具,进行更富主观能动性的探索,实现从感性引导到兴趣实践,再到创新应用的流程。
图3:K 12 阶段的人工智能教育目标
一般而言,人工智能课程体系需要包括以下内容:人工智能课程的课程纲要、教材、代码示例;面向 人工智能基础知识传授的交互式课程;支持自主模型训练/推理的实践应用平台;作业批改以及评价系统;师生互动应用。要支撑这一课程体系,就需要构建就绪型的人工智能教育环境,在硬件平台基础上提供必要的软件组件。
面向 K12 的人工智能教育实训室面临的挑战
当前,我国人工智能教育发展迅速但尚处于起步阶段,存在人工智能教育人才储备不足,人工智能教育存在技术瓶颈,人工智能教育产品不完善,人工智能教育大数据平台缺乏,人工智能教育可能产生伦理风险等问题8,亟需进行持续的探索与创新。
而从平台建设来看,算力平台是人工智能教育实验室/实训室构建的基础,面向 K12 的人工智能教育场景应用有着以下特征,对于人工智能基础设施的构建带来了相应的挑战:
- 人工智能模型的复杂度不高,对于算力要求相对较低,使用CPU进行训练或推理即可满足绝大部分场景的算力需求。例如,在常见的 AI 图片检测学习任务中,图片数据集常常在 3000-5000 张的规模,训练与推理时间只需保证在分钟的级别,较商业级 AI 应用的性能目标大幅缩减,应用效率较低导致资源浪费。
- 学校普遍缺乏面向人工智能应用的专业部署和运维能力,普遍存在缺乏面向不同应用场景、不同软件框架的软硬件优化方案,异构设备之间难以实施有效协同等问题。学校希望通过软硬件一体化等形式来降低运维门槛,简化应用。
- 教室场景意味着人工智能的应用相对集中,集中通过AI服务器进行运行可能会带来性能拥堵的问题,因此要求终端具备一定的本地算力。
- 高中阶段的人工智能教育需求具备体系化、规范化的要求,但在教育实践中,常常出现可选实验场景、器材和软件套件混乱,无法满足真实场景的学习需要等问题,更无法贴近行业实践要求。需要平台具备丰富的可扩展性。
人工智能教育实验室/实训室需要解决算力的分配问题,将算力集中在云或数据中心的服务器中有利于实现更高的灵活度,但可能在集中应用的时候出现算力不足的问题;将算力部署于终端适用于对本地算力要求更高的应用,但在运维与管理问题可能会遇到较大的挑战。
英特尔人工智能实训愿景与架构参考
为助力打造更高效的人工智能教育实训环境,英特尔凭借其不断创新的产品与技术体系,以及在 “云边协同” 上积累的丰富实战经验,与人工智能教育解决方案厂商一起为教育机构打造 “云 – 边 – 端” 架构的端到端人工智能实训解决方案,为师生提供高性能、高可用和灵活可扩展的人工智能动手实践平台。
图4:典型的 “云 – 边 – 端” 人工智能教育实训环境
其中,边缘平台是人工智能教育实训环境的重要基础平台,在异构硬件融合的基础上提供了人工智能开发环境,为人工智能推理、开发套件等应用提供强大算力支持。特别是对于 K12 阶段的人工智能教育来说,其无需学校在数据中心或云服务方面进行大量投入,就可以搭建更敏捷、更高稳定性、更低成本的人工智能实训室。
此外,方案还能够提供基于英特尔®架构的AI智能硬件开发套件,包含面向计算机视觉、人工智能、边缘计算、推理运算等各类实训场景的外接实训设备。结合不同课程和实训应用场景,配套不同实训套件,基于英特尔®加速器深度学习推理性能,辅助课程实训模拟,可快速开发和部署、简化软件开发。
基于英特尔® 架构的蘑菇云高中人工智能教学解决方案
蘑菇云高中人工智能教学解决方案是一套基于本地AI教学服务器、课程紧贴高中课标、软硬结合的整体解决方案,能够让学生学以致用,保证授课老师课堂高效稳定。方案包含了本地AI教学服务器、格物象课程实践平台、拿铁熊猫智能终端三个部分。
图5:蘑菇云高中人工智能教学解决方案关系图
- 本地AI教学服务器:搭载了英特尔® 至强® 可扩展处理器,专为人工智能教学场景进行研发配置,采用本地化AI服务器部署方式,快速实现教室或机房的设备连通访问,用于学生AI课程的模型训练和算法学习,支持容器Docker。
- 格物象课程实践平台:课程平台匹配高中信息技术教材选择性必修4《人工智能初步》模块的课程标准,结合原理讲解动画及开源硬件动手实践的方式,解决人工智能课程难教难学、纯原理讲解空洞的现象,同时能够满足学生学习Python代码、进行人工智能项目应用、AI模型训练以及老师进行班级资源管理的功能。
- 拿铁熊猫智能终端:搭载了英特尔® 赛扬®处理器,是一款结合实际应用项目的配套智能硬件套件,结合格物象教学实践平台上的教学内容使用,可用于学生作品或竞赛类项目开发。学生可以通过拿铁熊猫智能终端实现计算机视觉、智能语音、文字识别等相关项目,并可以使用此套件进行应用扩展、产品原型的验证。
“任何高科技产业的发展最终都将取决于人才的培养和储备,尤其是最新的人工智能技术对现在的老师而言更是如此。蘑菇云高中人工智能教学解决方案为老师与学生提供了一个简单易用的人工智能教育平台,有助于实现基础算力资源与完善的人工智能教学体系的融合,加速人工智能教育的落地。”余静蘑菇云科创教育产品总监 |
蘑菇云高中人工智能教学解决方案能够提供如下主要功能:
人工智能课程学习:平台中含有20+课时的AI学习课程,主要分为三个阶段,初识AI技术基本原理、AI应用领域、AI应用从浅入深进行学习。通过动画模拟效果,学生能够学习计算机视觉、语音等工作原理和工作过程,更清晰和具象的了解运算过程,进一步理解算法构成。
图6:模拟卷积神经网络运算动态图
Python编辑器:平台采用理论与实践相结合,界面上一键切换到Python编辑器界面进行代码编辑,撰写项目,应用课程所学解决问题。
官方案例:平台提供了20+官方案例,为初学者提供简单易懂的样例,能够更快速的进行算法的学习和运算过程的体验。
图7:支持学生导入数据进行个性化训练
AI项目部署与运行:学生可以将制作好的项目直接连通拿铁熊猫智能终端,通过格物象教学实训平台,能够将制作好的模型文件,进行一键部署,使得AI项目快速部署和运行在主控硬件上。
英特尔助力蘑菇云构建高性能、高经济性的人工智能教学环境
在进行人工智能教学方案设计时,选择 GPU 方案还是 CPU 方案通常会成为一道棘手的“选择题”。GPU 方案在算力上可以满足需求,但是,无论是共享 GPU 方案还是终端独立 GPU 方案,都涉及到昂贵的 GPU 采购,而且在兼容性和可扩展性等方面都需要较多的开发工作,带来更高的应用门槛。在典型的教学环境中,并发量通常可达57路,每一路需要4GB-5GB的显存支持,单张GPU卡只能支持4-5名学生,因此学校需要购置多张GPU卡,不仅采购成本高企,同时也会增加能耗成本和管理复杂性。相较之下,CPU 方案拥有更高的成本优势,而且在进行性能优化之后,足以满足高中人工智能教学对于训练和推理等应用的性能要求。
因此,蘑菇云高中人工智能教学解决方案最终选择了高性能、面向人工智能进行性能优化的英特尔®处理器。其中,部署于本地 AI 教学服务器的英特尔®至强®可扩展处理器内置人工智能加速并已针对工作负载进行优化,能够为各种高性能计算工作负载、AI应用以及高密度基础设施带来一流的性能和内存带宽。同时,采用矢量神经网络指令(VNNI)的英特尔® 深度学习加速(英特尔® DL Boost)显著提高了人工智能推理的表现。
此外,蘑菇云高中人工智能教学解决方案还使用了OpenVINO™ 工具套件进行性能加速,OpenVINO™ 工具套件能够实现广泛的深度学习推理应用和解决方案的快速部署,可支持开发人员使用行业标准人工智能框架、标准或自定义层,将深度学习推理轻松集成到应用中,在英特尔® 硬件(包括加速器)中扩展工作负载并改善性能。借助面向预推理模型的内置模型优化器(Model Optimizer,MO),和面向专用硬件加速的推理引擎(Inference Engine,IE)运行时,OpenVINO™ 工具套件可在英特尔的不同平台上部署并加速神经网络模型,能够在保持精度的同时显著提高图像推理速度。
模型优化器是一个跨平台的命令行工具,可实现训练环境和部署环境之间的转换,执行静态模型分析并调整深度学习模型,致力于在终端目标设备上实现最优执行能力。它支持从流行的框架(包括 TensorFlow/ONNX/ 模型)到中间数据格式(IR,intermediate representation)的离线模型转换。推理引擎则提供了统一的跨平台C、C++ 和Python API,用于推理加速和优化。
蘑菇云实测数据显示,基于英特尔®至强®可扩展处理器 + OpenVINO™ 工具套件的蘑菇云高中人工智能教学解决方案能够在最高并发量下,支持 57 路教学应用同时运行,并满足最长训练时间在 5 分钟之内,最长推理时间在 1 分钟之内的性能指标9。尤为重要的是,该算力配置的成本相比主流 GPU 方案大幅降低,性价比优势极为显著。
在终端层面,拿铁熊猫智能终端采用了英特尔®赛扬®处理器,为Python 3、OpenCV、TensorFlow 和 Keras 人工智能开发环境配置提供了高效的算力支持,同时板载了一块Arduino芯片,兼容Arduino的硬件模块和软件类库。此外,英特尔®赛扬®处理器还具备高可扩展性、高兼容性的优势,支持拿铁熊猫智能终端通过扩展口打通开源硬件生态,满足更多智能场景的教学实践需求。
蘑菇云解决方案 | 英特尔® CPU + A GPU (24GB) | 英特尔®CPU + B GPU (32GB) | 英特尔® CPU+ C GPU (4GB) | |
CPU | 双路英特尔®至强®金牌5218R 处理器(20 核 40 线程,2.1GHz) | 双路英特尔®至强®金牌5218R 处理器(20 核 40 线程,2.1GHz) | 双路英特尔®至强®金牌5218R 处理器(20 核 40 线程,2.1GHz) | 8 x 双路英特尔®至强®铜牌 3104 处理器(6 核 6 线程,1.7GHz) |
内存 | 256 GB DDR4 2666 RECC (16*16GB) | 256 GB DDR4 2666 RECC (16*16GB) | 256 GB DDR4 2666 RECC (16*16GB) | 256 GB DDR4 2666 RECC (16*16GB) |
存储 | 960GB SATA SSD | 960 GB SATA SSD | 960 GB SATA SSD | 8 x 240 GB SATA SSD |
独立 GPU | 无 | 是,8 x 24G | 是,6 x 32G | 是,57 x 4G |
解决方案要求 | ||||
最大并发流:57 | 支持,无需独立显卡 | 支持,8张显卡 | 支持,6张显卡 | 支持,57张显卡 |
模型内存要求:每个数据流4GB | 支持 | 支持,8张显卡 | 支持,6张显卡 | 支持,57张显卡 |
最大并发流时的最大训练延时:5 分钟 | 是 | 是 | 是 | 是 |
最大并发流时的最大推理延时:1 分钟 | 是 | 是 | 是 | 是 |
服务器数量:1 台 | 是 | 是 | 是 | 否 |
最大并发流时的高可靠性 | 是 | 是,但可能需要投入更多系统开发工作 | 是,但可能需要投入更多系统开发工作 | 是,但可能需要投入更多系统开发工作 |
低开发门槛,快速上市时间 | 是 | 设计总体系统架构和多块显卡间的资源共享机制极具挑战性 | 设计总体系统架构和多块显卡间的资源共享机制极具挑战性 | 设计总体系统架构和多块显卡间的资源共享机制极具挑战性 |
总体拥有成本 | 小于57000 元(人民币) | 高 | 高 | 高 |
表1:不同解决方案比较图
总体而言,该方案具备如下优势:
- 高性能:在最高并发量下,依然能够支持最高数据量达 3000 张图片的人工智能训练,最常训练时间仅为 4 分钟,最长推理时间不到 1 分钟10。
- 高经济性:与传统方案相比,该方案能够将服务器成本大幅降低,同时,该方案实现了边缘计算,节省了云端服务的相应成本,在长期的人工智能教学实践中具备显著的优势。
- 高稳定性:无需依赖互联网,在最高并发量下,依然能够保证稳定运行,降低由于网络拥堵等异常情况导致应用卡顿的可能性。
- 低开发难度:实现快速扩展应用,且无需安装复杂的AI相关开发工具,支持更快开发出面向教学的人工智能应用。
图8:蘑菇云人工智能教育方案在某学校的应用
AI为未来教育插上科技翅膀
除了人工智能教学之外,蘑菇云还致力于利用人工智能加速教育变革,发力教学内容智能化、教学互动化、教学任务自动化、学习环境自适应化、课程内容生成个性化、学习障碍判断自动化等场景,通过人工智能等新技术帮助教学内容智能化、优质教学内容在线化,能帮助提升教学效率、改善教育不公平性。
英特尔和蘑菇云将在人工智能+教育领域开展更加深入的合作,将创新的智慧化产品与技术赋能到教学环境之中,积极推动人工智能教育产品与服务的落地,助力人才的培养。
1 https://www.idc.com/getdoc.jsp?containerId=prCHC48196321
2数据援引自工业与信息化部人才交流中心发布的《人工智能产业人才发展报告(2019-2020 年版)》一文
3数据援引自拉勾招聘数据研究院发布的《2021人工智能人才报告》
4 http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm
5 人工智能教育如何进校园,中国教育报 http://www.moe.gov.cn/jyb_xwfb/moe_2082/zl_2018n/2018_zl36/201805/t20180521_336578.html
6 周邵锦, 王帆. K-12人工智能教育的逻辑思考:学生智慧生成之路——兼论K-12人工智能教材[J]. 现代教育技术, 2019, 29(04):13-19.
7 胡波. 人工智能教育对于培养中学生信息素养的作用[J]. 新课程(中), 2018, 000(008):98.
8 何玥玥、吕丽婷、陈嘉耕. 我国人工智能教育的发展现状分析与对策研究[J]. 教育探索, 2020, No.332(08):22-24.
9 测试配置:双路英特尔®至强®⾦牌5218R处理器(40核,80线程,2.1G),256GB总内存(DDR4 2666 RECC 16*16GB),960 GB DELL SATA 固态盘。
10 测试配置:双路英特尔®至强®⾦牌5218R处理器(40核,80线程,2.1G),256GB总内存(DDR4 2666 RECC 16*16GB),960 GB DELL SATA 固态盘。
实际性能受使用情况、配置和其他因素的差异影响。更多信息请见www.Intel.com/PerformanceIndex。
英特尔技术可能需要启用硬件、软件或激活服务。
具体成本和结果可能不同。
英特尔未做出任何明示和默示的保证,包括但不限于,关于适销性、适合特定目的及不侵权的默示保证,以及在履约过程、交易过程或贸易惯例中引起的任何保证。
没有任何产品或组件是绝对安全的。
英特尔并不控制或审计第三方数据。请您审查该内容,咨询其他来源,并确认提及数据是否准确。
©英特尔公司版权所有。英特尔、英特尔标识以及其他英特尔商标是英特尔公司或其子公司在美国和/或其他国家的商标。
文中涉及的其它名称及品牌属于各自所有者资产。