基于昇腾AI的“紫东太初”大模型获中国算力大会大奖

7月29-31日,首届中国算力大会在济南举行。大会现场,基于昇腾AI基础软硬件平台、由中国科学院自动化研究所联合华为打造的“紫东太初”人工智能基础大模型荣获“DC Tech创新先锋”优秀成果。

图片1
“紫东太初”人工智能基础大模型荣获“算力平台”先锋案例

2022中国算力大会是我国算力领域首个全国性会议,作为大会发布的重要奖项,“创新先锋”优秀成果评选旨在从设备技术、软硬件系统、成果应用、能效水平、赋能情况、流程优化等多个方面优中选优,充分发挥典型标杆的示范引领作用。

“紫东太初”是全球首个三模态大模型,开拓性实现了图像、文本、语音三个模态数据之间的“统一表示”与“相互生成”,理解和生成能力更接近人类,向通用人工智能迈出了重要一步。紫东太初作为多模态大模型代表作,正在全力助推AI研发规则和产业应用模式变革,加速各行业智能化转型实践。

当下,多模态大模型受产学研用多方关注,原因在于人工智能产业高速发展带来全新研究、应用需求。目前,网络数据90%以上为图像与视频,音频数据也保持高增长,但当下用于预训练的模型大多是以文本、图像为主的单模态或双模态,只能涵盖互联网一小部分数据,不仅与人类多模态交互能力差别很大,也无法充分发挥数据的生产要素作用,限制了下一阶段人工智能应用创新。

因此,推动预训练模型从单模态向多模态方向发展,打通图像、文字、语音壁垒,进而使AI应用更贴合人类行为习惯与现实需求,成为当前人工智能行业攻坚点之一。

中科院自动化所以昇腾AI平台为基础,基于武汉人工智能计算中心算力,研发面向超大规模的高效分布式训练框架,在图、文、音三个基础模型上加入跨模态编码和解码网络,基于昇思MindSpore AI框架,打造了全球首个千亿参数三模态大模型“紫东.太初”,性能领跑业界,可以灵活支撑图、文、音全场景AI应用,更加接近人类真正的感情和思考,灵活性更高,通用性更强。基于紫东太初打造的虚拟人“小初”,具备视频生成、视频描述、图像生成、智能问答、语音识别等多个功能,甚至能在纺织生产线上通过声音就能“听”出纱线断头的质检缺陷。

去年底,国内首个多模态人工智能产业联盟成立,吸引了新华社技术局、长安汽车、中国移动、千博手语等30余个成员单位加盟,通过开源的多模态大模型快速进行自身业务AI融合创新,基于“紫东太初” 陆续孵化出新媒体内容检索平台、智能座舱、南宋御街数字人、手语教考一体机等场景化行业应用,充分展现了人工智能大模型的产业价值。

从“紫东太初”大模型的研发,到产业联盟的组建,AI研发规则和产业应用模式迎来深刻变革,昇腾AI正在加速推动AI产业化和产业AI化,助力中国人工智能抢占智能时代新高地。