促进行业标准化进程 华为云发布预训练大模型白皮书

11月7日,华为全联接大会(HUAWEI CONNECT)2022中国站在深圳拉开帷幕。在“华为云AI持续创新,加速AI应用走深向实”分论坛上,华为云发布《预训练大模型白皮书》,博瀚智能(深圳)有限公司CEO郭玮、华为云EI服务产品部部长尤鹏、华为云人工智能领域首席科学家、IEEE Fellow、国际欧亚科学院院士田奇共同出席发布仪式。

由田奇带领的华为云盘古大模型研发团队认为,大模型将成为未来AI计算的“操作系统”,可以向下管理AI硬件、向上支撑AI算法,使得AI开发更加规范化、可复制。尤鹏表示,华为云希望通过编写《预训练大模型白皮书》,将团队在研究和实践中的经验固化下来,帮助更多AI从业人员快速掌握AI技能,持续创造商业价值。

华为云发布《预训练大模型白皮书》

人工智能算法落地面临碎片化困境。当前业界大部分人工智能开发者普遍沿用传统的“小作坊模式”进行应用开发,即针对每个场景,独立地完成模型选择、数据处理、模型优化、模型迭代等一系列开发环节。由于无法积累通用知识,而且不同领域的数据差异巨大、微调技巧也有所不同,导致开发效率比较低。

为了解决上述困境,预训练大模型相关研究和应用呈井喷态势。预训练大模型在大量图像、文本等数据的基础上,利用无监督或者自监督学习方法将数据中蕴含的知识提取出来,存储在具有大量参数的神经网络模型中。遇到特定任务时,只需调用规范化的流程,就能释放预训练大模型的能力,并且与行业经验结合,解决实际业务问题。

华为云盘古大模型于2021年4月正式发布,到2022年聚焦行业应用落地,已经发展出包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶段的成熟体系。在华为全联接大会2022中国站上,华为云进一步迭代盘古大模型的技术能力,扩展盘古大模型的服务范围,发布盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项重磅服务。

华为云盘古气象大模型,为行业数字化插上AI气象分析的翅膀

极端天气会带来巨大的生命和财产损失。华为云盘古气象大模型能够秒级预测未来7天全球天气情况,相比传统预报算法,速度提升1000倍、精度提升20%。今年8月,盘古气象大模型预测台风“马鞍”的轨迹和登陆时间,准确率达90%,远超行业平均水平。在海外,华为云为印尼打造了“国家海洋人工智能平台”,助力预测海洋灾害,保障航行安全。此外,华为云AI for Meteorology还可以用于农业、航空、航天等领域。

华为云盘古矿山大模型,让AI推动矿山安全高效作业,沉淀专家经验

为了解决AI在煤矿行业落地难、门槛高等问题,华为云打造了全栈性能领先的盘古矿山大模型。只需导入海量无标注的矿山场景数据进行预训练,盘古矿山大模型即可进行无监督自主学习,仅一个大模型就能覆盖煤矿的采、掘、机、运、通等业务流程下的1000多个细分场景,让AI应用在煤矿普及更容易。

在主运场景中,基于盘古矿山大模型的AI主运智能监测系统能够精准识别大块煤、锚杆等异常情况,异物识别准确率达98%。此外,相较于人工巡检,盘古矿山大模型实现了全时段巡检,帮助工作人员及时地发现问题,避免因漏检造成的安全事故,缩短停机时间,同时提升井下巡检人员的工作效率。

在掘进场景中,基于盘古矿山大模型的掘进作业序列智能监测,动作规范识别准确率超过95%,用规范的AI流程来替代不确定的人工流程,让AI成为矿工规范作业的好帮手,保障井下作业安全。

一个矿山大模型覆盖多个业务场景,加速AI落地进程

华为云盘古OCR大模型,一个模型覆盖通用文字识别场景

OCR技术是人工智能的基础之一,能够对结构多变、种类多样、来源丰富的非结构化数据进行识别与提取。传统的OCR厂商通常从特定的应用切入,陆续发展出卡证识别、票据识别、文档识别、表格识别、车牌识别、智能扫码等一系列细分OCR能力,通过组合的方式服务于各个行业。行业中每产生一个的新的识别场景,都需要在标注后才能训练一个新的模型。这使得OCR服务的开发、维护成本居高不下。

华为云发布盘古OCR大模型,通过独有的对比学习与掩膜图像建模相融合的自监督学习方法,学习并充分利用大规模的无标签数据,实现一个模型覆盖多个领域的全部通用文字识别场景,并将标注工作量降低90%。此外,盘古OCR大模型在11项经典数据集测试中取得显著的精度提升,而且与原本领先的文字识别算法相比,盘古OCR大模型的精度平均提升5%以上。

日前,华为云盘古预训练大模型通过了中国信息通信研究院首轮大模型测评,在“模型开发”和“模型能力”两部分达到当前最高标准(4+级),并在计算机视觉、自然语言处理、科学计算等领域为业界贡献了覆盖百余个业务场景的先进算法和解决方案。

未来,华为云将持续夯实盘古预训练大模型的能力,将AI技术以及行业落地经验云化、服务化,让企业创新触手可及。