导读
1月15日,科大讯飞正式推出了讯飞星火X1,这是目前全国产算力平台上独一无二的深度推理大模型,并已率先在教育、医疗等关键需求领域实现了应用。

与此同时,讯飞星火4.0 Turbo的底座能力也迎来了全面升级,其图文处理、数学运算以及长文本理解能力均得到了显著提升。
此外,科大讯飞还首次推出了混域知识搜索技术,旨在更有效地解决行业与企业的痛点问题。作为国内智能翻译领域的领航者,科大讯飞还推出了星火语音同传大模型,这是业界首个具备端到端语音到语音同声传译能力的大模型,其语音同传的时延最短可达5秒以内。
文字编辑| 宋雨涵
1
底座能力全新升级,变得更懂行业
七大能力全面提升
在此次发布会上,讯飞星火4.0 Turbo的底座能力迎来了全面革新,七大核心功能均实现了显著提升,并与OpenAI最新推出的GPT-4进行了全面对标。升级的核心亮点在于针对行业与企业面临的实际难题,特别是在数学运算、行业知识掌握、图文识别处理、长文本理解等方面进行了深度优化。
得益于讯飞星火X1提供的高质量合成数据,讯飞星火4.0 Turbo的数学运算能力显著增强,能够在数学教育、金融分析及科研推演等多个领域为用户提供更精准的辅助。图文识别能力作为企业高效处理行业及私域数据的基础,在此次升级中也得到了大幅提升。针对医疗体检报告、法律文书、学术论文、企业合同等复杂文档,以及含有复杂表格、杂乱排版、手写公式、手写合同等特殊情况的文档,讯飞星火4.0 Turbo的图文识别能力实现了通用文档版面分析和文字识别准确率的40%提升,复杂表格结构和潦草手写文字识别准确率更是提升了60%,极大地提高了高价值数据的获取效率。对比测试结果显示,讯飞星火4.0 Turbo的图文识别性能远超国内外同类产品。
此外,升级后的讯飞星火4.0 Turbo还增强了文档要素检测能力,知识切分和构建的粒度更加精细,有效防止了大模型幻觉的发生。同时,推出的扫描文档解析极速版,使文档理解速度提升了10倍以上,处理一份500页的项目文件,从扫描、识别到解析的全过程仅需2分钟。
长文本处理能力一直是用户关注的焦点,特别是在企业知识问答等严谨应用场景中。为此,讯飞星火推出了基于智能体的全新长文本处理框架,并首次在行业内实现了句子级溯源功能。该框架优化了超长注意力机制,利用大规模网页和书籍数据进行知识关联合成,使知识回复的错误率降低了40%,句子级溯源效果甚至超越了GPT-4,有效解决了大模型幻觉导致的反复溯源确认问题。
考虑到用户在撰写报告、进行调研等工作中需要大量搜集信息和整理资料,讯飞星火结合图文、长文本处理能力的提升以及行业应用经验,率先推出了混域知识搜索技术。该技术能够整合个人知识、企业知识、业务系统数据、精品行业数据及互联网信息,实现综合搜索,用户只需一次提问即可获得全面搜索结果,极大提升了信息搜索效率。
2
唯一全国产算力训练
全国产算力,勇闯无人区
讯飞星火推出的深度推理模型X1,作为昇腾算力体系的首款原生深度推理模型,其诞生历程充满了挑战与创新。技术团队在利用国产算力进行模型训练时,面临了数据构建、框架优化、模型验证等一系列复杂难题,这些难题使得团队不得不投入额外的时间与精力。在这一过程中,团队缺乏成功案例的指引,只能依靠自身的努力,逐步攻克每一个难关,最终成功实现了技术突破。
经过不懈努力,讯飞星火的算法不仅成功适配了国产算力,而且在算力消耗更少的情况下,达到了业界领先水平,推出了能够与国际顶尖模型相媲美的X1模型。这一成就不仅彰显了团队的技术实力,也为中国在深度推理模型领域的发展贡献了重要力量。
回顾星火大模型的发展历程,团队始终坚定地走全国产化路线。在与华为的合作中,双方秉持着“勇闯无人区”的精神,不断突破全国产算力和大模型的技术上限,致力于为世界提供另一种可靠的选择。这一过程中,讯飞星火与华为携手共进,共同推动了中国在人工智能领域的发展与进步。
3
华为昇腾:国产算力王者
昇腾(Ascend)则是华为在AI芯片领域的杰作。作为华为AI计算产业的重要组成部分,昇腾系列AI芯片旨在提供高效、安全、智能的算力服务,以满足不同行业对AI算力的需求。
昇腾系列AI芯片采用了先进的芯片设计和优化技术,使得其计算性能和能效比均处于行业领先地位。同时,昇腾还支持分布式计算和并行处理,能够高效地处理大规模的人工智能任务。在安全性方面,昇腾系列AI芯片采用了严格的安全设计,确保用户数据和业务系统的安全。
昇腾的应用场景同样广泛。在智能制造领域,昇腾可以帮助企业实现自动化生产、工艺优化、质量检测等智能化应用。在智慧城市领域,昇腾可以助力政府实现智能化管理和服务,提升城市治理效率。在医疗健康领域,昇腾可以辅助医生进行精准的诊断和治疗,提高医疗服务水平。此外,昇腾还在教育、科研、交通等多个领域发挥着重要作用。
华为昇腾软件生态
华为昇腾不仅提供硬件产品,还围绕这些硬件构建了完整的软件生态。
异构计算架构CANN:类似于英伟达CUDA的架构,负责调度分配计算到对应的硬件上,提高硬件性能的利用率。2024年华为全联接大会上,全新发布的CANN 8.0版本新增了200多个深度优化的基础算子、80多个融合算子以及100多个通信、矩阵运算等API,极大地加速了原生创新进程。
AI计算框架昇思MindSpore):华为自主研发的深度学习框架,支持云、边、端灵活部署,全场景覆盖,已成为国产框架市占率第一。
全流程开发工具链MindStudio:为开发者提供简单易用的开发工具,支持从算子开发、模型训练、模型推理到应用开发的全流程,降低开发门槛。
相关阅读推荐:
华为又一大动作!昇思人工智能框架峰会:开源4年份额达30%,成为发展最快AI框架
结语
科大讯飞推出的讯飞星火X1深度推理大模型,以其全国产算力平台上的独特地位,以及在教育、医疗等关键领域的成功应用,展现了其在AI领域的深厚实力。同时,讯飞星火4.0 Turbo底座能力的全面升级,以及混域知识搜索技术的推出,进一步提升了其在行业应用中的竞争力。
而华为昇腾作为国产算力王者,其高效的计算性能和广泛的应用场景,为AI产业的快速发展提供了有力支撑。展望未来,讯飞与华为将继续携手共进,共同推动中国人工智能领域的发展,为世界提供更多可靠的选择。