智能引擎:阿里通义大模型驱动产业重塑与未来创新

2024年是AI应用爆发的极不平凡的一年。大模型的极速迭代和推理效率突破,正在以前所未有的速度赋能各行各业应用。可以说,大模型已成为推动产业智能化的核心引擎。4月9日,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在“AI势能大会”上指出:“社会的方方面面被AI渗透、被AI影响,未来AI还将和更多产业有机融合,爆发出更多崭新的商业模式和生产路径。”

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光

阿里云通义大模型,正凭借其技术领先性和行业赋能能力重塑产业边界。

自2023年发布以来,通义大模型已覆盖超过20个行业,服务数百万用户,其技术进展和行业应用成果显著。通过持续优化推理能力和多模态融合能力,通义大模型已成为全球最大的开源模型家族之一,为社会和企业带来深远价值。

技术引擎:推理与多模态的双核驱动

阿里云通义大模型的技术优势体现在其强大的推理能力和多模态融合能力。

阿里云通义大模型业务总经理徐栋强调:“通义千问在推理和多模态方向的突破,为客户提供了更高效、更精准的解决方案。”通过强化学习和思维链能力的提升,通义大模型能够快速响应复杂问题,同时优化资源使用效率。

在推理能力方面,通义大模型通过强化学习进一步提升了模型的泛化能力。例如,模型能够将复杂任务拆解为多个子任务,从而在跨领域应用中表现更加出色。这种能力特别适用于风险控制、智能客服等场景。此外,通义大模型具备任务规划和工具调度能力,能够根据任务需求自动调用第三方工具,如搜索引擎或天气查询,从而完成更复杂的任务。这种工具调用能力不仅提升了模型的灵活性,还显著降低了开发成本。

多模态融合是通义大模型的另一大技术亮点。通过整合音频、视频、文字等多种模态,通义大模型能够实现更自然的人机交互。例如,其视觉语言模型千问VL在权威评测中表现出色,能够精准识别复杂场景中的物体,并返回坐标信息。此外,通义大模型Omni 7B能够实时处理多种输入,并生成自然语言输出,为复杂场景提供了强大的技术支持。

工程化优化进一步提升了通义大模型的性能。通过分布式推理调度引擎和流量感知技术,通义大模型显著降低了推理延迟,提升了资源利用率。例如,其首Token延迟下降92%,Token生成时间降低15%,为企业级应用提供了高效稳定的基础设施支持。

应用赋能:从智驾到零售的多维行业实践

地平线、蔚来、美高域(上海)、叮咚买菜等企业在“AI势能大会”上也介绍了与通义大模型的合作所展现出的强大的技术赋能能力。

作为国内量产规模最大的智驾科技公司,地平线的研发数据规模已达到数千PB。为满足海量数据的处理需求,地平线基于阿里云EMR、OSS等技术打造仓一体架构,构建了“数据流入-存储-挖掘”全链路,此举使得地平线将仿真测试调度时间从分钟级缩短至秒级,不仅大幅节省成本,智算集群整体故障恢复时间也降低40%以上。

地平线创始人兼CEO余凯

地平线创始人兼CEO余凯表示,阿里云弹性、稳定、灵活的强大算力,有力支持了地平线在软件、算法等领域的持续创新,为智驾模型的快速落地和首款量产合作车型的交付提供了坚实保障。

在智驾领域,大模型的能力越来越重要。阿里云大模型以其丰富的知识和安全、隐私的出色保护能力,成为蔚来的首选合作伙伴。在研发侧,蔚来引入阿里云灵脑深入合作,从只是简单、单独针对某一些问题逐步大规模生成复杂的工程,甚至对一些BUG也尝试结合AI的辅助进行调试。

蔚来座舱AI多模态负责人吴楠

“通义大模型推动了NOMI语音助手的全面Agent化,实现了从听得懂到主动服务的跨越。”蔚来座舱AI多模态负责人吴楠指出,通过多模态交互能力,NOMI不仅能理解用户语音指令,还能结合驾驶场景主动提供服务,如自动调节温度、规划最佳路线,显著提升了用户体验和驾驶安全性,彰显大模型在支持语言和驾驶相结合在安全与成本方面取得的效果。

同样是粤语,在广东和香港也有着很大的不同。通义大模型提供了粤语医疗场景的精准解决方案,帮助美高域(上海)科技开发提供了实时转录、翻译和病历自动生成服务,解决了粤语医疗场景中的语言和数据集难题,显著降低了医生与患者的沟通障碍。

美高域(上海)科技开发副总经理、CTO孟文静

美高域副总经理孟文静介绍说,多模态数据还自动化地将医疗音视频和文本转化为结构化的数据,试点应用超过覆盖100家诊所,同时还为每个病人建立了自己的知识库,以多模态问答的能力解决病人的档案管理。与阿里云的合作不仅限于AI应用,阿里云的生态也有效地支持了美高域。孟文静回忆说,某次在内地一家国际医院去落地医疗影像识别的场景,但此前美高域在该领域的业务积累不够,而阿里云推荐的一个合作伙伴,当即化解了所有的挑战。

叮咚买菜通过通义千问大模型在供应链、消费者和内部运营三方面的应用,实现了全链路智能化升级。

叮咚买菜CTO蒋旭

据叮咚买菜CTO蒋旭介绍,在供应链端,利用多模态感知技术确保食品从种植到配送的全流程真实性与一致性;在消费者端,“叮小咚”AI助手提供了个性化食谱推荐和健康饮食建议,用户活跃度提升25%。在内部运营中,通过大模型管理骑手签到着装、优化客服、定价和用户调研等环节,提升效率与用户体验,同时降低管理成本。这种数据驱动的智能协同,让叮咚买菜在生鲜电商领域持续保持领先。

生态构建:繁花计划与MCP协议的开放创新

通过“繁花计划”和MCP协议,阿里云正在积极构建开放的AI生态系统。

“繁花计划”通过提供云上资源和算力支持,帮助生态合作伙伴实现从首客拓展到规模化的目标。未来三年,阿里云将在基础设施,模型,数据,工具,应用,交付六大领域与生态伙伴一起服务百万云上客户,拓展百亿商机,共同打造中国繁荣的AI生态。

阿里云还推出了AI应用与服务市场,提供了丰富的AI应用及服务,解决企业在通用及细分领域的需求,加速企业AI业务落地。目前正推动阿里巴巴旗下所有服务首先走向AI Agent,吸引更多的人开发发布有特点、可以被观众广泛接纳新型的AI Agent。

作为当今公认的业界标准,MCP进一步降低了大模型与外部系统的集成门槛,有望加速AI应用爆发的最后一公里的连接。

阿里云在百炼平台上全面支持MCP服务,提供了从云端服务到本地服务的多种部署方式。通过MCP协议,企业能够快速实现AI应用的落地,加速产业智能化进程。例如,库迪咖啡通过MCP协议实现了万家店铺的智能巡检,质检准确率提升95%,显著提升了运营效率。

阿里云无影云电脑通过MCP协议支持的AgentBay服务,突破了本地算力限制,为开发者提供了动态算力资源。阿里云无影事业部总裁张献涛表示:“无影AgentBay将云电脑变成了AI生产力的‘变压器’,让开发者能够按需调用算力资源。”

通义大模型的开源策略不仅促进了技术共享,还吸引了大量开发者和企业的参与。迄今为止,阿里云开源模型总量达到超过200款,在开源社区衍生千问模型已经突破10万。刘伟光相信,开源开放是加速AI普及和规模化应用的关键。

未来展望:智能新纪元的挑战与机遇

在刘伟光看来,2025年将是AI应用爆发的元年,AI Agent将成为智能化的核心载体。

展望未来,大模型的应用价值将进一步释放。

阿里云通义大模型业务总经理徐栋

面对技术迭代和行业需求的挑战,阿里云展现了坚定的信心。“通义大模型将继续在推理能力和多模态融合方向发力,推动AI技术的深度应用。”徐栋相信,通过强化学习和模型工程优化,阿里云将不断提升通义大模型的性能和效率。

毫无疑问,阿里云的全栈技术创新和开源开放策略,将为AI生态的繁荣提供持续动力,助力社会迈向智能化新时代。