公有云大模型调用量达114.2万亿Tokens,谁在主导市场?

 导读


在当今数字化与智能化飞速发展的时代,大模型与生成式AI市场正以前所未有的态势迅猛演进。国际数据公司(IDC)发布的《中国公有云大模型服务市场格局分析,1Q25》报告显示,2024年中国公有云上大模型调用量达114.2万亿Tokens(不包含出海群体使用的MaaS平台的调用量,也不包含各大模型APP上的调用量),这一数据直观地反映出市场对大模型调用的强劲需求,也预示着云计算提供大模型调用服务市场已然进入一个全新的发展阶段。

文字编辑|李祥敬

1

云计算大模型调用服务市场现状

从市场份额分布来看,当前呈现出“一超多强”的格局。火山引擎以46.4%的市场份额位居首位,百度智能云、阿里云紧随其后,而腾讯云、中国移动、天翼云等公有云厂商整体占据15%的市场份额。从大模型模态角度出发,目前大语言模型、文本类能力的调用量占主导地位。不过自2024年第四季度起,语音类模型调用量已开始呈现增长态势,预计在2025年,图像、视频类大模型的调用量也将逐步兴起,这表明市场对于大模型的应用需求正朝着多元化方向发展。自2024年下半年开始,随着云厂商大模型能力的快速提升以及模型调用降价策略的实施,MaaS平台大模型调用量开始迅速增长。调用量从2024年中期的月度日均963亿Tokens,急剧发展到2024年12月整体市场调用量日均达到9522亿Tokens,进入2025年,在DeepSeek以及Manus类产品的影响下,大模型日均调用量继续保持高速增长的趋势。

2

企业通过公有云进行大模型调用的优势

相较于私有部署,企业选择通过公有云进行大模型调用具有诸多显著优势。在成本方面,公有云凭借技术红利和规模效应,为企业带来了巨大的成本优势。例如阿里云,其基于自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建了极致弹性的AI算力调度系统,并结合百炼分布式推理加速引擎,大幅压缩了模型推理成本。企业无需自行投入大量资金购置硬件设备以及搭建复杂的软件系统,只需按需付费使用公有云上的大模型服务,便能获得强大的计算能力,这对于中小企业来说,极大地降低了技术应用门槛和前期投入成本。在数据安全与隔离方面,公有云能够为企业提供有力保障。以阿里云为例,可为每个企业提供专属VPC环境,实现计算隔离、存储隔离、网络隔离以及数据加密,充分确保数据安全,并且阿里云已主导或深度参与10多项大模型安全相关国际国内技术标准的制定。企业将数据交由这样的公有云平台处理,在享受大模型服务的同时,无需过度担忧数据泄露等安全问题。此外,公有云厂商具有天然的开放性,能为企业提供丰富多样的模型和完善的工具链。阿里云百炼平台上汇聚了通义、百川、ChatGLM、Llama系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,企业开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建RAG等应用,从选模型、调模型、搭应用到对外服务,一站式即可搞定,大大提高了企业开发和应用大模型的效率。

3

公有云上大模型调用量对评估企业格局的参考价值

公有云上大模型调用量是评估大模型市场企业格局的关键参考指标之一。调用量在很大程度上反映了企业所提供大模型服务的受欢迎程度与市场认可度。火山引擎之所以能占据46.4%的市场份额,正是因为其大模型服务获得了众多企业的青睐,大量企业频繁调用其服务,足以证明其在模型性能、价格、易用性等方面具有突出优势。通过分析不同企业在各类大模型模态上的调用量占比,能够洞察企业在不同技术领域的优势与发展潜力。如果某企业在图像类大模型调用量方面占据较大份额,说明该企业在图像识别、处理等相关技术和应用场景方面具有较强的实力和深入的布局。而且,大模型调用量的变化趋势也能反映企业的市场竞争力变化。当某企业的大模型调用量持续增长,表明其在不断优化服务、拓展客户群体,市场竞争力日益增强;反之,若调用量出现下滑,则可能意味着企业在某些方面需要改进,以适应市场的动态变化。IDC中国研究总监卢言霞指出,在大模型开源开放浪潮不断高涨、模型选择丰富而又复杂的当下,高性价比、灵活易用、开发工具链完善、安全可信的大模型服务平台对于企业快速上手并落地大模型至关重要。

4

火山引擎在大模型方面的优势

火山引擎作为字节跳动旗下云和AI服务平台,在大模型方面展现出了独特而显著的优势。在模型自身实力上,其搭载的豆包大模型包含大语言模型、语音大模型、视觉大模型等丰富的垂类模型,适配企业多种业务场景。通过字节内部50多个业务场景实践验证,每日数万亿Tokens大使用量持续打磨,并且在智源等权威机构测评结果中,豆包大模型最新模型效果国内领先;在知识、代码、推理、中文等多个国际权威测评基准上的自主测评中,也获得最佳成绩,这充分证明了其模型的高质量和强大性能。火山引擎为企业提供从底层算力到上层应用的全栈AI服务。除了提供豆包大模型全模态模型家族,在平台方面,火山方舟能够对豆包大模型、Deepseek-V3、DeepSeek-R1等34个大模型进行调用,提供模型精调、推理、评测等全方位功能与服务,并通过HiAgent、扣子等AI应用开发平台,支持企业灵活开发行业垂直智能体应用。在基础设施层面,2024冬季FORCE原动力大会上,火山引擎正式提出计算范式将从云原生进入到AI云原生的新时代,并为客户提供以GPU为核心的AI云原生基础设施。火山引擎提供以AI云原生为理念的云基础设施服务,包括新一代的火山引擎GPU实例、vRDMA网络连接、EIC弹性极速缓存、PCC私密云服务等。在性能方面,丰富机型支持不同版本的模型部署,提供高速互联带宽,全栈系统化推理优化,具备模型调优和一站式定制能力;性价比上,得益于与字节跳动国内业务并池的规模优势,可实现同款配置价格最优;稳定性强,观测全面、检测手段丰富、修复效率高;安全性好,自研防火墙可提升算力可用性、降低数据泄露风险、减少回复不准确情况、保障内容合规,为企业提供了坚实可靠的运行环境。在服务支持方面,火山引擎始终坚持定制化服务方案,架构师1V1量身定制契合业务需求的高性价比服务方案;提供7乘24小时全天候人工客服,多渠道覆盖支持客户各种类型的业务诉求,飞书值班号提供快捷、全面的响应支持;甄选100%通过火山引擎技术考核的服务工程师,做到技术有支持,服务有温度,问题有响应,落地有闭环,为企业客户提供了全方位、贴心的服务保障。面对AI应用的快速爆发,火山引擎近日宣布,将大模型应用开源,正式上线“大模型应用实验室”平台,开源手机助手、DeepResearch等众多高频AI应用,以“易集成、易落地、更开放”的方式帮助千行百业快速落地AI应用。

5

未来云端大模型服务调用的发展趋势

未来,云端大模型服务调用将朝着更加多元化、智能化和安全化的方向发展。随着技术的不断进步,大模型模态将进一步丰富,除了当前的语言、语音、图像、视频类模型外,可能会涌现出更多融合多种模态的综合性模型,以满足企业更加复杂和多样化的业务需求。例如,腾讯云推出的视频创作引擎已支持复杂舞蹈编排算法,而天翼云在政务领域部署的DeepSeek-R1大模型也展示了多模态能力的实际应用。在应用场景方面,大模型将更加深入地渗透到各个行业的细分领域,如医疗领域的智能诊断、教育领域的个性化学习辅导、金融领域的风险精准评估等,为行业带来更具针对性和高效的解决方案。IDC调研显示,8成企业计划在未来18个月内引入更多生成式AI,预计研发和技术用例的支出增长将更为明显。随着市场竞争的加剧,云厂商将不断优化模型性能、降低调用成本,以提高自身的市场竞争力。这将使得更多中小企业能够以更低的成本享受到高质量的大模型服务,从而进一步推动大模型在企业级市场的普及和应用。例如,阿里云的百炼平台推出的Qwen-Max模型直降88%,而火山引擎的豆包大模型价格仅为行业平均的0.8%,显著降低了企业的使用门槛。安全与隐私保护将始终是未来发展的重中之重。随着数据安全相关法律法规的不断完善以及企业对数据安全重视程度的不断提高,云厂商将投入更多资源用于研发先进的安全技术和措施,确保企业在使用大模型服务过程中的数据安全和隐私保护,例如采用更高级的数据加密技术、强化访问控制机制等。腾讯云的星脉高性能计算网络和天翼云的“息壤”智算平台,均在安全合规方面进行了深度布局。

结语

云计算大模型调用服务市场正处在高速发展的关键时期。从当下的市场格局到企业在公有云调用大模型的优势,从调用量对评估企业格局的重要意义到火山引擎等头部厂商的独特优势,再到未来多元化、智能化与安全化的发展趋势,这一系列的变化与发展不仅勾勒出行业的动态轮廓,也为企业与投资者提供了丰富的思考方向。随着技术的持续革新、市场的不断成熟,云计算大模型调用服务有望在更多领域发挥更大价值,助力企业在数字化与智能化浪潮中实现创新突破,我们也将持续关注这一领域,为大家带来最新的行业洞察与分析。