【公司观察】估值突破200亿元人民币 智谱AI完成新一轮融资

智谱AI于2024年9月5日完成了新一轮融资,融资金额达数十亿元人民币。本轮融资金额是在投前200亿元的估值基础上完成的,这使得智谱AI成为国内第一家突破200亿估值的大模型企业。

本轮融资的领投方是中关村科学城公司,这是海淀区政府设立的市场化投资平台。本轮融资金将主要用于支持智谱AI国产基座大模型的技术创新与生态发展。

智谱AI此前在2023年10月宣布累计获得超过25亿元融资,参与方包括社保基金、中关村自主创新基金、美团、蚂蚁、阿里、腾讯、小米等。

综上所述,智谱AI的最新融资情况显示其在大模型领域的技术创新和生态发展方面得到了进一步的支持,且其估值已经突破200亿人民币,成为国内大模型领域的领先企业。

融资特点

这次智谱AI的融资有几个显著的特点:

高估值:智谱AI以投前200亿元人民币的估值完成融资,成为国内第一家突破200亿估值的大模型企业。这一估值被认为是进入“百模大战”第一梯队的基准线。

国资领投:本轮融资金额达数十亿元人民币,由中关村科学城公司领投。中关村科学城公司是海淀区政府设立的市场化投资平台,这也标志着国有资本对智谱AI的高度认可和支持。

资金规模大:此次融资的金额相当可观,将用于支持智谱AI在多个方面的发展,包括技术创新、生态发展和商业化探索等。

战略意义强:智谱AI的融资不仅是为了资金支持,更是为了推动国产大模型技术的发展和生态建设。通过与北京市政府的合作,智谱AI将进一步落实产业战略,助力北京国际科技创新中心建设,加速迈向通用人工智能时代。

生态基金:智谱AI还设立了“Z计划”创业基金,总规模为10亿元人民币,用于投资更多的AI领域初创企业,这显示了智谱AI在推动整个AI生态系统发展方面的远见和承诺。总体来说,这次融资不仅是智谱AI发展历程中的一个重要里程碑,也反映了中国在大模型技术领域的重要进展和未来潜力。

智谱AI的独特优势

智谱AI的大模型技术与其他公司的区别主要体现在以下几个方面:

1、技术架构与研发路线

架构创新方面

智谱AI:研发了通用语言模型(GLM)预训练框架,将单向向后预测的模型框架与双向预测的模型框架能力加以结合,这种独特设计使模型能更好地理解文本上下文信息,在处理不同类型自然语言任务时更具优势。

其他公司:如OpenAI的GPT系列采用Transformer架构等常见的大模型架构,注重模型的通用性和可扩展性,在大规模数据上进行预训练,以适应多种自然语言处理任务。

研发路线差异

智谱AI:走的是“大模型+小模型”的技术路线,通过大模型的预训练和微调来适应不同场景和任务的需求。这种方式可以提高模型在特定领域的泛化能力和应用精度,但也会带来模型复杂度高、计算量大、训练时间长等问题。

其他公司:有的公司专注于通用大模型的研发,追求模型在广泛场景下的卓越性能和通用性,能够处理各种类型的自然语言任务;也有公司侧重于特定领域的模型研发,针对如医疗、金融等领域的专业数据进行训练和优化。

2、模型性能与功能特点

性能表现

参数规模与能力

智谱AI:拥有千亿级超大规模预训练模型GLM-130B等,在斯坦福大学基础模型研究中心对全球大模型的评定中,其准确性等关键指标与国际顶尖公司的大模型接近或持平,具有较强的语言理解和生成能力。

其他公司:像OpenAI的GPT-4等模型具有更大的参数规模和更强大的计算能力,在一些复杂的自然语言处理任务上表现出更高的性能和准确性。

推理速度与效率:不同公司的大模型在推理速度上有所差异。智谱AI不断进行算法优化和硬件适配来提高推理速度;部分公司则凭借强大的硬件基础设施和优化算法,在大规模并发请求下能够保持较快的响应速度。

上下文处理能力:智谱AI新推出的GLM-4-9B能够支持最高达1M(约两百万字)的上下文输入;其他公司的模型在上下文处理能力方面也各有特点,一些模型在处理长文本和复杂语境方面具有独特的优势。

功能特色

智谱AI:在多模态技术融合方面有一定成果,如CogVLM等多模态模型,通过在注意力和FFN层中引入可训练的视觉专家模块,实现了深度融合视觉语言特征,可应用于图像字幕生成、视觉问答、视觉定位等多模态任务。

其他公司:如阿里巴巴的通义大模型,在与众多国际科技公司的竞争中获胜,成为奥运首个AI大模型应用的技术提供方,在赛事解说、360度直播、视觉搜索等领域展现出应用优势。

3、数据与知识储备

数据来源与处理

智谱AI:使用大量的高质量多语言数据进行训练,对数据的收集、清洗和标注有严格的流程和技术,确保训练数据的质量,在中文处理方面具有一定优势,针对不同领域的数据进行了针对性的训练,以满足特定领域的应用需求。

其他公司:一些国际公司拥有全球范围内广泛的数据收集渠道,涵盖多种语言和领域的数据;国内公司也根据自身的业务和市场定位,收集和处理相关的行业数据和文本数据。

知识表示与利用

智谱AI:通过预训练模型学习到丰富的语言知识和语义表示,能够在问答、推理等任务中利用这些知识提供准确的答案和解决方案。

其他公司:不同公司的模型在知识表示和利用方式上有所不同,有的公司注重知识图谱的构建和融合,以增强模型的知识推理能力;有的公司则通过大规模的无监督学习从文本中自动提取知识。

4、应用场景与行业专注度

应用场景侧重

智谱AI:构建了从语言大模型、代码大模型、多模态模型到MaaS大模型开放平台的完整矩阵,为企业和开发者提供了灵活的应用选择,能够满足不同行业、不同场景下的多样化需求,在教育、科研、金融等领域都有应用案例。

其他公司:例如字节跳动的豆包大模型,为旗下的内容创作、智能客服等业务提供支持;百度的文心一言在智能搜索、智能写作、智能问答等方面发挥作用;科大讯飞的大模型则在语音识别和自然语言处理的结合应用上具有优势。

行业专注度

智谱AI:在特定行业的应用中表现出较高的专注度,通过对行业数据的深入挖掘和模型的优化,为行业用户提供更准确、个性化的解决方案,如在医疗领域辅助诊断、金融领域风险评估等方面。

其他公司:有些公司的大模型更侧重于通用场景的应用,为广大用户提供日常的语言处理服务和智能助手功能;而一些垂直领域的公司则专注于特定行业的深度应用,如医疗领域的医疗影像分析、药物研发等。

5、开源与生态建设

开源策略

智谱AI:较早地在GitHub上开源了GLM-130B等模型,为开发者提供了免费的技术支持和资源,吸引了大量开发者参与到模型的改进和应用开发中,促进了技术的交流和创新,推动了大模型技术的普及和发展。

其他公司:部分公司也会开源自己的模型,如特斯拉CEO埃隆·马斯克旗下的人工智能初创公司XAI开源大模型Grok-1;而有些公司则对模型代码和技术保持相对封闭,以保护其商业利益和技术优势。

生态建设

智谱AI:围绕开源模型建立了活跃的开发者社区,为开发者提供技术支持、答疑解惑,鼓励开发者分享经验和成果,形成了良好的技术生态。同时,通过与高校、科研机构的合作,推动大模型技术的研究和应用创新。

其他公司:一些大型科技公司通过建立开发者平台、提供丰富的API和工具,吸引开发者和合作伙伴构建基于其大模型的应用生态系统,促进大模型技术在各个行业的广泛应用。

后续发展计划

智谱AI在完成最新一轮融资后,制定了详细的发展计划,主要包括以下几个方面:

技术创新:智谱AI将继续投入大量资源用于国产基座大模型的技术创新。公司将致力于提升大模型的性能,特别是在中文能力方面,目标是使其达到国际领先水平。

生态发展:新一轮融资的资金还将用于推动大模型生态的发展。智谱AI计划与更多的产业龙头企业合作,共同打造一个繁荣的大模型生态系统,涵盖金融、能源、制造等多个行业。

商业化探索:智谱AI将继续推进其大模型的商业化进程。公司已经推出了一些商业化产品,如智谱清言和高效率代码模型CodeGeeX等平台,未来还将探索更多应用场景,以实现更大的商业价值。

创业基金:智谱AI还设立了“Z计划”创业基金,总规模为10亿元人民币,用于投资更多的AI领域初创企业。截至目前,智谱AI已经链接了超过1200个大模型初创项目,并进行了多项投资。

合作与赋能:智谱AI将与北京市政府合作,共同落实产业战略,助力北京国际科技创新中心建设,推动大模型技术在各个行业的应用,加速迈向通用人工智能时代。通过这些发展计划,智谱AI希望进一步提升其在大模型领域的竞争力,推动技术创新和商业化进程,同时促进整个大模型生态系统的繁荣发展。