让天下没有难做的AIGC

因为AIGC模型训练消耗大量算力资源,为此百模大战就演变为了一场算力争夺大战。

不仅如此,模型训练还只是第一步,AIGC要落地,特别是在行业企业市场落地,就必须结合行业数据,但是令人尴尬的是:麻秆打狼两头怕,模型厂商担心训练好的模型参数泄露,而行业用户则担心数据资产泄露,互不信任,这也让AIGC企业级市场应用举步维艰。

AIGC行业企业级市场应用如何破局?

在1月4日举办的金山云“云+人工智能·时代新机遇”媒体沟通会上,金山云副总裁钱一峰、金山云公有云产品中心负责人孙晓、金山云人工智能与大数据产品中心负责人徐寅斐给出了金山云的方案。

金山云副总裁钱一峰

据钱一峰介绍,围绕核心计算、存储、网络等产品,金山云顺应趋势,深入探索前沿技术,从多个维度为人工智能提供支持。其中在计算方面,金山云推出第七代云服务器X7,搭载第四代英特尔至强可扩展处理器、支持AMX原生加速能力,CPU性能较上代最高提升60%,内存升级至DDR5,频率较上一代性能提升50%。在网络方面,金山云推出了ALB(Application Load Balancer,应用型负载均衡),单实例最大可支持100万QPS,针对云原生场景融合,金山云采用Ingress部署技术,实现了将金山云容器服务KCE、或用户自建K8S集群、ALB等Kubernetes 集群内服务对外部访问接入的暴露。此外,在存储方面,金山云根据数据从极热到极冷的不同热度,构建了不同性能类型的对象存储产品,其中对象存储KS3极速型最高可提供1Tbps/PB的兑付带宽,可为AIGC、存算分离和高性能计算等场景提供支撑。

“金山云为客户提供灵活的混合云部署,并提供可持续性服务,这让金山云更受欢迎。目前,已签约及洽谈商机的人工智能客户达数十家。” 钱一峰说。

公开数据显示,如今国内大模型数量已经超过200个,但真正被调用的大模型却相对较少,能够针对企业级市场(ToB)服务的更是寥寥无几。

基于行业需求,金山云在2023年6月推出MaaS互信推理专区方案(MaaS 1.0),通过在大模型厂商、用户和金山云之间建立互信,解决了模型及数据的互信问题。在本次沟通会上,金山云发布了MaaS互信推理专区方案2.0,在MaaS 1.0基础上,MaaS 2.0以金山云IaaS和PaaS为底座,实现云上LangChain的一键部署,这是一个开源框架,默认对接多个生态合作商业或开源大模型。

MaaS互信推理2.0 技术实现

据孙晓介绍,为了促进模型和数据的融合,在技术上MaaS 2.0提供了BGE、Bert等Embedding模型支持,无缝对接金山云Milvus全托管向量数据库,借助标准化API接口和Web前端界面,通过支持RAG(Retrieval Augmented Generation,检索增强生成)技术,实现了包括模型推理和知识库搭建的RAG大模型场景应用。此外,为进一步增强安全性,MaaS 2.0依托金山云裸金属服务,实现云上容器镜像加密、加密镜像上传、解密镜像等一系列技术服务。

钱一峰表示:大模型中立定位,将是金山云坚定不移的策略。金山云将充分发挥自身的底座和平台能力,做大模型的助力者。

为了做好大模型的助力者,金山云也在积极探索大模型时代企业赋能新机遇。金山云的思路是将自身的AIGC实践和能力开放出来。

同时,金山云围绕企业级知识助手场景,制定了“一三一四”产品全景规划服务。

所谓“一三一四”就是一套能力(金山云轻舟智问)、三个模型(行业语言模型、文本分片和Embedding模型)、一个平台(金山云瀚海平台)及四大功能(微调推理、数据加速、智能检索和文档智能),大家可以把它理解为围绕大模型训练、推理应用的多项原子能力,既涉及了大模型落地应用,如轻舟智问服务,也兼顾了模型训练微调和平台支撑的全栈能力。

在这里徐寅斐透露,金山云轻舟智问知识助手的服务,就是结合Embedding模型、多路召回算法、智能数据切片模型等技术,计划优先在公共服务、法律场景落地。

“按照我们的实践经验,要想做好行业应用推理,在模型训练的初期,从预训练开始,就要结合行业数据,否则达不到预期中的效果。” 徐寅斐说。

金山云将持续围绕行业企业客户需求“练内功”,携手生态伙伴以差异化打法布局未来。

钱一峰表示:“金山云轻舟智问知识助手与金山云在大模型的‘中立定位’并不冲突,相反,这个过程可以帮助金山云更好的地了解大模型训练和推理,有助于提高大模型底座和平台的技术能力。”

全面拥抱人工智能,在实践的同时保持中立,金山云的思路让人印象深刻,愿天下没有难做的AIGC应用。