蚂蚁集团徐鹏：希望用AIGC为世界带来一些微小而美好的改变-DOIT-数据产业媒体与服务平台

2023年9月7-9日，外滩大会在上海黄浦世博园区召开，作为一场在2023年举办的，以金融科技和前沿科技为主的科技大会，自然少不了对大语言模型的讨论。

在大会期间，蚂蚁集团副总裁徐鹏介绍了蚂蚁集团在AIGC模型上的探索和实践。他认为，AIGC大模型将会发挥越来越大的作用，而蚂蚁集团作为人工智能领域的一个十多年的实践者，希望通过AIGC大模型的发展，为世界带来一些微小而美好的改变。

蚂蚁集团在AI方面有长期积累

蚂蚁集团是一家知名的金融科技公司，其金融属性主要来自旗下的支付宝平台。科技属性方面，源自在科技研发上的高投入。2022年，蚂蚁集团在研发上投入大约204.6亿。并且，蚂蚁集团共有18,678项有授权的专利，其中，超过95%都是发明专利。

蚂蚁集团还是开源技术领域的重要参与者，截止到2022年底，蚂蚁集团贡献了超过300多个项目，包含1,500个开源代码库，总的贡献者数量达到了6,000左右。在开源领域的活跃度，不仅能展示在技术上的优势，也能表明一家公司在技术方面持续投入的决心。

不仅如此，我们看到蚂蚁集团在技术上的投入还在不断加码。2021年4月，蚂蚁集团还成立了蚂蚁技术研究院。徐鹏表示，蚂蚁技术研究院是为了强化蚂蚁在技术探索和创新方面的一个机制，研究院致力做有用、有想象力的科研，开展前沿科技探索。

蚂蚁技术研究院有一个交互智能实验室，实验室主要聚焦计算机视觉和自然语言基础模型方向，会去开发通用人工智能算法架构，包括内容生成、多模态理解、数字人技术等人机交互关键技术，这与如今由ChatGPT掀起的生成式AI技术浪潮息息相关。

从徐鹏的介绍中了解到，由于需要降本增效并且提高使用体验，蚂蚁集团在AI方面一直在持续投入。这是因为，蚂蚁集团在多种场景中都能用到AI，比如，有了AI之后，可以实现营销服务、风控和理财等方面的智能化。

蚂蚁集团多年来深耕AI领域，结合蚂蚁集团自身业务特点建立了多种AI能力，包括自然语言处理、多模态学习、知识图谱、图机器学习以及运筹优化等多个方面。徐鹏对于认为这些能力对于蚂蚁的业务场景有明显价值。

2023年前后开始，随着以ChatGPT为代表的生成式AI技术的兴起，蚂蚁集团对于AI未来的发展也有了更多想法。

蚂蚁集团的AIGC模型战略和基础大语言模型

徐鹏提到了蚂蚁集团在AIGC模型上的整体战略，核心就是要提升AIGC模型研发效能和技术先进性，建设可持续发展的AIGC研发范式和开放共赢的应用生态，建设一流的基础模型，行业模型，实现toC、toB产品落地。

作为战略当中的核心构成，蚂蚁发布了蚂蚁基础大模型，大模型具体又分为语言大模型和多模态的大模型两种能力，它面向场景衍生出了金融模型、安全模型、医疗模型等多种模型，配合蚂蚁技术研究院的交互智能实验室，将模型应用于多个行业场景当中。

战略实施半年后，蚂蚁集团建立了AIGC模型数据体系和AIGC模型工程体系。前者负责数据的采集、加工、处理，后者负责模型训练、部署和调优，将其用在业务场景中。

为了提高AIGC模型研发效能和技术先进性，蚂蚁集团在软硬结合方面做了很多优化，也做了一些国产化适配的工作。

特别值得注意的是，为了提高训练效率，蚂蚁集团开发了智能分布式训练引擎和分布式推理引擎，利用分布式可扩展的特点来快速对模型进行训练和迭代，在下文即将提到的金融大模型训练中，底层算力集群达到了惊人的万卡规模。

除了构建准备数据和训练模型的基础平台，蚂蚁集团也开发了基础大语言模型，该模型采用了Transformer技术，使用了英伟达的显卡加速器，采用了蚂蚁自研的模型架构，支持刚才提到的并行式的训练和推理引擎。

蚂蚁集团的基础大语言模型经过微调后，可以初步适应某个应用场景。随后，可以利用强化学习让其进一步提升在场景上的能力。

在推理时，它还可以支持工具学习的能力，通过自然语言来调用API，这样的能力使得模型不仅限于文本生成或理解，还能与其他软件或服务进行交互，从而执行更复杂的任务。

为了减少资源浪费并加速推理性能，蚂蚁集团的基础大语言模型也支持量化，将模型使用的浮点数转为精度更低的INT8和INT4整数，也支持减枝和蒸馏等手段来减小模型的规模。

此外，蚂蚁还构建了AIGC模型安全防护体系和评价体系，在保障模型安全运行的同时，能不断的优化迭代模型本身。

从徐鹏的介绍中了解到，除了开发多模态模型以外，蚂蚁技术研究还做了很多前沿性探索。比如，蚂蚁开源的CoDeF突破了视频生成方面的一个技术瓶颈，CoDeF可用于完成视频风格迁移任务，不仅细节多，产生的视频整体效果更好，而且，所需的算力资源还更少。

蚂蚁集团正在考虑将AIGC模型应用到toB的产业当中，比如帮助用户处理文档，做视频内容的分析和编辑，对遥感影像进行地块分割、农作物识别等任务。在面向个人用户的toC场景上，蚂蚁也在探索让用户以有趣的方式进行交互。

落地：发布基于基础大模型的金融大模型

在外滩大会举办期间，蚂蚁集团还正式发布了基于蚂蚁自研基础大模型的金融大模型，它针对金融产业深度定制，该大模型在金融专属任务中表现突出，在“研判观点提取”“金融意图理解”“等领域达到行业专家水平。目前，蚂蚁金融大模型已在蚂蚁集团的财富、保险平台上全面测试。

此外，同时发布的还有基于金融大模型能力的“支小宝2.0”和“支小助”。其中，“支小宝2.0”已内测近半年，将在完成相关备案工作后上线。“支小助”正在与蚂蚁平台合作机构内测共建，是为理财顾问、保险代理、投研、金融营销、保险理赔等金融专家准备的AI助手。

据介绍，蚂蚁金融大模型在万亿量级Token的通用语料基础上，注入千亿量级Token金融知识，并从300+真实产业场景中提取了共60万+高质量指令数据，形成了金融专属任务性能优化的优势数据资产。

落地：发布基于基础大模型的代码生成模型CodeFuse

同样是在外滩大会期间，蚂蚁集团首次开源了基于蚂蚁基础大模型研发的代码大模型CodeFuse。它可以根据开发者的输入提供智能建议和实时支持，帮助开发者自动生成代码、自动增加注释，自动生成测试用例，修复和优化代码等，以提升研发效率。

在近期代码补全的HumanEval评测中，CodeFuse得分74.4%，超过GPT-4 的成绩，也超过了WizardCoder-34B 73.2%的得分，在开源模型中位于国际前列。本次开源内容包括代码框架、模型等，现已上架相关平台，模型可在HuggingFace直接下载。

基于CodeFuse的应用场景有开发助手、IDE插件、数据分析器等，覆盖了目前研发工作的主要需求，在蚂蚁集团内部研发流程中陆续得到验证。CodeFuse面向多个层次的开发者。无论是初学者还是有经验的开发者，CodeFuse都能够提高编程效率和准确性。

面向未来

随着基于基础大语言模型的金融大模型和CodeFuse的发布，标志着蚂蚁在AIGC方面迈出了重要一步。蚂蚁集团表示，未来将持续探索和精进大模型的五大能力方向：

一是，建设高质量的数据标注团队，沉淀高质量数据体系；二是，攻坚基础大模型算法，以及高效绿色工程能力，提升模型逻辑推理等能力；三是，从通用语言大模型到通用多模态大模型，从一般通识走向全面专业；四是，建设高效的大模型评测标准和评测体系，加快大模型迭代速度；五是，建设大模型安全能力，保障大模型健康可持续发展。

徐鹏表示，蚂蚁集团也在积极参与一些行业标准的建设，通过一些开放的评测，通过建立评测数据集，让整个行业都可以享受大模型发展的红利。

具体在产业落地方面，蚂蚁将结合自身能力优势和自身业务当中涉及到的多种场景，探索大模型技技术在金融、民生、科技服务等领域的落地应用。

蚂蚁集团徐鹏：希望用AIGC为世界带来一些微小而美好的改变

zhupb

相关推荐

近期文章

热门标签