10月16日,零一万物继千亿参数模型Yi-Large之后,正式对外发布新旗舰模型Yi-Lightning。这款模型在国际权威盲测榜单LMSYS上取得了优异成绩,超越了硅谷知名OpenAI GPT – 4o – 2024 – 05 – 13、Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一。这是中国大模型在LMSYS这一全球大模型必争的公开擂台上,首度实现“超越OpenAI GPT – 4o”的最佳成绩,在一众国内模型中拔得头筹,成为含金量最高的“中国大模型第一”。零一万物也凭借此模型紧随OpenAI、Google之后,与xAI打平,进击全球前三大模型企业,以优异模型性能稳居世界第一梯队大模型公司之列。
一、模型性能卓越
(一)综合性能出众
在LMSYS的多个分榜中,Yi – Lightning表现优异。在中文分榜上,超越了xAI发布的Grok – 2 – 08 – 13、智谱发布的GLM – 4 – Plus等国内外优质模型,与o1 – mini等模型并列排名世界第二;在多轮对话分榜上,超越了Google所发布的Gemini – 1.5 – Pro、Anthropic发布的Claude 3.5 Sonnet等知名旗舰模型,排名第三;在数学、代码分榜上,分别取得第三、第四名;在以专业性与高难度著称的艰难提问、长提问榜单上,均取得世界第四的优异成绩。
(二)推理速度大幅提升
与上半年发布的Yi – Large相比,Yi – Lightning的推理速度有极大提升。内部评测数据显示,在8xH100算力基础下,以同样的任务规模进行测试,首包时间仅为Yi – Large的一半,最高生成速度提升了近四成。外部与GPT – 4o对比,其生成速度堪称“极速”。这得益于其采用的Mixture of Experts(MoE)混合专家模型架构以及在训练过程中的多项创新尝试。
1、独特的混合注意力机制(Hybrid Attention):在部分层次中将传统的全注意力(Full Attention)替换为滑动窗口注意力(Sliding Window Attention),并引入跨层注意力(Cross – Layer Attention, CLA)的设计。这种方式平衡了模型在处理长序列数据时的性能和计算资源消耗,使得模型在面对长序列数据时的表现保持在较高水平,同时显著降低了KV缓存的大小,实现了2倍至4倍的减少;某些层次的计算复杂度也由序列长度的平方级降低到线性级,进一步提高了模型的计算效率。
2、动态Top – P路由:可以根据任务的难度动态自动选择最合适的专家网络组合,无需人工干预。与传统的Top – K路由机制相比,能更灵活地根据任务的难度调整激活的专家网络数量,从而更好地平衡推理成本和模型性能。
3、多阶段训练(Multi – stage Training):训练前期注重数据的多样性,后期侧重内容更丰富、知识性更强的数据。通过这种方式,模型在不同阶段吸收不同的知识,便于数据配比调试,同时在不同阶段采用不同的batch size和LR schedule来保证训练速度和稳定性。结合自创的高质量数据生产管线,不仅保证了训练效率,还让模型在具备丰富知识的同时,基于复杂且重要的数据做进一步的强化。在有较多新增数据或对模型进行专有化时,可基于此模型进行快速、低成本的重新训练。
二、推理成本降低
基于MoE模型架构与零一万物自身的AI Infra优势,Yi – Lightning的推理成本大幅下降。目前已上线的Yi大模型开放平台(https://platform.lingyiwanwu.com/)上,每百万token仅需0.99元,直逼行业最低价,以极致性价比助力开发者与企业客户轻松实现SOTA大模型自由。
三、行业应用广泛
(一)AI 2.0数字人解决方案
10月16日,零一万物首度对媒体公布了全新ToB战略下的首发行业应用产品AI 2.0数字人,聚焦零售和电商等场景,将Yi – Lightning模型实践到行业解决方案中。AI 2.0数字人包含角色大模型、直播声音大模型、电商话术大模型等,具备动作训练、表情生成、多国语言和情感表达、智能对话等能力。Yi – Lightning接入后,数字人的实时互动效果更好,话术更丝滑,回复也更准确。在业务数据方面,某酒旅企业接入后GMV较此前上升170%。除直播外,还为数字人客户准备了AI 2.0门店短视频解决方案,可低成本、高品质地生成营销视频,与直播内容相互配合,提升商品转化率。该解决方案涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景,合作案例包括全国某著名餐饮连锁、某头部酒旅类客户、全国某知名水果连锁店等,均取得了显著的GMV提升。
(二)全行业解决方案
零一万物的全行业解决方案,除基座模型外还会搭配RAG、Function Calling等实用工具。在过去,已基于Yi – Vision与飞书合力打造智能巡检产品,基于Yi – Large与某头部医疗机构合作搭建在线问诊平台,Yi系列模型也接入了包含360 AI助手、沉浸式翻译在内的知名应用。截止目前,ToB解决方案已在零售、医疗、教育、物流等领域内完成落地,涉及AI搜索、AI生产力工具、AI智能巡检等应用场景,合作企业包括世界500强企业等。Yi – Lightning正式接入后,无论是标准化的全行业解决方案,还是私有化定制业务,都迎来了更多可能性。新旗舰模型Yi – Lightning采用的MoE混合专家模型架构在模型交付方面具有效率优势,可根据垂直领域的特殊需求快速重新训练专家模型并交付。同时,其训练过程中的创新尝试也能为客户提供更高起点的标准化基座模型,更快速、高效、低成本地完成定制模型训练。
结语
零一万物此次推出的Yi – Lightning模型,标志着中国大模型行业的重大突破,彰显了中国所孕育的强大技术实力。其“模型+AI基础设施+应用”的三位一体布局,不仅为自身构筑了技术护城河,也为中国大模型产业的发展提供了有益的探索和借鉴,未来将继续推动中国大模型成为驱动千行百业的新质生产力。
零一万物CEO李开复博士表示,Yi – Lightning的出色表现是“模基共建”战略正确性的有力例证,也是探索“模应一体”的重要基石,在当前中国大模型产业的“耐力赛”阶段,零一万物将坚持这一布局,积极在ToB企业级解决方案上探索TC – PMF,助力中国打造以大模型为引擎的新质生产力。