算力,顾名思义即计算能力。虽然算力看不见、摸不着,但是小到扫码支付、网约出行、自动驾驶,大到超级计算机、人工智能、智慧城市,千家万户、千行百业都离不开计算能力。算力正在成为像水和电一样的公共基础资源。
ChatGPT的火爆掀起了人工智能大模型发展的风潮。仅仅在北京就已有百余款大模型产品,占全国总量的一半左右。
“北京是目前国内人工智能产业基础最好,创新能力最强,产品迭代最快的地区,也是在大模型领域布局较早的城市,今年以来,平均每月有10余家市场主体进入大模型赛道,保持较高的增速。”
——荆磊 北电数智党支部书记、董事长
但大模型产业的井喷,给算力行业带来新的难题——智能算力出现供给短缺。
摩尔线程副总裁、产品事业部总经理董龙飞认为,国产大模型应用呈现出“千模大战”的状态,使得智能算力出现“一卡难求”的局面,当下,如何“强化顶层设计,提升算力综合供给能力”已经成为行业的核心命题。
新建+改造,突破智能算力供需瓶颈
为了应对日益增长的智能算力需求,2023年5月发布的《北京市促进通用人工智能创新发展的若干措施》提到,将新增算力建设项目纳入算力伙伴计划,加快推动海淀区建设北京人工智能公共算力中心、朝阳区建设北京数字经济算力中心,形成规模化先进算力供给能力。
其中,北京数字经济算力中心由北京电子控股有限责任公司旗下的提供规模化先进智算算力、AI云及AI转型服务的科技企业北电数智承建,已经在朝阳区酒仙桥核心地带开工建设,预计2024年落成达产,一期实现多元异构的1000P智能算力供给。建成后的北京数字经济算力中心,还将以“开放、人本、普惠”的创新理念,建设算力生态联合实验室,打造酒仙桥地区的算力科技新高地。
“面对技术、产业、应用等方面的挑战,进一步调优算力结构、加大智算中心的建设比例,把算力聚集进一步转化为产业聚集,成为满足行业算力需求、赋能数字经济发展的重要途径。”
—— 李子威 紫光股份旗下新华三集团副总裁
然而,单靠新建算力还难以解决供需不平衡的状况,改造升级老旧小散数据中心成了另一个“解题思路”。
“AI全面爆发对基础设施的消耗达到绝无仅有的状态,也让传统数据中心面临严峻的考验与深层次的变革。”荆磊表示。
在北电数智看来,传统数据中心经过改造后将会焕发新的价值——不只是对陈旧的软硬件设备进行更新和升级,降低能耗,还要增加智能算力的生产和供给,帮助传统数据中心打开新的增长点。
例如,北电数智与世纪互联合作,通过赋能传统数据中心升级发展,构筑了坚实的智能算力底座,不仅可以满足大模型时代AI服务器的高功率需求,还可以大幅提高算力效率,满足人工智能新业态对智能计算的新需求。世纪互联相关负责人表示,作为在数据中心领域深耕多年的大型企业,双方共同建设最符合目前市场需求的算力基础设施,具有重要的典型示范作用,以智算中心构建智能计算新生态,将有效助力北京打造具有国际影响力的通用人工智能大模型创新发展高地。
此外,针对算力单点存在性能极限,北电数智还会把这些分散的多元算力互联成网,统一纳管,搭建出符合AI产业需要的“新形态”大规模智能算力集群,灵活便捷地支持各行各业对智能算力的需求。
建好生态,弥补算力性能差距
通过生态系统,提升算力性能是解决算力供给不足难题的另一条路径。
中国工程院院士、清华大学计算机系教授郑纬民表示,国内因起步较晚,自研的芯片在性能上仍稍显不足。但性能上的差距可以在生态上得到弥补。所谓好的生态就是让芯片用起来不费劲,建立这样的生态,并让市场接受,需要一个过程。
“国产生态只要解决好编程框架、并行加速、调度器、内存分配系统、容错系统、存储系统等问题,即使性能不足,国产芯片也会大受欢迎。”
—— 郑纬民 中国工程院院士、清华大学计算机系教授
不仅如此,在荆磊看来,软件和硬件协同优化的问题同样刻不容缓。硬件为软件提供了一个运行的环境和基础,而软件则通过调用和利用硬件资源来实现特定的功能。“目前行业的现实情况是,大家手里拿到的硬件都是一样的,但各家提升硬件性能的效率是不一样的。”
然而,软件与硬件的协同优化很难由一家厂商独立完成,需要更多厂商来共同参与,深度协同。
“以GPU为主的人工智能芯片是人工智能产业生态建设的核心基础,也是驱动AI产业发展的加速器。但是,光有硬件还不够,如何做好软硬协同才是驱动AI应用的重要法宝。国产GPU/AI芯片企业在努力提升产品性能的同时,更需关注GPU生态的建设和完善。”
—— 董龙飞 摩尔线程副总裁产品事业部总经理
据了解,北电数智已经联合AI产业生态上下游的多家企业,涵盖国内外芯片、服务器、大模型、人工智能、应用创新、产业投资等多个领域,期望以实践推动AI技术应用和迭代升级,推动产业进步繁荣。【文字来源/北京日报】