聚焦AI时代操作系统发展 龙蜥社区走出了自己的路

8月30日,2024龙蜥操作系统大会在北京举行,会上社区宣布了三大计划:CentOS替代计划、Anolis OS 23生态衍生计划、AI应用推广计划。

会议期间,龙蜥社区副理事长张东,阿里云智能集团资深技术总监、龙蜥社区技术委员会主席杨勇,浪潮信息系统软件产品部总经理苏志远接受了媒体采访,就操作系统在AI时代的机遇与挑战、龙蜥社区的发展方向等话题进行了深入探讨。

AI时代,操作系统迎来新挑战

AI浪潮席卷而来,对操作系统提出了新的要求,需要系统软件的技术演进,去满足对大算力环境的支持,对数据多模态、跨模态巨量数据的管理,以及对各种新型融合网络的架构支持。

大模型所具备的智能涌现和泛化能力,将创造出千千万万甚至数以百万计的AI原生应用,重构产业架构和底层基座。随着AI原生时代的到来,人机交互方式、编程范式、内核复杂性等的变化,正在催生服务器操作系统的深层变革。未来的开发者可以直接使用自然语言进行开发,操作系统不仅需要支持新的编程范式,还需要在用户界面和用户体验上做出相应的改进,以适应AI原生时代的需求。

同时,在AI原生的趋势下,操作系统的“内核层”变得更加复杂,底层硬件需要提供更复杂的计算资源,包括多元化的通用处理器与AI加速芯片、更高效的内存、网络、存储IO等等,要求操作系统能够有效管理和分配这些资源,确保AI应用的高效运行。

针对AI时代对操作系统的新要求和产品迭代方向,杨勇指出AI基础设施对服务器操作系统有几个诉求:

一是训练的可靠性。随着集群规模增长,训练停机成为大问题,需要操作系统提供支持;

二是全链路的协同。AI基础设施分层多,需要各层协同,操作系统要提供可观测、可运维的数据化监控预警系统;

三是性能优化。GPU利用率低可能受其他设施拖累,系统优化需要重新思考服务器操作系统的参与。产品方面,要做到一站式服务,筛选最佳匹配组件,管理好异构算力,考虑AI芯片推荐的框架。操作系统自身也要发展,如建立文档库提升Copilot效果。

龙蜥社区:打造成长型开源社区

张东认为,龙蜥社区通过核心厂商的入驻和广泛参与者的加入,找到了一个平衡点,避免了单一厂商垄断,也避免了完全自由发展。这种模式有利于社区长期发展,并吸引更多企业和开发者参与。

杨勇补充道,操作系统社区的天然优势是连接硬件和软件供应链,需要通过技术、产品和生态三大飞轮共同驱动,才能实现可持续发展。龙蜥社区已经建立了AI容器、Copilot等计划,并通过运维联盟和安全联盟将社区成果触达更多用户。

浪潮信息:积极参与,贡献生态

苏志远介绍了浪潮信息在龙蜥社区的全方位参与情况。技术贡献排名靠前,例如与开放源子基金会推广活动,邀请教授基于龙蜥开设操作系统授课,覆盖近200所高校数千名学生;在产品研发方面,基于龙蜥版本结合场景进行开发,满足自身用户在存储、云、AI技术开发平台等方面的需求,实现开机一键部署AI环境,并随着自身软硬件平台推广。

浪潮信息也积极参与龙蜥社区的AI生态发展计划,基于Anolis OS 23开发了商业衍生版,并在AI Chip Native、AI原生容器、多元多模等方面进行了技术探索。借助社区力量,使国产芯片厂商与操作系统兼容,在上层应用层面,将积攒的语料库贡献到龙蜥社区,强化Copilot能力,支持大模型部署的容器化、开发框架,以及多元多模的算力和模型。

苏志远表示,Anolis OS 23重点统一了内核版本和关键软件包的选型,减少了生态适配的重复工作。浪潮信息在漏洞修复、云原生方向以及内核驱动基线等方面做出了贡献。

张东强调,浪潮信息将坚持“以应用为导向,以系统为核心”,真正发挥系统厂商的优势,通过整机带动,更好地实现软硬协同的系统设计,加快技术创新,而操作系统是软硬协同设计与优化的核心。

多元化芯片:操作系统提供统一管理

在底层多元化芯片发展的问题上,杨勇认为,芯片碎片化由供应链和技术发展规律驱动。在AI算力方面,存在DSA路线和通用GPU路线。

杨勇和苏志远一致认为,多元化芯片发展趋势不可逆转。操作系统需要提供一个统一的软件层,将不同厂商的芯片管理工具封装起来,让用户可以像管理单一厂商的产品一样管理多元化芯片。

浪潮信息提出的“双喇叭”理论认为,多元化芯片市场会经历一个分久必合、合久必分的过程,从多元竞争到收敛,再到因新场景和技术而再次分化的过程,最终形成健康的产业发展态势。

未来展望:操作系统与AI协同发展

张东指出,现有技术体系在应对AI原生时遇到算力、存储、数据等问题,未来操作系统可能会面向巨型资源进行变动,操作系统本身也可能成为智能体。

张东提出服务器操作系统三大发展建议:一是AI原生优先,全面优先拥抱AI,深度融合AI能力,打造上游芯片到算法应用开发厂商的最优基础软件,实现AI能力的快速价值转化;二是坚持应用导向,强调社区技术创新与应用场景紧密结合,创新基础软件与硬件、应用之间的协同模式,打造面向领域垂直场景的最优解决方案;三是强化开放中立,社区撕掉单一厂商标签,强调共治共建共享,建立开放标准,积极与国际领先的社区接轨,保持同步发展,形成繁荣的生态系统。

杨勇表示,操作系统的发展受软硬件产业推动,操作系统在AI时代将扮演更加重要的角色,AI发展会让Linux统治地位更稳固,操作系统的发展将紧密跟随硬件革命的步伐,推理场景的多样化对操作系统提出不同要求,操作系统从业者会受到相关领域技术创新的推动。

结语

龙蜥社区和浪潮信息正在积极应对AI时代的挑战,并通过技术创新、生态建设和人才培养等方式,推动操作系统与AI协同发展,为用户创造更大的价值。