众所周知,当下服务器CPU除了主流的Intel/AMD的x86架构,国内还有6大CPU,ARM架构的鲲鹏、飞腾,x86架构的海光、兆芯,alpha架构申威,MIPS架构的龙芯等,这些CPU都在加大力度进行数据中心服务器市场覆盖,尤其是ARM 架构的CPU。随着ARM 架构CPU在智能终端的成熟,ARM不断延伸至物联网、数据中心等领域,向传统CPU英特尔领地发起进攻。在服务器市场,ARM生态越来越完善,阵营不断扩大,包括苹果、华为、亚马逊等众多巨头纷纷加入ARM阵营,ARM在服务器市场份额不断飙升。根据权威调研机构IDC此前发布的数据显示:2020年第三季度,基于ARM架构的服务器同比增长了430.5%,2020年第四季度同比增长了345%。尽管基数小但增长迅速。另据Statista预测,到2028年,ARM架构处理器在数据中心和云的市场份额将从2019年的5%增长到25%。2028年的市场规模将达到580亿美元,比2019年的14倍还多。
伴随产业发展趋势,国家“十四五”新基建的政策落地也在推动国内相关产业高质量地从“信息化”到“数字化”的快速发展,中国正在加速建立基于信创IT底层架构与标准,并形成全新的信创开放生态。这其中包括以数据中心、智能计算中心为代表的算力基础设施等,以及以人工智能、云计算、区块链等为代表的新形态基础设施。算力基础设施方面,在国际形势影响以及新生态建设推动下,一批新的信创软硬件蓬勃发展起来,除了基于ARM架构的CPU芯片,还有大量软硬件生态高速发展,包括服务器整机,主板,内存,硬盘,RAID卡,网卡等等。新形态基础设施方面,云计算在新基建的建设中,在推动政企数字化变革、激发数字化技术与商业模式创新等方面起着关键的作用,信息技术应用创新云(“信创云”)应运而生。信创云通过屏蔽底层芯片和设备的差异化,解耦应用对底层硬件的依赖,将复杂多样的硬件资源抽象池化,形成统一的“云化资源池”。依托于云计算技术的应用,用户可以更聚焦在业务创新发展而非基础设施层面,这也侧面加速了“信创”产业发展速度。
一云多芯的客户诉求与挑战
随着国家“十四五”新基建的政策落地以及生态建设的逐步拓展,基于异构多元算力的采购策略,以规避单一算力形态的绑定,越来越多的企业开始选择多元化的服务器CPU架构算力构建数据中心,例如Intel/AMD的x86架构算力,ARM架构的算力等等多种CPU架构算力并存。这种情况下,针对每一种算力,建设独立的云平台,会导致巨大浪费,也不利于统一维护管理,所以绝大部分客户要求通过统一云平台向上提供异构CPU算力,这就是异构多元算力的典型场景,也就是一云多芯需要解决的问题。
由于多方面原因,云平台通过一云多芯解决异构多元算力也存在多方面的挑战。首先,对于一云多芯的云平台来讲,最大的挑战是生态内的硬件高速发展带来的兼容性挑战。一云多芯意味着环境底层硬件及上层配套客户操作系统以及软件都是异构多样化的,云平台最大的挑战首先是要能够正确识别,有效管理,进而才能达到高效协同,最终提供最佳稳定性与性能。这需要从底层到上层的各种功能性能等配套调试优化,因为涉及的厂商数量众多,并且是一种松散组织,而任何一个细小的问题,都会影响一云多芯生产环境使用,要满足生产环境的严酷要求,必须提前完成专业的前期验证适配工作,才能保证生产环境的快速就绪。
其次,支持异构多元算力,需要保证用户的一致性使用体验,而从用户的应用系统来看,则需要从功能到性能,从可靠性到安全性等,能够让异构多元算力在使用的层面保持一致。
此外,一云多芯需要灵活支持多种部署形态,例如x86 CPU与ARM CPU的并存,ARM不同厂商架构并存,甚至计算节点与存储节点不同CPU架构并存。多样化的部署形态,对于云平台自动化部署能力是很大考验,特别是在面对大规模部署时。
最后,一云多芯的场景下,应用形态仍然在高速发展,从虚拟化到云原生,云平台能够在多元异构算力的基础上,同时提供虚拟化与云原生算力也是云平台所面临的挑战。
易捷行云一云多芯解决方案
面对一云多芯生产环境的严酷要求以及挑战,易捷行云将与众多第三方软硬件厂商的经验积累进行固化,并结合自身新一代云原生架构推出一云多芯云产品,结合新一代云平台包括裸金属、云原生服务、高性能存储等云产品与服务,通过完善的产品化工作,以可升级、可进化的方式全方位立体解决了这些挑战,消除了用户使用一云多芯信创云平台的顾虑。一云多芯云产品作为易捷行云新一代云平台的一个独立的服务,他与系统里几乎所有组件都有千丝万缕的关系,其中最关键的是ESCL(EasyStack Cloud Linux) 、数字原生引擎EOS(EasyStack Operating System)、ECAS (EasyStak Cloud Automation Service)。在一云多芯的场景下,不同物理服务器的差异可能是巨大的,从异构CPU架构,到CPU指令集,到不同的生态硬件,易捷行云统一由ESCL在底层完成适配。
裸金属操作系统ESCL (EasyStack Cloud Linux)负责对单台物理服务器进行资源封装。在通过ESCL适配不同CPU架构不同指令集的基础上,EOS对云平台集群内节点资源进行统一的抽象与封装,并通过计算、容器集群EKS(Kubernetes)、安全容器、裸金属、统一云存储等云产品与服务提供包括计算虚拟化、容器虚拟化、裸金属、网络虚拟化、存储虚拟化等能力。数字原生引擎EOS是构建在Kubernetes上的稳定、可靠、安全的数据中心操作系统。数字原生引擎EOS把整个数据中心抽象成为一台计算机,EOS核心是由面向数字化应用架构的一系列微服务组件构成,每个组件进程作为一项服务运行。这些服务围绕各自业务功能进行构建,每项服务负责担负一项云功能,使用轻量级API通过明确定义的接口进行通信。面向底层异构硬件资源池,EOS彻底屏蔽底层多种芯片多种指令集异构资源的差异;面对用户以及上层云服务, EOS与一云多芯一起协同,提供一整套完整的自适应机制,可根据用户或者应用的不同调用请求,自适应的提供基于不同硬件资源池的云服务。正是通过EOS与一云多芯这种统一抽象能力,使用户在使用云平台时,对所有的云服务从功能到性能的用户体验完全一致的。
基于ESCL,EOS,一云多芯成为了可能,而ECAS自动化中心则是一云多芯的关键。ECAS 是自动化部署的利器,自动化中心(EasyStack Cloud Automation Service, ECAS)是易捷行云新一代云平台的核心自动化引擎,通过ECAS提供极简部署,可快捷部署服务器底层操作系统ESCL、EOS平台、分布式云存储、虚拟化网络以及控制台。一云多芯云产品借助ECAS自动化中心实现大规模分布式异构云操作系统小时级快速部署。ECAS通过自动化的节点发现,构建形成整个数据中心部署大脑,可以按照节点不同硬件架构,轻松地按需自动化完成部署。一云多芯场景下的ECAS就好比一个作战后勤中心,它清晰地掌握着不同战场部署的不同军种,进而可以轻松按需将海陆空不同军种需要的后勤服务以及不同武器系统需要的弹药,按需高效自动化部署到不同的战斗岗位,而整体上形成统一的战场统一的战线。
通过ESCL,EOS,ECAS技术与产品,易捷行云⼀云多芯可以支持业界主流的各种芯片混合部署,支持在同⼀套云平台内⽀持不同芯⽚(⾮CPU架构)的物理服务器,即一个Region内可以⽀持2种及以上不同的芯⽚,⽬前包括Intel,AMD,海光, 鲲鹏920, ⻜腾FT2000+ 、飞腾FT2500+六种芯⽚,以及配套的多种类型服务器配件。
为了更加直观形象的展现易捷行云一云多芯云产品的能力,我们提供一个简单的截图展示,实际能力上一云多芯完全能支撑更加丰富的使用场景。以下是同⼀套套云平台内同时部署飞腾、鲲鹏与海光CPU服务器的测试环境截图,从中可见总计9个物理节点,其中控制节点,计算存储节点,属于飞腾CPU,独立的2个计算节点属于海光CPU,以及独立的1台鲲鹏CPU计算节点。
易捷行云一云多芯客户价值—高度产品化
易捷行云一云多芯核心特点首先是其高度的产品化程度,在保持多元算力与多种云产品与服务的组合前提下,一云多芯云产品仍然提供了高度产品化的产品获取,部署与激活的特性,通过云产品市场可以在几分钟之内激活一云多芯能力,通过全界面化的交互将普通的x86云平台进化成为一云多芯的平台,过程中不会影响已有业务的运行与平台的访问。在为用户提供丰富的多元算力,一云多芯广泛兼容,安全可靠,抽象统一的基础上,仍然保持了易捷行云产品的一体化、可升级、可进化、轻运维的独特优势,为企业创新提供强大动能,尤其是企业新一代信创云平台建设的首选。
同时,易捷行云一云多芯的核心特性之二是稳定可靠,场景丰富,通过多种场景的云服务,能够在一云多芯的环境下,提供包括不限于虚拟化云主机、安全容器、裸金属、Kubernetes容器集群、高性能云存储等,并且提供完整的控制服务的高可用,云主机的高可用等机制,保障平台的可靠、稳定。
此外,易捷行云一云多芯,底座通过EOS屏蔽了底层异构资源池的差异,可以支撑不同的芯片架构,包括x86架构体系,ARM架构体系等,抽象算力,方便用户的使用过程的一致体验,而不必感知底层的具体差异。同时一云多芯适配不同的异构环境提供了统一监控运维,提供一致的告警,监控等运维手段,带给客户的最核心价值就是轻运维。
【作者: 易捷行云 郑晨 】