软硬协同造就极致性能 天翼云紫金DPU打造为云而生的全新一代云计算体系结构

算力作为数字经济时代的新生产力,已成为推动数字经济发展的核心动能和坚实底座。在当前这个算力普惠、万物互联的时代,业务场景复杂化,传统以CPU为核心的计算架构面临着诸多挑战。

12月29日,在中国电信主办的“2022天翼数字科技生态大会”,中国电信正式发布天翼云自研紫金DPU。在科技创新合作论坛上,天翼云科技有限公司副总经理兼首席技术官广小明表示,天翼云紫金DPU软硬协同造就极致性能,打造了为云而生的全新一代云计算体系结构,全面推动算力普惠,服务于千行百业上云用云。

创新算力架构  DPU持续走热

随着各行业数字化转型加速、数据爆发式增长,计算需求不断走高,业务场景也愈加复杂化,而传统以CPU为核心的计算架构已无法满足随时随地的计算需求。近年来摩尔定律放缓,CPU性能提升速度难以满足算力需求的增长速度,主机CPU计算能力一部分用于承载虚拟化应用,这将损耗超过30%的算力,同时CPU芯片架构、操作系统种类繁多导致适配难度高、工作量大。这样的行业现状呼唤新型高性能计算架构的产生,来推动算力普惠发展,DPU正是在这样的背景下诞生。

DPU可实现业务与基础设施的操作分离、卸载网络、存储和安全等算力,并实现性能大幅提升,支持计算和存储分离等。 随着东数西算工程的推进,以及数字新基建的提速,算力需要不断下沉,而DPU可提升计算效能,实现算力资源优化。另一方面,DPU所涉及的行业广泛,落地应用场景正从数据中心领域逐步向网络安全、网络存储、智能驾驶等领域拓展。在以上双重因素驱动下,DPU在国内不断升温。

广小明表示,云厂商既是DPU需求方,也是设计方。近年来以大规模视频处理、批量数据处理等为代表的高负载云计算应用越来越多,且业务场景运算强度大、高并发、应用复杂,这对云厂商的服务能力提出了极高要求。随后,国内云厂商纷纷踏上DPU研发之路。

作为云服务国家队,天翼云是较早探索DPU的云厂商。在研发方面,天翼云深知DPU的打造不只是系统架构的巨大变化,更需要软硬件之间的深度协同,因此结合当前业界主流的技术方案,以及运维、可扩展性等方面的实际情况,发力DPU自主研发。

三大技术突破天翼云紫金DPU全面提升算力算效

凭借在云领域的成熟技术和应用实践,天翼云经过一年多的研发攻坚,推出了完全自研的紫金DPU芯片,并且以紫金DPU为基础打造了为云而生的全新一代云计算体系结构,将计算、存储、网络和安全算力迁移到完全自研的软硬结合体系中,构建了面向不同算力、全国产化自主可控的第二平面。

基于天翼云全自研能力,该架构完成了虚拟化全卸载、多种业务硬件加速和自研高性能网络协议三大技术突破。

一是虚拟化全卸载。天翼云紫金架构将原运行在服务器CPU上的各类虚拟化组件卸载至紫金DPU,实现了服务器虚拟化零损耗,全面释放了算力,不仅提高了弹性云主机的售卖效率,而且全新支持弹性裸金属服务,实现降本增效,普惠客户。

二是多种业务硬件加速,具备更高的性能和更低的时延。相比传统CPU依靠纯软件的处理方式,紫金DPU通过芯片级的硬件加速,网络PPS性能提升100%;存储IOPS性能提升200%,网络时延降低300%。新架构的整体性能实现大幅提升,为客户带来了更好的产品体验。

三是提供高性能网络协议。天翼云紫金DPU将高性能网络数据面、NVMe-oF协议、EC纠错码等功能全面硬件化,自研的拥塞控制算法通过端网协同的主动控制做到精准流控,通过低队列深度实现超低时延,大幅提升分布式计算通信效率,并且具有可大规模部署的优势。同时,紫金DPU还实现了主机CPU环境与虚拟化环境的物理隔离,支持“一云多芯”,对于主机不同CPU芯片架构的服务器实现“即插即用”。

DPU应用范围广,未来发展可观,其作为新赛道在我国尚处于发展的起始阶段,DPU能否规模化应用,有赖于产业的规范化和标准化。广小明认为,DPU产业的标准应从电器结构标准、软件标准、芯片功能标准等方面着手综合考量,天翼云将同业界共建一个标准化组织来推动相关标准的制定和出台。

目前我国数字经济发展呈现迅猛之势,各行业对算力的需求持续增长。天翼云紫金DPU全面释放算力的同时,将对软硬件系统带来创新变革,推动千行百业的业务层数字化应用更流畅、更绿色,助力企业数字化转型升级,推动数字经济与产业高质量发展。