自研CPU已大规模应用,阿里算力攻坚实现重大突破

11月3日,在2022杭州云栖大会上,阿里巴巴公布了自研算力体系新进展,其自研CPU倚天710已经在数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司,成为中国首个云上大规模应用的自研CPU,实现算力攻坚重大突破。未来2年,阿里云20%的新增算力将使用自研CPU。

2009年,阿里巴巴成立阿里云,并投入研发自研云操作系统飞天,这是阿里巴巴探索算力的起点,拉开了中国自研云计算操作系统的序幕。飞天操作系统用分布式架构替代传统IOE架构,不仅解决了阿里巴巴业务高速发展带来的算力挑战,也让算力成为一种可在线获取的公共服务。

在这之后的五年,阿里云实现了一系列世界级突破。2013年,阿里云在全球范围内首次突破单一集群5000台服务器规模(飞天5K),并率先对外提供这一能力。此后,飞天操作系统成功支撑了十多年双11和12306春运购票等极限并发场景。

随着云计算应用规模不断扩大,阿里云打破单纯的软件创新模式,开始深入数据中心内部做体系化创新,以云的形态来定义IT软硬件体系。在数据库方面,阿里云用开源MySQL替代传统Oracle后,进一步推进自研之路。2017年,阿里云发布首个云原生数据库PolarDB,计算能力最高可扩展至1000核以上,性能比开源MySQL高6倍。近几年,阿里云连续进入Gartner全球数据库领导者象限 。

2017年,阿里云推出第一代神龙架构,通过软硬一体化技术来提高云计算的性能输出,实现了性能的0损耗,首次让云计算的算力潜力彻底释放。如今这一架构已升级为全新的云基础设施处理器CIPU,可替代CPU来管理和加速计算、存储和网络资源,在飞天和CIPU的加持下,PolarDB数据库的全局一致性读性能提升10倍。

这些核心技术也加速了智能计算的发展。2022年,阿里云推出飞天智算平台,基于底层网络、计算等核心技术的突破,可以为人工智能、生命科学、医疗制药、自动驾驶等领域的企业提供更高效的智能计算服务。数据显示,飞天智算可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

技术上的连续突破,推动了云计算产业的快速发展,原生长在云平台之上的应用不断涌现,全面上云逐渐成为企业的核心战略,而全球云计算的产业规模也迫近万亿美元。

如果说云计算的第一个十年是由规模驱动软件技术的发展,那么今天云计算则进入了一个全新的阶段。去IOE之后沿用下来的算力体系正在迎来新一轮的变革,AWS、阿里云等主流云厂商率先启动了新型硬件和芯片的研发。

2018年,平头哥成立,致力于打造端云一体的芯片产品,阿里巴巴的算力体系再一次得到补强。次年,阿里巴巴第一颗芯片含光800问世,这是一颗为AI场景深度定制的芯片,进一步提升了AI场景计算的效率,并逐步应用图像识别、搜索推荐等场景。

与此同时,阿里巴巴也在向更高难度的算力发起挑战。2021年,阿里巴巴发布首款通用CPU芯片倚天710。该芯片为云而生,是云计算产业和传统半导体产业融合的新产物,同时兼顾性能与易用性。在2022云栖大会上,阿里云宣布自研CPU倚天710已大规模应用,阿里云未来两年20%的新增算力将使用自研CPU。这不仅对中国芯片产业意义重大,更是云计算重塑算力体系的重要一步。

面向正在爆发的万物互联终端,阿里巴巴聚焦研发RISC-V架构处理器,这一架构被认为是继ARM、x86架构之后,中国芯片产业的第三条路。目前,平头哥已推出高性能RISC-V处理器玄铁910等多款产品,并领导了11个重要技术方向,成为全球RISC-V技术与生态发展的引领者。

从世界上第一台电子计算机ENIAC诞生起,算力的载体经历了从大型机、小型机、PC、移动终端以及云计算的演变,但算力的终极形态远未到来,科技企业仍在向新的技术发起挑战。面向未来的新型算力技术,阿里巴巴在存算一体芯片、量子计算等领域取得一系列突破,2022年,基于新型超导量子比特fluxonium,达摩院量子实验室成功设计并制造出两比特量子芯片,实现了单比特操控精度99.97%,两比特iSWAP门操控精度最高达99.72%,取得此类比特全球最佳水平。