硬核!阿里云造“神龙”

2020年 ,神龙交了份亮眼的成绩单:入选世界互联网领先科技成果、包揽斯坦福DAWNBench竞赛四项第一、论文入选计算机系统领域顶级会议ASPLOS’20……

作为第三代虚拟化技术,神龙架构加持下的第七代阿里云服务器,计算性能提升了160%,存储IOPS高达100万,网络转发PPS2400万,存储延时下降了70%,容器部署密度提升了6倍。

为什么神龙有这么大的威力呢?

今天就给大家介绍我们家的神兽——“神龙”

1

云计算的“硬伤”

计算的载体

从楼船一般的大型机

到快艇似的小型机

到如今万吨巨轮的云计算

背后有同一个技术的身影

那就是“虚拟化”

有了虚拟化技术

无数台计算机可以“组合”成一台超级计算机

而一台计算机也可被“切割”成无数小计算机

但是

随意“组合”和“切割”的舒爽不是白来的
代价就是“虚拟化损耗“
那么,什么是虚拟化损耗呢?
举个例子

假设你是教练,需要训练104个运动员

这么多人,你是管不过来的

所以一些人就会在训练时偷懒

你只能从中选出8个小组长

让每个小组长管12个运动员

这样一来,队伍的秩序就加强了

但这8个本来要上场的人去做了管理

原来104分的绝对战斗力,现在只剩下96分

在这个例子里

虚拟化的性能损耗大概是8%

而且

足球运动员踢球在行

但做管理就不一定擅长了

2

召唤“神龙”

为了解决云计算之一“硬伤”

阿里云专门成立了一个“神龙”部门

请来管理专家自研专用板卡

专人专岗负责虚拟化调度

这样,运动员就负责专心踢球

可以把原本管理的CPU解放出来

不仅如此

阿里云还设计了一套更加高效的信息管理机制

神龙Hypervisor

让管理专家拥有单独的战略部署区域

避免与运动员互相打扰

另外

还有一套现代化智能化通讯系统、模拟训练系统

目的是提高运动员的训练效率

总的来说

“神龙”部门承担了所有管理和协调工作

还升级了内外的通讯和运输系统

3

“神龙”服役

从2017年开始

这套“神龙”软硬一体化计算平台

就在阿里云服务器上服役了

今天的神龙已经多次进化

不仅覆盖常规的云服务器

还大规模应用在异构计算、超算集群上

扩容效率更高了

容器跑得更快了

2019年双11期间

阿里将核心业务迁移到神龙架构上

通用类的业务承载提升了20%~30%

去年双11

神龙继续大放异彩

支撑了58.3万笔/秒的订单峰值

“剁手”体验丝般顺滑

今天的神龙

承载了中国超80%的科技企业上云

广泛应用于医疗、新政务、智能制造

互联网、教育等多个行业

跨越了“性能损耗”这座大山

神龙将在云计算普惠的道路上越走越远

来源:公众号 阿里云