北京时间1月11日,英特尔第四代至强可扩展处理器正式发布,更多核心(最高60核),Chiplet技术,HBM内存,DDR5和PCIe 5.0,各种新技术,更高硬件规格,还发布多个面向工作负载做优化的加速器,意味着在成本方面需要有更多考量。
浪潮信息服务器产品线总经理赵帅表示,用户非常看重性价比。如今用户在IT设备的投入在不断提高,但用户更看重服务器算力所能带来的更大收益。浪潮信息正在和英特尔一起合作,让IT设施建在它本来该有的水平上,同时给用户带来更大的价值。
英特尔专家表示,一方面,英特尔会帮助用户将IT投入控制在合理的水平,另一方面,新一代服务器更强调工作负载层面上的优化,提高效率。
从市场竞争的维度看,x86阵营里的AMD和Arm阵营在核心数量上都远超英特尔,而英特尔在发布会上强调内置加速器的优势,在官方资料罗列了十大加速器和三个安全类的功能特性。
产品发布会上,英特尔圈重点介绍了七大算力神器,比如,提高机器学习运算力的AMX,提高网络负载处理能力的DLB,提高内存数据分析的加速器IAA,为提高提高HPC算力采用HBM的CPU Max系列等。
英特尔强调新的功能特性是结合用户的需求来打造的,很多用户都在积极采用新功能特性。
发布会现场,腾讯云介绍了AMX加速器加速AI计算负载的使用体验,中国电信天翼云分享了使用英特尔DLB提升服务能力的细节,京东云介绍了英特尔IAA加速器在数据库场景的实用价值。
字节跳动是互联网时代的新巨头,旗下有今日头条、抖音等多款热门App,对于IT资源的需求量非常大,火山引擎是字节跳动旗下的云服务,是字节跳动多种在线服务的底层技术支撑。
在火山引擎云基础产品负责人罗浩看来,云产品最终是为了客户业务增长去服务的,在做好增长的基础之上,火山引擎会关注如何在资源层面获得更好的成本优势,因此,火山引擎云基础团队累积了非常多成本优化的经验。
火山引擎基于第四代至强可扩展处理器发布了弹性计算实例,使得单核能力、网络转发能力,加解密、视频和AI推理训练能力上,都获得了大幅提升。内部测试结果显示,新处理器带来了30%以上的整体收益,如今,火山引擎的技术架构正在切换到更具性价比的方案上。
在谈到新的算力神器时,罗浩表示,火山引擎其实已经用了多个算力神器,比如,此前就在用QAT技术,用于加速AI算力的VNNI向量计算,整体上,火山引擎应用了英特尔发布的很多加速器的能力。
很多技术进步的意义就在于提高效率,英特尔原来强调的是用更高主频和更多核心来提升效率,而现在,则更强调通过特定的加速器来支持特定的业务逻辑,从而降低功耗并提升性能。
具体差别有多大呢?
从英特尔专家的介绍中了解到,同样一个功能分别由软件和硬件来实现时,性能有时候会有10-100倍的差距。通过硬件来实现功能时,会让一些逻辑固化后内置到硬件中,它的功耗便会大幅度降低,效率就有几十倍上百倍的变化。
加速器的做法有助于提高效率,但是,随着集成的功能越来越多,意味着制造工艺会变复杂,成本会变高,而且,长远来看,处理器本身会越来越臃肿,必然会存在用不到某些功能而浪费的情况。
于是,这一代至强可扩展处理器在成本和功能特性上做了开创性的变化,新推出的On Demand服务模式,将改变行业的消费模式,从CAPEX专向OPEX,用户可以按照需求单独开启或者关闭以下几个功能,包括:
英特尔动态负载均衡器DLB、英特尔数据流加速器DSA、英特尔存内分析加速器IAA、英特尔数据保护与压缩加速技术QAT和英特尔软件防护扩展SGX。
On Demand服务模式下,企业可以在初次购买的时候选择全功能的处理器,也可以在后期使用过程中,根据需求随时开启和关闭某些功能,最终,按照实际的使用量来付费。
在外界看来,On Demand服务模式可以有两种截然不同的走向:
一种是以基础款(没有开启任何功能)处理器的定价为基准,用户开启新的功能需要额外付费时,相当于用户承担了额外成本;
另一种情况下,以完全功能的处理器为基准价格,少开启一些功能就少付一些费用,而且,仅在需要的时候开启功能,不需要的时候关闭即可。
我个人倾向于认为是第二种逻辑,也就是要帮用户省钱,或者说是控制成本。同时,这还能为用户带来更多灵活性和自定义的空间,用户在选购第四代至强可扩展处理器时应该考虑场景来做决策。
从实际落地来看,On Demand服务模式更适合互联网公司或者云服务商,总之是有大规模数据中心的用户,这些用户通常都比较懂技术,会结合需求做一些更有针对性的调整,从而降本增效。
定制处理器定制的是核心数目或者核心频率方面,而On Demand服务模式定制的是功能特性,未来,两种定制模式应该会共存。