自主可控的华为存储硬件平台

英特尔(Intel)创始人之一戈登•摩尔(Gordon Moore)提出摩尔定律:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔18个月翻两倍以上。这一定律揭示了信息技术进步的速度。

摩尔定律促使所有的硬件设备供应商必须赶上甚至超越IT技术的更新速度,传承华为公司一流的硬件设计能力的华为存储硬件团队肩负重任,不论技术如何更新换代,一直追求打造自主可控的存储硬件平台,因为这是技术制胜的关键。

华为存储硬件平台总述

经过十年的努力华为推出了以T系列为代表的中低端SAN/NAS统一存储、N9000为代表的高端NAS存储、HVS为代表的高端SAN存储、UDS为代表的海量存储产品系列,而在这些产品的背后离不开强大的存储硬件平台的支撑。


 
图1 华为存储硬件平台

华为打造的存储硬件平台,具有共享性、通用性、扩展性、高度集成性、快速实施性,以及自我完善和演进的能力。对客户来说,这意味着减少产品交付的时间周期,提高产品的稳定性和可靠性。同时其备件的通用性、产品的易扩展性也实现了保护客户投资的目的。

华为存储硬件平台由整机、组件以及底层软件等多重子系统有机结合而成。存储整机包括独立机头、盘控一体、交换机、硬盘框以及机柜等多种形态,构成设备的基本框架。华为的存储整机给人以稳重、可靠的形象,同时具有很好的人机友好性。

组件包括控制器、接口卡、硬盘单元、电源、风扇、备电等关键模块。控制器模块是系统的核心部件,负责数据处理和系统管控,以存储处理器和管理芯片为核心。接口卡的作用是连接前端主机和扩展后端硬盘,以IO控制芯片为核心。硬盘单元是数据的最终载体。电源模块、风扇模块、备电模块分别为系统提供电源供给、散热和掉电保护。在系统中,这些部件都是冗余的,当其中的一个部件损坏后,系统仍然可用、业务正常进行。另外,这些部件都支持热插拔,可以可靠、方便的更换。

底层软件提供服务与接口、存储协议处理、硬件与芯片适配、BIOS、OS内核调试、芯片Firmware、逻辑代码和硬盘应用软件等。底层软件在硬件与存储软件平台中起着至关重要的衔接作用,其本身也能独立的行使一些功能,是存储硬件平台的关键子系统之一。

通过多重子系统集成而打造的存储硬件平台支撑了华为全系列的存储产品。


 
图2 华为存储硬件平台及产品支撑关系

为了打造先进的存储硬件平台,华为在中国总部设有强大的硬件开发团队,为了更好的掌握全球先进技术,华为还在美国硅谷、以色列特拉维夫成立分支机构,构建一流存储硬件专家队伍。正是这些精英团队为华为存储打造出专业的产品形象,先进的系统架构和领先的存储硬件关键技术。

专业的产品形象

华为努力做到由内到外,给客户全方位的产品满意度,因此在外观设计上同样追求卓越。华为公司与国际知名的设计公司Speckdesign合作设计了以坦克装甲(Armor)为主题的第一代存储硬件平台;与StudioRED一起设计了以统一(Unity)为主题的第二代存储硬件平台;与Design3一起设计了以精确(Precision)为主题的用于高端产品HVS的存储机柜。这些时尚稳重的外观使华为存储产品具有专业的产品形象。

图3 华为存储国际化的外观设计

先进的系统架构

华为人深知架构设计与产品规格、性能、可靠性、扩展性、TCO等息息相关,一直把架构先行作为打造硬件平台的一个基本原则。华为有竞争力的产品背后都有一个先进的架构。

华为设计的智能交换矩阵架构构建了真正的集群存储系统,其用于高端存储HVS系列产品。在华为自主研发的PCIe交换机的支撑下,该架构实现全冗余负载均衡,提高了产品可靠性,产品可用度达到99.999%;同时,智能交换矩阵让设备可以从双控制器向十六控制器平滑、可靠地扩展,其最大互连交换带宽192GB/s,最大支持192个主机端口,最多支持64个后端磁盘端口以及3216块硬盘,产品规格达到业界领先;在性能上,该架构支撑最大带宽1024 GB/s 、最大并发1600万IOPS、1ms响应,处于业界领先地位。 

            
 
图4 智能交换矩阵架构

华为的分布式云存储架构通过构建DHT存储环实现了UDS海量存储产品。该架构具有超强扩展性,基于DHT算法原理 ,而DHT环地址空间接近无限,通过调整虚拟节点映射关系乃至扩充虚拟节点数目可支撑物理节点的无限扩展;该架构具有高可靠性,其最大支持6个冗余位,DHT存储环和分布式全交叉互连物理节点还具有多层级数据保护的特性,做到零概率数据丢失;该架构还具有低TCO的特性,其采用高密度设计,每单位空间内的容量和性能极具优势,有效降低数据中心的构建成本。存储节点采用低功耗ARM CPU ,同时支持桌面级硬盘,这些都降低了系统能耗。


 
图5 基于DHT存储环的分布式云存储架构

华为存储硬件的架构设计加入了融合的元素。硬件平台支撑产品业务融合,对于统一存储产品实现了底层硬件的共享性,使块存储与文件存储融合。硬件平台还实现了多位一体,即文件、备份、分析设备的硬件融合 ;在硬件架构上设计了FC/IP网络接口融合以及IO通道的融合。这些融合的架构,提高了产品的灵活性和扩展性,同时降低了成本,最终让客户受益。

领先的存储硬件关键技术

存储硬件的关键技术包括存储芯片的研发和应用技术、硬件加速技术、硬件驱动技术、硬盘应用技术、硬件工程技术等。华为本着打造自主可控的存储硬件平台的理念,不遗余力的进行这些关键技术的研发,冲破技术壁垒,争做硬件技术领头羊。

存储芯片的研发和应用技术  

华为一向重视自主知识产权,自从存储产品线成立开始,就确定了自研关键芯片的战略。2012年,华为发布了第三代SSD控制芯片,可同时支持最新的6G SAS、6G SATA接口,满足2xnm制程的SLC,MLC,eMLC颗粒的企业级高可靠应用。以此实现的企业级SSD盘片,性能达到30K IOPS,功耗11.5W,能效比较同等价格的SAS 15K盘片提升95%。2012年Q2,华为发布基于第三代SSD控制芯片构建全固态存储系统 Dorado 5100系列,并在SPC-1测试中获得600K IOPS的骄人成绩。

对存储芯片,华为不只停留在简单的应用层面上,而是主动和Intel、Micron、Seagate、PMC、LSI、PLX等芯片厂商建立战略合作关系,共同研究存储芯片的发展趋势及其应用。在16G FC、12G SAS关键技术的预研过程中,华为根据自己的研究成果,与芯片厂商进行技术交流,促成了设计优化,最终实现了芯片厂商和华为的双赢。

硬件加速技术

存储设备要具备关键的数据处理能力,比如重删、加密、压缩等技术。借助这些技术可以提高存储系统的效率以及数据安全。比如重删,业界友商有两种实现方式:一种是通过纯CPU来处理数据,采用这种方式CPU占有率高达95%以上,这会使系统被拖累,其它业务难以为继。再者,为了使重删达到一定的性能,必须使用昂贵的高端CPU,这种成本必将转嫁给客户;另一种是使用专用的De-dup卡来实现,也就是硬件加速技术。友商De-dup卡普遍采用SHA-1计算,只是卸载了CPU的部分负担,系统CPU占有率仍高达85%以上,在系统执行重删任务时,对其它业务仍有较大影响。

华为开发的Ded-up卡使用最先进的逻辑器件进行编程,提供了16个变长分段和SHA-1计算引擎,在双控制模块双卡的配置下,重删性能达到友商的2-4倍,而且几乎完全卸载了CPU的负担,实现真正的硬件加速。功能更为强大的动态重构多功能加速卡可作为板载FPGA、扣卡或服务器标准卡使用,实现重删、压缩、加密算法三合一,可根据业务需求快速切换,切换时间<10ms。

硬件驱动技术

如果说硬件提供了强壮的躯干,驱动则提供了流动的血液,刚柔并济,让硬件平台可信可控。业内一些存储设备制造商底层软件的研发能力薄弱,依赖芯片厂商支持或采用一些简单的开源驱动,这必然导致驱动功能单一,硬件性能难以发挥到最大,系统的稳定性也难以保证。

华为自研的存储驱动,基于组件化的协议与公共处理,通过插入硬件与芯片适配层和接口适配层,实现硬件与芯片差异的解耦,及不同产品上层接口的解耦,这使硬件平台实现了对产品业务的融合,让一个硬件平台能支撑多产品。

自研存储驱动、自研BIOS、自研OS,再加上芯片及FIRMWARE的自研,组成了一个完整自研链。在此背景下,存储硬件平台能够根据业务特性自如的运用芯片并进行链路的可控处理。驱动在业务链路上采用了防闪断技术,当链路发生闪断时,驱动的容错机制保证IO不会中断;驱动提供链路误码监测与隔离,保障业务数据可靠性;驱动采用中断聚合技术,与芯片交互,减少进入中断的次数,从而降低系统CPU占用,提高性能。

硬盘应用技术

目前业界的一些友商在硬盘的应用上缺乏系统化策略和技术能力,比如没有硬盘的访问优化,不能保证业务流控和硬盘的均衡使用;在硬盘故障处理方面缺乏精准细致的手段,很难保证硬盘的高可用性;没有进行硬盘的节能设计等。

华为经过长期的技术积累,打造了一个完整的硬盘应用技术体系。其利用自主研发的硬盘可靠性专用软件进行硬盘的接入配置、访问优化、运行管理、诊断预测、容错恢复和隔离离线。这些功能强大的软件促成了对硬盘的优化使用和闭环控制,实现了可信可控。


 
图6 华为存储的硬盘应用技术

硬件工程技术

硬件工程技术,很多友商没有形成系统的设计能力,为减少研发投入,甚至采用外包的方式来进行支撑,这很难使产品在规格、性能、可靠性方面形成竞争力。

华为素来有很强的硬件工程技术能力,在散热设计方面,其板级散热技术、热管和VC散热技术有效提升大功率芯片(如CPU)散热能力,提高设备的业务处理能力;采用新型高效风扇提高系统散热能力和效率,使设备更加节能;通过降噪模块的设计,显著降低系统噪音,提高客户感受度。

华为在硬盘的减震设计上有独特的技术积累,利用先进的仿真技术进行专业的抗震设计,获得专利,使硬盘故障率降低50%。华为采用的防腐蚀技术在业内独树一帜,通过专利的在线腐蚀监控技术提前预警数据中心腐蚀风险,通过专业测试设备快速量化数据中心腐蚀物等级;通过联合硬盘厂商采用ENIG/SPV工艺,有效的提升了硬盘在污染环境中的寿命和可靠性;通过防腐蚀工艺结合温升、电压分布设计进行局部防护,有效的提升了存储控制模块在污染环境中的寿命和可靠性;通过在机框加装防腐蚀过滤器的专利技术解决机框级腐蚀问题。

展望未来

回首过往,华为在存储硬件的自主研发之路上取得了丰硕的成果,存储硬件平台的可信可控也经历了考验。未来,存储设备的硬件形态将会进一步发生变化,而华为将一直坚守打造自主可控的硬件平台,并做好技术积累。

用户对分布式存储系统的需求将会越来越大,低功耗、高性能、易扩展的控制节点设计将是一个关键。华为存储硬件已经在分布式架构设计获得经验,并启动芯片自研。节点互连将是分布式系统的关键技术之一,高性能、低延时的全互连或交换架构将是重要课题。而华为存储硬件团队已经掌握了PCIe光互连技术,在Infiniband互连及RDMA技术等方面进行技术积累。

硬件融合的趋势也越来越明显,华为目前的存储硬件平台,已经支撑了一些存储业务的融合。在IO接口和通道方面,也将采用融合架构。另外,硬件平台均支持Scale- Out,能够支持从低端产品到高端产品的硬件归一,实现融合。硬件融合对用户和存储设备供应商来说是双赢。

华为将在打造自主可控的存储硬件平台方面继续创新进取,为客户带来更多价值。