惠普张楠:《惠普新闪存,定义新元年》

2015年8月5日,由DOIT传媒和存储在线联合主办的2015中国闪存峰会在北京盛大开幕。本次峰会以“闪存加速数据经济变革——颠覆方式和速度”为主题,超过500位各行业用户代表,数十位顶级学者、产业精英和技术专家出席,以圆桌讨论和主题演讲等形式,从不同角度深入探讨“闪存加速数据经济变革”这一话题。

在下午的主题演讲中来自中国惠普存储事业部的首席架构师张楠先生发表了题为《惠普新闪存,定义新元年》的演讲。

以下是演讲实录:

张楠:大家下午好,大家还有印象的话,我相信在座所有人都参加了我们上午的主要的会场。一开始有华为的同事、戴尔的同事,我们惠普这边也介绍了一下闪存的新的产品、技术、市场等等。

其实我关注闪存很久了,闪存峰会在中国也不是第一次,去年、前年陆陆续续有一些闪存的介绍。两年前的时候我们开始在市场大力推闪存,那时候推闪存还是很难的。很多用户想去用闪存的话总有一个担心,比如寿命,比如闪存的成熟度是不是足够成熟,行业内是不是有足够多的用户去有。到今年尤其是到下半年的时候再去看的话,闪存的量已经起的太大了。一会我有一些数据给大家看一下,到底市场的闪存是什么情况,这些数据也的是第三方,有的是我们惠普内部的销售数据。可以给大家看到其实闪存真的已经大范围取代一些机械硬盘。

去年下半年的时候从惠普我们销售的企业级的存储里面,我们的SSD的销售的容量已经在去年年中6、7月份开始超过15000兆的机械硬盘的出货量。去年下半年越来越多的闪存替换掉了15000兆的硬盘。你跟用户谈的时候,很多用户谈我买15000兆,主流是600G盘子,盘子小,故障率很高。用SSD的话用10块盘就够了,性能满足,故障率低了。我从去年下半年拜访山东、上海、内蒙的证券行业的用户,他们需求太大了。他们买闪存阵列毫不客气买,一开始买一两台,近期看到用户一次买十台以上的全闪阵列。现在券商交易量太好,相对来说行情比较好。

我跟券商聊,每天交易费就是7500万,他们手里有大把的钱,他们需要就是速度,需要一个性能。为什么很多人关注闪存,关注SSD这块的市场。

我们总讲谁会被谁淘汰,是不是SSD会把机械硬盘淘汰?是不是以后的企业级存储会被其他的架构或者领域所淘汰,这个很难讲。目前市场是这样,以后未来市场是两块,一块是我们固有的传统用户用的核心存储系统,大家都在看的厂商卖的核心存储系统。一块是增长非常快就是软件定义,软件定义是基于X86的平台,加一个用户就可以把大量非结构化的数据放到里面,未来市场上非常有前景的这么一块市场或者架构。这个架构各个厂商都在往里走,这两个领域里面SSD都是不可或缺的一部分。无论你是企业级的市场还是说我们这种非核心的软件定义的架构,这两部分市场其实对于SSD的需求都是非常大的。

另外我们这里有一组IDC的统计,从存储介质出货量来看,上午提到说从12年开始机械硬盘性能就没有再提升,用户想把存储瓶颈去掉,改变硬盘是最快捷根本的方式。闪存整体需求近几年成年倍增的趋势。现在我们在惠普每卖出一台中端阵列,中国区,平均会带四到五块SSD。16年底闪存单盘容量比机械硬盘大8倍。如果是SSD是4T,马上就有8T甚至更大的盘出来。容量上SSD会非常快的去增长。

下面这个是整个全闪存阵列的市场的增长,基数没有那么大,但其增长是非常快的。为什么那么多券商、小金融用户、政府、制造行业用户、铁道、交通等等这些用户他们对全闪存阵列需求非常大。另外就是对混合阵列的需求越来越大,蓝色传统纯机械硬盘用户相对来说这个市场份额所占的比例会越来越低,这也是一个现状。

之前我们也听到包括刚才上一个讲师讲的SSD是有寿命的,你说SSD寿命是几年?要看用户的具体情况,看你怎么用SSD。我们一般说用户拿一个磁盘阵列买过来使用到被替换掉一般生命周期是3-5年,有的用户长一点6-8年,最多10年。很难说用一个磁盘阵列用10年以上,有,但是太少了。SSD寿命是多少,以前选SSD的时候,3-5年前惠普卖的SSD都是SLC,MLC、TLC,TLC对低端一些,不讲。我们看MLC,以前说SLC大家都知道很贵,寿命很好,性能很好。现在你不需要去用SLC,没有必要,你花很多钱买SLC,这个盘别说十年、几百年可能都写不坏,你业务模型是这样的。

惠普我们对用户很负责,我们做了一个统计,几乎在全球每卖出一套我们的设备就会连到惠普美国的响应中心区,所有卖出SSD都会对这些SSD的盘进行监控,我们会抓到SSD的使用情况。这个抓取的信息在中国以外的地区抓的非常好,但是中国区稍微差一些,因为中国的用户比较传统。不太愿意把磁盘阵列挂到公网上连网线连到网上传数据。中国区的数据比例低一些,但总体来说情况是这样的。

我们看过去12个月惠普销售MLC的硬盘,用户SSD对寿命的磨损不到0.7%。这是真实的例子,我问过后台,他们说大部分用户使用SSD之后解决的问题是取消或者消除存储瓶颈。并不是SSD比机械硬盘好几十、上百倍,换成SSD就能达到几十、上百倍的效果,你的瓶颈一开始在存储上。你把存储瓶颈消除之后,你需要解决下一步的问题可能是网络、总线、应用、数据库等等这些可能是你的问题。你换成闪存之后,你以前机械硬盘可能跑200个IO,换成闪存之后我们会发现平均用在每个闪存上面IO数量大概可能是500-1000个比例。这样的擦除写的频度,不要说五年,你就是写100年时间,你SSD不会被写掉。任何闪存颗粒都可以叫ELC、MLC,只是上面芯片不同而已。SSD寿命对企业级用户,对现有业务来说不用担心未来几年之内这个盘会被写坏。

另外一个技术点我相信大家对这个可能会有一些熟悉,如果了解惠普存储的人就会知道,惠普在底层虚拟化做的非常好,三块是鼻祖。

传统的磁盘阵列做的都是这样,我选十几、二十块做一组RAID,在这组RAID上做一个应用。惠普研发出了这样的技术,我们做底层虚拟RAID。有的厂家学了惠普,改了几个RAID名字放上去,其实技术来源是惠普的。

这种虚拟化的RAID,跨越多块硬盘的RAID技术有一个很好的优势就是把热背空间做成虚拟。用户买了8块盘,厂家说你要多买两块,这两块盘是热备盘,坏了的话可以拿两块顶上。SSD的话就会有问题,SSD很贵,你买10块盘,还没开使用,20%的盘废掉,因为他是热备盘。我们的方案很好,我们惠普的技术保证你百分之百用你的硬盘资源,你买十块SSD,都会给你用起来做数据,这是我们优势之一。

上午徐总给大家讲到说我们有一个OP的技术,可以改善SSD的使用率。这个技术其实真的很好,现在只有惠普有。为什么?大家还记得我讲了我们是用热备空间做的,如果你有十块SSD的话,我们在每块SSD上都会开辟一个空间做热备。如果坏掉一块盘,热备空间剩下9块盘会帮你重建那一块盘的数据。你没有坏盘的时候,热备空间就是闲置状态。SSD的故障率比机械硬盘小很多。通常热备空间在SSD上,我们的技术里这个区域平时是闲置。我们想了一个办法,把这个区域和SSD的原厂盘做了一个结合,告诉SSD盘,这个区域我现在不用,我让你把这个区域变成OP。就是为什么惠普的SSD存储的空间利用率非常高,没有任何浪费。即使热备空间都要把它利用起来。你业务压力很大,我可以把OP调的很大,30、40、50。OP越大,理论你的性能越高,你的磨损、寿命更长。

另外大家记得上午提到闪备的名字,大家知道用户用闪存存数据相对来说这个数据一定是比较重要。.COM的用户除外,因为他们通常用闪存卡的方式做。只要你是拿磁盘阵列这种架构做闪存,这个数据一定是很重要,用户一定考虑做备份,这是百分之百。他们做备份的时候就很有可能会影响到这个数据的性能,传统的备份方式一定是通过存储到你的应用服务其、数据库服务器,把数据备出来三角的关系。

现在我们用一个新的技术,好处是我可以不通过你的应用服务器,你的备份服务器,可以直接把你的数据拉出来,通过你的散网络把数据从存储里面、闪存阵列里面直接拉到备份里去了。相当你的备份设备和你的存储设备、闪存设备之间是打通,我可看到你的数据,我隔多少分钟做一个快速的备份,差异备份,这个效率太高了。

这种做的好处第一速度快,第二节省成本。现在这一部分你不需要备份软件了。对于存储上的数据备份,你以后真的不需要备份软件了,这肯定也是未来发展的方向之一。

大家记得上午讲说发布高端存储,可以支持多少万的IO,多少延迟。我在跟很多用户聊的时候,这个数字很容易做到。很多厂家只要你有足够多的盘,足够多的CPU多可以做到。这个数字是很难做到的,你想做到0.2毫秒的延迟,在一个磁盘阵列上去做,这是非常难的。他一定要有专门对闪存的优化以后才能够做到。

我跟用户聊,你要看一个存储性能,不止看他的IO,还看他的延迟。对交易所高频交易延迟对他是更重要的。十几一年前很多厂家,终端厂家都会有ASIC,今天会看到很多厂家在弱化ASIC,或者只有高端产品才会有ASIC,ASIC研发成本很高,每一代产品更新的时候ASIC先要做压备。很多厂家慢慢会去掉ASIC。在3PAR上我们完整的保留了ASIC,我们全系列的平台,包括我们的全闪都有ASIC。ASIC好处是什么?我们一直在讲重删的设备,重复数据删除是标配。如果你连这个功能都没有,他不应该被称作为一个全闪。因为闪存相对来说是很贵的,你不能在上面删除重复数据,保留唯一数据的话,他只能是一个传统的阵列。

当你有了重复数据删除以后,重复数据删除对CPU的消耗非常高的。大量哈希算法还有比对、删除这些都由CPU做。我们全闪有一个非常好,我们有ASIC芯片,重删的工作交给ASIC做。我们英特尔的CPU很闲,我们的性能做的这么好,延迟非常低的原因就是有这样的ASIC的芯片。

另外我不是夸惠普的全闪,大家看整个全闪存市场上会发现一个特点,很多厂家为了推出全闪,单独做了一个产品,一个平台或者一个系列。跟他的主存储是完全分开的,管理上、硬件上、功能上。你很难看到这些厂家全闪阵列具备这些功能,看到这些功能这是一标准的磁盘阵列具备的功能。其他厂家的没有这些功能,他要做容灾,必须借助第三方软件和硬件实现,比如容灾所有的事情。

我们做到所有功能在全闪上都实现:

第一删这个功能是通过ASIC做的。

第二是闪存的优化,你叫全闪存阵列,总有一些内容是要比传统的方式要有优势。首先是性能有优势,你的读写操作上,里的底层有特别的设计。传统磁盘阵列不可能把页分的很小,因为机械硬盘的转速和IO的问题,一般转速页都是64K左右。我们的闪存优化里可以做到只有4K大小,很多数据库是4K或者8K。一个数据库操作Oracle数据库操作过来到全闪存阵列之后,直接落到盘上就是8K。这针对数据库优化过的阵列。

第三我们支持一个新的功能就是vVols,VMware存储的和W管理和VMware总是脱离。用户创建虚机的时候好几个文件,就存在于后期存储一个卷上。对用户来说感觉非常不好。当他做一些优化的时候无法进行一些调整。VMware的vVols功能出现之后,它在存储管理上非常好。用户在VMware创建一个虚机,后面可以创建四个卷,分别是控制文件、配置文件、交换文件、数据文件。后面存储自动打开,VMware和存储之间可以完美配合。这个功能在业内所有的全闪存阵列都是不支持,但是3PAR可以支持。

第四我需要在一台设备放五个业务,可能有两个业务非常核心,不能被剩下三个业务影响,可以设立优先级。这个业务可以保证三个GB带宽,一千或者一万个IO。剩下三个业务就是优先级比较低。这三个业务,突然一个人往里拷一个电影,可能会影响这两个核心业务。遏制这边的写,确保这两个业务的IO和性能。这是在全闪阵列里面非常好的技术。

我们讲融合是关键,现在越来越多的用户会觉得存储的管理越简单越好。没有人关心存储怎么管理,大家都许多存储管理一个人能管理所有的事情最好,数据量太大,存储设备太多。我们一直强调你的数据应该可以在存储之间是无形的平滑去移动。如果大家想一下以前大家都怎么去做。买一个网关,存储与存储之间上面加两个网关,然后把数据拷来拷去,做存储资源池的管理。性能下降,管理复杂,风险又高,这是很多用户面临的问题。我们举到国网的用户,他做了很多类似的事情,用户非常痛苦。

今天我们做的事情要让所有存储打通,所有数据都是可以移动,存储与存储之间移动,不需要再通过网关做。降低成本,减少维护,降低风险,性能不受影响。另外真正的融合,再一个设备商可以支持文件、NAS、块、对象,闪存都要这样做。

用户说我现在已经在用一个15000转的机械硬盘,我想上一些闪存,不一定买闪存阵列,就加一些SSD的盘。我没底,我不知道加SSD盘之后到底性能能提升多少?到底重删的比例是做到1:3,1:10还是1:1,一点都删不了,这个事情可以做评估。惠普的产品有这样评估能力,评估是免费的。如果你是我们惠普的用户,我可以帮你做评估。你现有的业务加了SSD之后,我可以在很短的时间内帮你算出来,你过去的业务模型可以帮你算出来。这个数据在机械硬盘上迁移到SSD上,这个重删是1:5或者1:6。有的用户说我想做分层,加SSD做分层,热的数据放上面去,冷的数据放下来。我可以告诉你需要加多少的SSD,你多少的数据量放到SSD上面去,你的性能能提升多少,有多少的IO会发生在未来得SSD上,我们都可以告诉用户。这样用户就会非常有底,不会不负责任说上SSD,也许你的性能会提升,也许你的性能改善不会很明显,我们会明确的告诉用户。这也是惠普用户能够真正的得到实惠地方。

很多厂商销售直接卖给用户SSD,性能改善非常有限。你用惠普的SSD之后,性能能提升多少可以明确告诉用户。

上午我们还提到六大超越,基本涵盖我们所有产品的功能,这里不讲了。上午我们讲到见未来,今年真的是惠普的3PAR定义企业级闪存元年,开创一个先河,高端市场上有第一款全闪存的阵列。我们也希望在座各位无论是我们的媒体朋友,还是我们的用户还我们未来的客户,都可以从3PAR上能够受益,我的内容就这些,谢谢大家。

欲知更多关于2015中国闪存峰会的精彩内容请点击查看闪存峰会全程直播报道专题。