HDS存储经济学:经济学化的存储思考

DOIT原创报道:三年三届中国用户大会,日立数据在2009年的中国用户大会上,收获的是近千人的参与听众和数十家媒体的新闻报道,以及自2000年前后进入中国之后,在金融、电信、电视台等多个高端行业获得的巨大成功–仅仅是2008年刚刚推出的AMS2000,其所服务的客户仅在电视台一个行业上就已经达到了数十家之多。

或许HDS对此已有所预见,2009年的日立数据中国用户大会的规格自三年前举办中国用户大会以来是最高的,包括公司首席执行官Jack Domme、亚太区总经理Kevin Eggleston以及首席存储经济学家David Merrill和中国区总经理柯愈强在内的HDS高层悉数出场–公司CEO、亚太区总经理、中国区总经理加首席存储经济学家在内的四人团队出现在大会现场至少也能说明两个问题:第一,HDS对中国市场的重视程度已经在HDS占据主导地位;第二,HDS将"存储经济学"拉近存储市场的决心是非常大的。

HDS 首席执行官 Jack Domme

在独家采访Kevin Eggleston时,我问他:"你觉得为什么会有这么多人来参加这样一场由一个独立供应商举办的活动?" Kevin Eggleston的回答是:"第一是因为我们的技术,技术吸引了许多的人,另一方面是我们来自这里是来听取客户的意见,吸取他们的经验。"

不过,对于这次的HDS中国用户大会来说,人们更多的惊奇来自于David Merrill和他的"存储经济学",对于这样的一个人和一个职位来说,此前不仅从未在存储行业有所耳闻,更没在其他的行业出现过服务器经济学家、数据中心经济学家或是网络经济学家–将存储和经济学挂钩在一起着实是一件不可思议的事情。可参见《存储经济学:降低总体拥有成本的四项法则——日立数据系统首席存储经济学家 David R. Merrill

当然,如果你对此有所了解之后,相比对此就不会这么吃惊了。

存储经济学:将存储与经济学一一对应

作为日立数据系统的首席存储经济学家,David Merrill身上有两点十分引人注目:第一,首席存储经济学家到底是一个什么样的职位?第二,这位首席存储经济学家到底研究的是哪些内容?

"在了解Merrill的工作之前,我们有必要先来回顾一下"经济学"的三个前提:

1、资源的稀缺性是经济学分析的前提。所谓资源的稀缺性是相对于人们无穷无尽的欲望而言的。

2、选择行为是经济学分析的对象。带约束条件的选择行为是经济学研究的中心。

3、资源的有效配置是经济学分析的中心目标。这里的有效是有效率,不是有效果。经济学考核是否有效的标准是看收益是否大于机会成本。

–对于存储来说,我们可以就此对应三点内容:

  • 1、 存储的资源、企业的存储支出是有限的。
  • 2、 企业在采购存储时,受到多方面的制约(考虑)因素,而如何去选择最好的存储,是非常重要的。
  • 3、 存储资源的有效配置,高效率的运行和利用是整个围绕存储的话题的中心目标。"

通过以上对比,我们就能够很好的理解为何存储和经济学能够进行对比和整合,并成为Merrill的工作–专注于战略规划、高级存储架构和存储经济学。

事实上,Merrill的工作所体现的,主要是预测高级存储架构的投资回报率和总体拥有成本,并就此将存储经济学扩展到包括存储经济学、计量经济学、存储基础设施运营成本缩减,以及存储结构规划,此外还为存储业务、组织和架构撰写组合方案和咨询开发建议,为SAN和企业存储管理设计架构方法提供最佳策略。

因此,我们能够很容易的理解Merrill的工作和其所提出的"存储经济学"的概念,即:

"存储需要考虑其所承担的经济压力,并因为这种压力,需要与经济的发展趋向同步发展,而不是背离一般经济学规律。"同时,"存储经济学需要考虑从整体拥有成本到整体投资回报率的全面的企业存储经济环境,向企业展示其真正的存储经济环境而非部分的存储经济现状。"

最后,在理解存储经济学的基础上,制定存储采购、利用、回收的囊括整个存储生命周期和企业采购周期的方法论,更好的指导已经占企业IT支出越来越多,且肯定会无限膨胀下去的存储采购–尤其是"目前是处于经济危机中,我们必须要看到数据在高速增长,如何以新型的方式去看存储、看数据管理。"Merrill表示。

存储经济学:与社会经济学有不同之处

虽然存储经济学在经济学的三个重要方面和一般我们在学校所学的社会经济学有完全一致的地方,但是,就单独的经济学范畴和经济学研究个体上,存储经济学仍然有其独特的地方,对此,Merrill举了个很形象的例子:

“举个例子,拿美国总统来举例子。在我们总统的国家数据库中,存储在克林顿总统的时候是3个TB,布什政府的时候是146个TB,再看奥巴马总统不得了,在各种各样的网站上这样的数据是无法计量的,所以我们觉得应该是一个PB级的有关于奥巴马总统的数据。如果要看这样的架构,有不同的行为方式,因此这种经济性与我们目前所了解的经济性是完全不一样的。”

根据Merrill所引用的分析机构IDC的资料,在很多年之前,大概是10到12年之前,硬件的支出占总的存储的成本的大部分。但是到了现在,其实存储购买的成本只是总拥有成本的一小部分,可能也就20%,或者是15%。所以,如果我们只是看存储的成本的降低,这只是解决了一个大问题的小部分。我们要看的是总拥有成本,比如说管理的成本、人工的成本、电费。存储的成本,这事实上本身购买成本只是总的拥有成本当中的一小部分。

HDS 首席存储经济学家 David Merrill 发表主题演讲

Merrill表示,目前存储市场上的供应商和客户都应该看到的非常重要的一点是,也就是从经济的角度来讲是与众不同的架构–Merrill谈到,”在过去的8到9年中我们有各种各样的领先结构,比如说企业级的磁盘阵列有存储、局域网有NAS、存储网络等各种各样的结构。我们所使用、所打造的2003年、2004年的存储架构,无法满足到目前非结构化数据的增长的需求。而且也无法满足我们目前在成本控制方面的要求。”

Merrill认为,这就是存储经济学目前遇到的最大的问题:无法拥有一个能够满足包括成本、可靠性。可用性在内的多种需求在内的可持续的符合”存储经济学”的发展战略。

33项成本类型:经济学需要定位自己的研究对象

Merrill令人吃惊的列出了33项不同的存储成本类型–幸好他没有说CIO应该对这33个类型全都予以100%的关心。

从经济学的角度来说,经济学的研究对象是互相具有关联性的,而非割裂的个体,而不同的经济学分支拥有各自不同的研究对象,但是,无论是产阶级经济学家还是马克思主义经济学家,对于经济学有一个共同的看法,那就是”经济学一定要有一个明确、清晰的研究对象”–因此,33项成本类型就构成了一个完整的存储经济学的研究对象。

“我们必须了解,使用这个存储设备用一年成本是多少,很多人不知道这怎么计算,不知道是什么意思,他说我在这个技术上花了多少钱,但是并不知道去运转这个存储。比如说三到五年要花多少钱,这种成本是很重要的。我们有时候无法获知这样的信息,因此无法做出管理和经济上的决策。因此,这里谈到了如何去让你的存储更加经济化、优化,如何呢?这就意味着你必须知道到底在存储方面要花哪些类型的成本或者是钱呢?”Merrill表示,CIO们应该了解”购买的成本”–CIO们得看维护费用、动态、备份等等各种各样的成本,我们要看到整个资产的生命周期所带来的成本,因此,需要用ROI投资回报和TCO总拥有成本以及其它的方式来展示完整的存储经济学。

在大会演讲上,Merrill对与会的嘉宾(其中有大部分是企业的IT人员)表示:”你们要去决定这33种成本中哪些对对来讲是重要的,然后你们进行一个TCO的计算,建立一个模型,计算一下到底一个TB的磁盘要花多少钱。通过这样做,我们可以开始理解钱到底花在哪里去了,是劳动力?还是在配置的时间上,还是备份的成本或者是硬件的维护?软件的维护?到底是拷贝的成本等等。”

David Merrill:HDS能做什么?以及 HDS在做什么?

除研究对象和三大前提之外,经济学的另一个显著的特征是,研究经济学一定要采取科学的研究方法,”经济学家使用的方法在很多地方和自然科学家们使用的相同,为了解释和预测,经济学家建立了一些经济模型,用以表示各种经济现象背后的经济关系。”

因此,研究经济学,一个有效、完整和可信的经济模型是必要的,当然,一个经济模型的有效性还要接受来自于实践的检验。经济学家要根据是否成功地解释和预测现实经济现象来对模型进行评价。如果预测是错误的,首先要检查推理是否正确;如果推理正确,那就必须对模型进行改进或用其他预测更为准确的模型来代替。有时尽管模型的预测不准确,经济学家也想把这个模型保留下来,因为它有助于深入考察经济的运行。

对于HDS来说,33项成本类型已经成为了奠定一个经济模型的基础–作为一个经济模型或者可能的数学模型,33项成本类型奠定了模型的”因果关系”,这33项成本模型正是整个经济模型中影响存储经济学走向的33个”成因”或者说是33个变量,通过一些系数的推倒,它们将很容易的推导出一个最后的结果:存储的成本到底有多少?

但是,这样的理论方法显然对企业管理者们没有什么用处,更有用的是HDS的技术、产品、方法论和咨询服务团队的能力。

日立数据系统存储经济学方法论、模型和工具以总体拥有成本(TCO)、投资回报率(ROI)、资产回报率(ROA)以及其它财务和经济原则为核心。

Merrill就此谈到:”我们有一些技术、方法、工具,我们也有这样的咨询来帮助你们提供业务上的案例,帮助你们表明虚拟化的技术、动态的配置、或者是一些精简的配置,还包括一些回收的存储,怎么样给你提供一个回报期或者是节省了多少的费用。我们会有这样的计算,涉及到单位成本的降低包括这样的一些Jack Domme也讲了会对企业有什么样的意义,也有很多的案例,我们可以帮助人们并不用增加一个磁盘,5个月、8个月不用买,这是长期的。这是为什么我们不向你们卖更多的磁盘,这是我们希望帮助你们利用现有的投资做得更多一些,现在的经济很困难,我们也面临了非常困难的经济,希望中国比其他的全球国家发展得更快,希望你们引导着世界的发展。但是对于每个公司来讲,都面临了非常难的经济的决策,投资的决策,IT的决策,我们必须要使用经济的办法给你们提供一些战略。”

但是,由于往往在经济学模型和数学模型中,存在无法预知的变量–对于,存储来说,或许这就是用户的使用方法和数据量的变化,(当然,从所举的美国总统的例子来看,Merrill对此认为是无法预估的,但是从计算数学的角度来说,是可以获得多个解,或是一个存在于区间范围内的多个解的,不过对于企业社会来说,显然多个解是无法接受的,只能取优。)

对此,Merrill举了个HDS亲身遇到的例子。

“我举个例子,这是我们所做的一些客户,我们差不多已经在全球做了700个项目,我们也是非常积极地,尽可能取的亚洲地区的例子。这是来自于北美尽可能大的金融机构,几年前我们做了分析,预计虚拟化、动态分层差不多14个月、15个月能回报,最后我们错了,3个月就回报了。客户非常惊讶,但是成本的节省我们是为他们看到了。我们回头来考量一下成本的影响,以及他所节余的成果,通过动态的分层和虚拟化,我们客户做的虚拟化差不多是4年前做的项目。”

根据Merrill的介绍,这是HDS在做虚拟化早期的客户:”他们是叫做单层的现在变成多层的存储,来降低这样增长的成本,我们去给他们展示了一些节省,从存储的管理。还有一些节省是来自于劳动力的节余,还有管理存储的一些费用的节省。还有减少停机的时间,还有包括对环境的节省、备份成本的结余,他说这都是钱的非常重要的投入。差不多有32种情况,我们进行了节余,回头来看结果是保守的结果,我低估了了实际当中能做的节余,包括备份、恢复、容灾、劳动力方面的成本都下降了。能够少用人去做更多的事情,这是节余之后不需要那么多的基础设施,不需要那么多的人,不需要那么多的硬件、软件,回报期差不多是12个月到13个月,实际的结果是比这还短的回报期。”

根据Merrill的完整介绍,关于存储的经济性,第一,价格并不等于成本。第二,价格并不等于成本的话,什么相当于成本。HDS定义了几种不同定义的成本,这是为了了解创造机械的时候。第三,HDS鼓励客户去创造一个经济上的底线,要拥有的存储每年要按照容量花多少钱。还有经济上一些非常优越的存储的架构,这些新的架构非常重要的进行投资,即使在经济不好的时候也一样。

当然,Merrill也不忘了为HDS做些更多的”广告”:”HDS这里面帮助你们有这样的流程,我们有差不多十年的经验。我们有一些工具、白皮书、案例的研究、成果,还有我们的服务,还有我们的专题讨论会,帮助你们搞清楚你的成本在什么地方,以及什么样的类型资金你能够来使用,鼓励你上我们的网站去下载某些文件、案例、工具,然后再来找到我们,今天可以交换一些名片,我们可以给你们提供,帮助你们搞清楚成本所在,以及你下一步怎么样去做。”

针对中国的客户,Merrill表示:”希望中国能够引导经济的复苏,会有这样的经济上的决策、存储的决策或者现在去做,或者今年去做,你们需要做出一些决策,给你们提供一个更好的经济的复苏。你们有这样数据的增长率,还有一些决策去购买不同的存储产品,我鼓励你们去看看经济上的存储架构,不同的观点怎么样考量存储的效率,并不是从管理的角度、技术的角度,因为从经济角度要加以考量。”

从客观的多方面了解存储经济学

不过,对于存储经济学的某些内容,实际上我们还需要从更多的方面去看。

尽管经济学和自然科学使用的模型相似,但经济模型并不像自然科学中的模型那样可以作出准确的预测,主要有以下两个原因。

经济学中不可能做有条件控制的实验。物理学家建立模型后可以用严格控制条件的实验室实验来验证,然而经济学家在研究经常变化的环境和个人、团体、机构等之间复杂的关系时,为了发展合理的简单化模型,他们不得不做简化的假设,比如一个常用的假设是”其他情况保持不变”。然而,与物理学家不同,经济学家事实上不能让那些被假定为不变的有关条件保持不变。

从这个意义上说,经济学有点像气象学等一些自然科学。由于众多因素影响气象系统的过程和发展,气象学家不得不做出各种简化,以便得出较为简单的预测。不过,随着近年来卫星和计算机的使用,大气预报越来越精确。在经济学中也是这样,在计算机协助下,经济学家发展了更复杂的模型,从而增强了经济学的预测能力。

人的行为之间的差异是经济模型面临的又一个严重的困难。尽管在相似情形下人们会做出类似的反应,但这些行为却时常会有一些差异。例如,做投资决策时公司对膨胀率会怎样做出反应?这依赖于公司商业信用状况等不可预测的因素。在经济模型中,人们的行为往往被假定为相同,这就导致模型不可能得出精确的预测。

由于这些原因,经常学中不同的模型之间差别很大,每一种所做假设不同,得到的结论也不同。结果,经济学经常存在着很多争论。在现实社会中,不同的政党可能和不同的经济学思想相结合,左派政党所借用的模型认为要减少失业,政府必须进行干预;右派政党所持模型则认为如果政府减少干预,更多地依赖于自由市场经济,就可以减少失业。

因此,我们必须要了解的一点是:经济学并非是万能的能够解决问题的,其所做的更多在于”取优”和”去粗”,而非提供一个”唯一的解决之道”,尤其是,从另一个角度来说,经济学属于一门社会科学,这也就意味着,存储经济学也应该是一门社会科学,因此,大而全的方法是难以逐一而用的,对于存储经济学指导下的企业存储来说,小而精的令存储更加经济化的方法是唯一可行却又需要付出高昂代价的。

既然是社会科学,显然就应该了解中国的社会文化和学科演进,好在Merrill对此已经有所了解,他表示,”中国的文化是这样的,你们要求长期地不断地降低成本来达到我们的路线图。”因此,Merrill自己表示,对于长期来说,存储经济学是一项长期的战略,Merrill向中国的用户表示:”这样的计划,并不是今年、明年的计划,而是很多年的计划,中国有这样长期的计划是非常著名的,长期的战略和长期存储IT的部署,需要在你IT发展图里面长期的理念,对降低成本和对成本的衡量,还有一些理念是关于归档的,有更好的管理、更好的虚拟化,以及围绕我们考核、考评的办法包括流程等等,这都是长期的目标,这可以带来我们持续的发展,和长期成本的节省。”

附Merrill所列33种成本类型:

降低成本往往是一项架构设计工作而非产品选择流程。定义一种存储架构是否具有优异经济性,在某种程度上取决于它们降低各类存储拥有成本的效率。这些成本类型包括:

1. 硬件折旧(租赁)-每年的硬件折旧成本或每月的租金;

2. 软件购置或折旧 - 每月或每年的软件购置成本。某些软件可能随最初的硬件采购一起提供。

3. 硬件维护 - 所有存储硬件在基础保修期之后的经常性维护或保修成本。

4. 软件维护 - 所有存储软件的经常性维护或保修成本。

5. 存储管理劳动力 - 与各种存储管理任务,如:配置、调试、负载均衡、故障排除和升级等相关的劳动力管理成本。

6. 备份和灾难恢复劳动力 - 除存储管理外,规划并测试有关备份、恢复以及灾难恢复的额外劳动力成本。

7. 迁移,重新配置 - 在存储系统到达寿命时有关数据迁移的各种成本。在大型环境下,数据迁移工作需要不断投入大量劳动力。

8. 数据移动性 - 向不同层次或归档解决方案移动数据所需的时间和工作。与数据重新管制不同,数据移动性在数据生命周期之后,而非系统生命周期之后。

9. 电力消耗和冷却 - 数据中心电力kVA、BTU成本(转换成kW)。电力成本应该包括工业级的空调以及电池或柴油机等后备电力成本。

10. 监测 - 有关存储、SAN和备份平台的SNMP、NOC和运行控制台。

11. 数据中心占地空间 - 每平方米数据中心地面空间的成本。此成本往往包括无间断电源(UPS)和活动地板成本。

12. 配置时间 - 从发出请求到把容量提交给主机这段等待时间对业务的影响。

13. 浪费成本 - 有两种类型:可用却没有分配,分配却没有使用。

14. 拷贝成本 - 数据库管理系统(DBMS)和其它应用往往需要进行拷贝。可能进行层次内拷贝,也可能进行层次外拷贝。测试、开发、质量保证(QA)、数据集市、数据加载程序及类似的应用都需要多个结构化和非结构化数据拷贝。

15. 数据复制成本 - 除多重拷贝外,由于同样的数据存在多个副本而导致的管理成本。这种现象在非结构化文件系统中很常见。

16. 增长成本 - 从根本上来说,每个存储架构都存在增长成本。在高增长环境下,如果采用错误的架构,增长成本会非常高。

17. 计划的系统停机成本 - 微码改变,容量升级。

18. 非计划内的系统停机(与机器有关的)成本 - 发生在存储系统、接口或数据通道的成本。

19. 非计划内的系统停机(与人和流程有关的)成本 - 往往由于容量问题、运行控制和物理阈值而引发。

20. 灾难风险、业务重新恢复成本 - 发生重大灾难事故后进行缓慢或快速恢复对业务产生的影响。

21. 恢复时间目标和恢复点目标(RTO和RPO)成本 - 在系统出现故障或进行备份恢复之后,退回到某个恢复时间(或恢复点)所花费的时间对业务造成影响的成本。

22. 数据损失 - 由于数据丢失、损坏或者无法恢复,对业务和整个企业带来的成本。

23. 诉讼、事实披露风险 - 与诉讼有关的法律风险以及电子资料搜集的时间成本。还包括一般数据定位和恢复工作所需的时间。

24. 减少有害废物 - 主要是由于类似RoHS这样的由欧盟制定的强制性标准所导致的成本(Restriction of Hazardous Substances,限制在电子电器设备中使用某些有害成分的指令)。不符合规定的硬件可能会由于资产处置原因而被征收额外的关税。

25. 性能成本 - 总体存储性能(IOPS、延时、MB/秒)对业务的影响(好或坏)。

26. 备份基础设施 - 用于备份的固定成本基础设施。包括备份服务器、媒体服务器、磁带库及驱动器等。

27. 备份介质 - 用于备份的本地和远程介质成本;经常性成本以及与容量有关的成本。

28. 与备份窗口相关的风险成本 - 缩短或者有限的备份窗口对业务产生的影响。

29. 与CIFS、NFS相关的基础架构 - 文件管理程序、网关以及在企业内提供文件服务器和共享服务所必需的软件。

30. 本地和远程数据电路 - 用于SAN扩展、远程复制及相关软件的暗光纤。

31. 存储区域联网 - 专用的光纤通道、iSCSI或NAS连接基础架构。包括:路由器、网关、主机总线适配器交换机和控制器。

32. 违反相关规定的风险(归档、数据保留) — 多项法律和立法要求(如:HIPAA、Basel II、Sarbanes-Oxley法案、碳排放法案),违反这些法律可能招致罚款,公众形象受损以及被追究刑事责任。

33. 安全、加密 - 与存储基础架构数据保护、安全和加密有关的成本。

上述33类成本并非享有同等的重要性或时间相关性。按照日立数据系统的经验,IT规划者倾向于选择8-15%的这些成本来建立他们公司自己的总体拥有成本(TCO)基线。在所有成本分析中,某些成本属于硬成本(实际预算已经花出,并且可以衡量),而某些成本则属于软成本(难以量化,例如未来潜在的事故成本)。无论硬成本还是软成本,都要根据业务需求被选中并进行衡量。对制定和实施能够降低存储总成本的计划来说,对这些成本进行组织和排序非常重要。如果不能对成本进行衡量,就谈不上改善。