日立数据副总裁兼首席技术官Hu Yoshida:以服务为导向的存储策略

存储在线 10月30日北京消息:主题为"数据无限,管理有方,存储为体,服务为用"的日立数据中国用户大会2008今天在北京召开。会上,日立数据副总裁兼首席技术官Hu Yoshida,讲解了"以服务为导向的存储策略",即大会的主题"数据无限,管理有方,存储为体,服务为用"。

非常高兴能够再次来到中国。可以看到从去年以来,我们在中国又取得了巨大的增长。在这里要做的是会向大家介绍一下对目前商业环境的看法,对整个行业的看法,特别是考虑到现有的经济形势,会看到存储资产和投资的利用率。通过服务导向存储会带来什么样的改进,这样的话大家会很感兴趣,儿童也希望给大家带来价值。

在现今的环境当中,IT资产日益在老化,可以看到很多数据中心已经部署了15到20年了,软件已经10年、12年了。资产的老化是非常严重,如果不进行可能最后一个需要变化的领域是SAN存储区域网。很多投资都已经开始老化了,我们现在的难度是要让使用率提高,但是原来的资产缺乏迁移的灵活性,特别是存储当中都是数据,而一旦你有了数据的存储,必须要保护你的存储当中的数据。直到这个数据再也没有任何的用处,才能把这些数据给销毁掉。

所以,在不同的技术产品线之间进行迁移,这方面的需求变得越来越大,而且我们现在有很多过失的数据,存储资产的利用率很低。很多用户说达到了60%、70%,但是做了研讨之后,利用率只有20%、30%。而且,他们很多数据是有60天、90天之前的数据,而且不会再用了,但是仍然每天都在备份、拷贝。所以,必须要处理这些陈旧的数据,必须要提高效率,必须要进行整合。而且要把归档的工作做得更加有效,对于存储的数据。

在这里刚才谈到了经济动荡,这是我们以前没有碰到过的,这是市场的走势。最新的拿不到了,因为每天都在波动,这是股市的表现,对于很多人个人财富水平,对于我的退休金都产生了影响。但是最重要的一条是息贷有限,不容易拿到贷款。这张图说明了信用风险的变化,双A评级和风险评级之间的信用逆差的上升。

如果来看一下过去一个月,也就是说这个月当中,可以看到这种信用逆差在大幅度扩张,我们叫做"信贷海啸",意味着接待变得极其困难。所以,在这样的环境下在2009年有什么样的期望值,在现有的环境中IT的预算会调低。为了在这样的环境当中做下来,第一点我们要实现整合,整合将会是生存的主要要素之一,我们会介绍一下怎么样帮助这些整合实现。但是对于数据的需求不会减少,对于数据的需求反而会上升,这是监管法律合规的需求也很强。

另外,我们要让运营成本包括数据中心的运营成本和人力成本预先购置相一致,而且运营成本要不断减少,而且要开发新的应用。这里不需要新的存储产品和新的存储系统,而是需要更好的架构来帮助我们应用已经做出的投资购置的自展。

再回顾一下历史,在上一次经济下滑,也就是说互联网泡沫破灭的时候,当时发生了什么情况,我们是怎么做的。当时很多公司做了千年的采购,但是互联网的泡沫就破灭了,有很多存储柜是有1到2个TB的量,每个服务器都接了一个存储柜。

这样的话使数据中心过于庞大,利用率低下。后来出现了SUN的技术,这样的技术可以使我们把6到8个存储柜整合到一起,通过网络同时为多个服务器所利用,同时为数以百计的服务器来进行访问。

另外,每秒千兆传输速度光纤通道的连输也给我们带来了机会,我们要进行光纤架构的投资,而且还有主机方面都做了很多投资。但是当时企业是有钱来做投资的,有可能人们会做出新的资产的投资,并且可以通过投资回报率来显示。当时我们从上一波的下滑当中,生存下来了。

然后我们也看到了其他公司是推动SAN的公司,但是不幸的是这些公司今天已经不存在了。或者是被并购了,或者是破产了。正是因为这些公司是把存储区域网给做起来了,而且让存储柜整合越来越大。

在现在的形势下,对于新兴的公司没有信贷来源了,所以要寻找合作伙伴、创新者来跟我们合作,共度难关,把创新型的解决方案放到市场上。

现在的环境发生了变化,现在的存储柜数据容量能达到10到100个TB的数据量了,也是彼此的交错,想把存储柜迁移到下一代的技术难度越来越大。而且有很多的法规,我们不可能把整个应用停下来进行维护,也就是说对于主数据进行备份,然后进行拷贝,像备份、复制,然后要进行数据的迁移、挖掘,但是所有的这些在进行的时候,这样的话业务的连续进行会带来利用率的问题。

过去的邮箱只有几百个兆,现在是甚至是几千G的存储量了。我们有很多的数据并没有重复利用,但是每天都在进行备份。现在随着Web2.0,不能随机进行迁移,大家可以看到我们资产老化的情况在严重。

下一轮的发展浪潮,是要以一种不中断业务的形式来满足上述的业务需求。现在我们以动态的方式来进行改变。在汽车开车不停车的时候换轮胎,就是非常好的比方。

我们要充分利用现有的投资,几乎没有新的技术采用新的资产,我们要做出新的技术加以最大化的利用。我们要减少运营成本,只有通过减少运营成本,只有让我们的人力、流程更加高效,才能够去带来更多的资金,必须要提高利用率。在下一轮发展浪潮当中必须要快速满足上面的需求。

当一个公司到一个IT部门去说,一个新的市场需要TB的存储量,IT不能说三天之后我给你部署到位,IT部门肯定说马上部署到位。我们有工具能马上做到这样的任务,而且从IT部门的角度来说,IT必须要能够发挥领导力,并且要以大胆创新的形式来采用新的技术。

为什么所中国是激动人心的市场,因为在中国遗留下来的系统没有部署得太多,我们看到了奥运会带来的非凡创新能力和惊人的想象能力。我还在不断地看奥运会开幕式的录像,因为我会看到创新能够做得多么大胆和成功,想象力发挥到了极致。

所以,对于存储行业,今天所面临的行业挑战,分三部分来看。有结构性的数据,有半结构化的数据,像电子邮件,不一定是表格。然后是非结构化的数据,比如说来自于互联网,来自于传感器,比如说射频识别标签,监控器、像医院里面的核磁共振仪,这样的数据增长很快,得到了大量的应用,而且有长期保存的需求。在数据库当中,电子邮件格式的数据量越来越多,而且是充分了有用的数据。如何来解决这些问题,首先看看数据,在数据存储方面浪潮体现在哪些领域。数据是怎么生成的,当用户得到了一个数据卷的时候,他们不知道到底要用多少的数据,在申请存储资产的时候是过度申请,往往是用不上的,比实际资产要多出两到三倍,这样的话造成了浪费。另外我们老在备份,同一个数据备份了20遍,每个备份都分到了用不到的存储空间和存储资产,这样是产生了浪费。然后在划拨过分的存储资产,新的用户不愿意用剥离出来的资产,又使用新的,这样的话原置的就不用了。然后我讲引导时间缓冲,一般的购置是每到三四年购置一次,也就是说,即使存储资产价值每年都在下降,但是做预算的时候是按现在的价值为以后的采购来做的预算。

这样的话,在采购的时候需要提前做好计划。但是,与此同时这种资产的价格是在不断下降的,这就是提前量缓冲的时候造成的浪费。

这部分我想向大家介绍的是预先购置成本,设备采购成本。在这之前有运行的成本,包括环境、散热、冷却、以及变更管理、计划停机当中进行迁移和升级。现在可以看到设备的迁移带来的成本是越来越高。每个数据的迁移要花费一万到两万美元,这是非常沉重的负担,这比购置硬件的负担还高了。

所以,看到运行成本、管理成本将来会两倍、三倍、四倍于初期的采购成本。不仅仅我们要减少初步购置的成本,还要减少运营的成本,要做到这一点的话,我们就要做到存储虚拟化。

存储虚拟化第一部分管理,我们要有通用的流程来管理异构的存储的系统。大家做虚拟化的时候都做到了这一点。第二部分是要求我们进行的存储虚拟化,能够提高性能,带来更多的功能性。提高能力把虚拟化之后的服务再提供出去,这是更难做到的一部分了,因为虚拟化的引擎是需要多方面的。

我们的做法是在一个控制器当中提供虚拟化。在一个并行化的架构当中,进行TB级的虚拟化,而不是需要成百上千个连接点。这样在复制、迁移、备份、资源供应的时候,所有的服务可以通过虚拟化立即的加以供给。

所以,这些框架可以指的是模块化的系统,更低级的一些系统。通过与控制器相连接,他们能享受到虚拟化的服务。从前端的角度来说,不要像过去一样用几个存储单元来做虚拟磁带库,或者是主机或者是磁带库,把它们放在同一个存储平台上,这样的话可以有通用的管理,使用通用的服务,布置到各个异构系统当中,这是未来的虚拟化平台,当然会有新的技术部署到这样的平台当中。

最近,我们推出了精简化、预置的能力。我们的想法是要采取以服务为导向,像Services一样,在服务导向当中有一个虚拟层,以及一个抽象层的,通过使用Hitachi的语言,我们可以使用不同的语言,使用各种各样的模块,比如说计费模块,这样的话能够提高在信息当中的利用率。

我们把它当成Services用在了同样的理念当中。抽样层指的是做到了控制器当中的虚拟化,实现不中断的迁移、卷管理、精简化、资源预配置,同时像虚拟磁带库未来会出现的系统,这是对于服务导向型存储的做法。

这对我们来讲是可以做到四点,首先对容量可以进行优化,当用户说的时候不会跟他讲三周才能做到,现在就能做到了。当然这是以预配置的方式给你的,这样的存储池通过多个应用以动态的配置,这样的话使存储的容量得到最优化的配置。

在我做20个备份的时候,过去不知道卷里面有什么,现在不要像过去一样备份20份,只需要对于用的一页进行备份了,这样的话可以大大提高利用率,减少浪费,这样的话使管理也得到了简化,使性能的调节也得到了简化。

我用更多的磁盘为I/O提供服务的,存储的容量价格变得越来越低,把越来越多的容量整合到磁盘当中。今年我能做到在整个磁盘当中有1TB的容量,但是遗憾的是转速慢了,为了弥补性能上的缺失,我们把性能部署到多个磁盘,希望同时转动来提高性能。

我们的数据管理者要做大量性能的调制,这可以自动去调配系统,可以分配到很多不同的磁盘上去。

在我们的能力里面,可以做这种培养它,所有的都是虚拟化的,可以访问这种能力。不需要买新的存储,做这样精简化的存储、配置,可以附在USB上可以使用。可以看看这些运营成本,这样的话购置成本可以放在普通的层次降低成本。它可以能够分配空间,拷贝的时候可以放在低层里面进行拷贝,这样的存储是问题,我们互相怎么信任,怎么使用同样的资源。

另外,我们有能力有逻辑进行资源分区,同样的资源应用程序不能够从那个程序偷取它的缓存,我们可以做到服务的水平,能够做到这样的系统。这是我们在同行共同的标准认同上,我们让绩效使用者安全地共享这些资源。

还有一个叫做生产周期的缓存器,我们有多种的存储在模块基础之上,不用一次都买来。我们在周期当中使用这样的缓存期,我们可以给它动态回到RAID1上,动态的不会影响到我们的应用。通过调制系统,通过策略,把合适的数据放在合适的存储水平上,能够保证服务的水平。

在运营成本来讲,可以得到了很节余,除了环境要更加有效的使用我们的购置成本,包括冷却、能耗、设备的一些迁移,很难做到对我们数据的迁移。我们也讲到了过时的数据,怎么样把它删掉,让公司的效率更高。

这是归档的解决方案,那边有演示在外面可以看到,但是今天的归档来说,一般有两点要做,一个是做文档、或者是做邮件,我们有方案都能做到,还有整合的归档。

当技术进来的时候,我们会把它像指纹一样,检索可以通过指纹来检索。把源数据放在数据库里面,可以查找病人的名字,或者可以查找其它的。可以像Google一样进行搜索,来点击实际需要的对象来进行查找。

在所有的归档里面有合规性,这里面有单一实例的库,我们有验证叫做合规性的存档。这里面有很多客户已经安装了,在韩国的一些国家档案馆,还有在欧洲的他们也是国家档案馆要去做的。

明年我们会意识到在美国有总统大选,布什总统明年可能要离职了,他的档案也会放到我们系统当中去的。如果要了解布什总理的话,都会放在我们的档案里面去查找。

这些系统是可扩展的,我们设计的方式是一个SAN上有多少个节点,20个CAPEX,720个对象,我们大概包含了这样的对象,可以做系统存储的,他们只有10几个达到了CAPEX的水平。

今天的环境不是使用率低的问题,还有很多办法要加以解决,有虚拟的磁带库,还有归档的系统,还有一些专有的系统可以优化数据库,能做简明性的预配置,我们有归档的系统但是不能做简明性的预配置,我们建议整合它只放到一个系统里面去。

如果你只是做虚拟磁带库或者是整合的话,可以使用画画的系统,可以使用复制、服务器的分存储等等,如果想实现简明化的预配置会进到ESP里面,它会提供这样的服务。更重要的一点是叫做虚拟化的服务,能够使得我们都有这样的能力融入到现有的投资环境当中。

现在回顾一下我们的运营成本和购置成本,这些购置成本只是付一次,投资一次,每年还要发生很多的费用。这些费用不光是来自于人员费用的成本增长,三年之后保质期到期之后有很多的问题,所以运营成本也会高。

这里面我们建议从一个小的投资开始在虚拟化上,在简明性的预配置,然后我们减少运营成本是不间断的非破坏性的迁移。在这个容量里面讲到了过时的数据,进行归档,进一步降低我们的运营成本,所有的技术和能力都是可提供的。

另外关于购置成本,政府可以帮助我们,他们提供了一种叫做折旧或者是相关的税收,可以不用掏钱去替换这样的资产,投资来讲看看这样的方式是非常有益的。所以,这里讲的并不是投资的回报,讲的是资产的回报。这个有能力在这样的投资来说,能够增强目前现有的资产。

另外一个角度来看一下,做一些三年期的研究。可以看到差不多24%ROA资产的回报率,这里面有蓝色和绿色,还有额外的成本,有虚拟化的软件和人员培训的费用。在这样的费用里面,极大地减少购置成本以减少运营的成本。在这样的环境里面,看到业务在下降,IT的支出也会越来越符合这一点,如果要保证IT的支出,就不能满足业务的收入要求,财务人员会来跟踪这一点的,你知道你的预算会下降的。但是不管是怎么节省,减少这些运营成本都有利润的问题,怎么强调利润。

在这样的情况下,IT使用它的技术,让IT可以成为真正的英雄一样,Randy DeMont讲到了风险的问题,风险也存在着机会。所以,我们提供了工具去抓住这样的机遇。

这是我们所实施的一个计划,针对客户所使用的。你要这样去做,首先要设计一个基准点,了解你有什么东西,再测试一个底线,如果有什么改进的话,可以看到对某些基本情况的改进,像我们做体检一样有什么东西,包括一些费用,然后设计一些目标。

有可能是分存储、对二三级的利用率会高一些,设置一个目标,从支出的角度,从减少碳排放的角度,减少能耗等等都有里程碑的指标。这样的话,客户能够实现能改进他的表现,每年是20%,然后达到30%、65%的分存储节省成本,利用率能提高。

这里有一个例子,是一个早期客户所采用的服务导向型的存储,他们是一家医院,他们使用一些低成本的模块化的维护。他们可能有宕机的情况,会有很大的损失,希望来买一套系统这是企业级的应用。

他希望能缩短安装的时间,提供每个部门的隐私性,提高分区的能力,能够安全分区,在整个医院里面能够充分地利用现有的模块化的存储,加个虚拟化在USP后面。后面的USP是灾难恢复,以前没有这样的情况,他们的ROA使用现有的投资,现有的人员,以及简化流程,他们能节省差不多1.8亿美元。

这就是他们不到2亿美元的投资,这里面有很大节省,看整体的资产回报。当然,这些患者得到了改进,而且减少了一些治疗的错误。

这里我们讲关于存储的经济性,便于考量它们以便于加以量化。很多服务我们是叫做存储的经济性,这样运营的成本,有的时候很难加以量化的,帮助我们来去通过这样的流程加以量化,可以提供商业的案例给财务部门。

所以,要得到我们合理业务论证的支持,我们提供这样的服务帮助你们去做。公司使用的是投资的回报,而我们看看是对资产的回报率整体投资的情况。

这里面可以看到一些案例是关于使用虚拟化和简明性的预配置,不同的服务得到了不同的结果。我们有这样的战略,一个平台支持所有的数据,我们长期的企业里面到终端、文档归档存储上,我们有集成的战略,共同管理、共同研究、共同保护。这里面有一个比较小的简化的产品,而不是有很多针对性的解决方案,有集成整合性的要求。

举个例子,我们有模块化的领域,AMS2000模块化的存储,我们有双核控制器在行业里面是第一个,可以做两个控制器之间的均衡的负载。在背板上我们使用的是可以直接连接每个磁盘,而不是环路的办法,可以通过更好的性能没有数据的路径,通过我们能够增长。

如果管理元素有这么多的话,使用这么一点,可以把容量给缩小,如果需要更多的存储可以提高存储的容量。我们可以做超大的SAN,还有其它的地方在AMS2000里面,所有的人都知道关于我们要绿色、降低能耗,可以给它减速或者是关掉,可以做很多不同的活动在磁盘上进行调整。

分层存储节省电能消耗成本,这里面可以达到200瓦,所以,把这些磁盘放到一个更大的磁盘利用器上,放到二层。把没有使用闲置的放在大的归档上面,可以放在三层,可以减少消耗的能耗,可以起到分层的存储。

所以,节省的每一瓦电都可以乘两倍。这个系统是一个服务提供商,这张是欧洲的,他们讲到自己客户服务的图,来使用直接的非虚拟化的。他们使用虚拟化结合了简明化的预配置,表现了能源的节省,包括对碳减排放的成长。

对于Hitachi公司来讲,我们降低30%的数据中心的能耗,从2007年开始在5年之内。基准点就数据中心我们在横滨有四级的数据中心,包括地热的控制,是非常耗能的系统,我们目的是降低很多的能耗。还有很多的元素,包括一些冷却、配电的能力,管理关键的部门,我们有能力提供虚拟化,更好地提高利用率,包括提供服务来跟我们的客户一起发展。

总结说,我们要讲到的市场是什么,关于灵活的存储服务,能够很快地响应业务的要求,并不是三个星期、六个月的时间,我们能马上响应,采用非常简单的方式能够非常安全,而且是非常高的可用性的,然后是存储虚拟化器,能够提供服务,包括一些给网关配置的。简明化预配置是关键的因素,还有数据的移动可以迁移、拷贝、复制,而不会影响我们的应用,这是现在发展非常关键的一点。

在这样的环境里面,预配置和通用的工具都是可以涉及到异构的环境和其它的存储系统,有的时候它们会比我们好一点,也许比我们更经济有效。你们可以用它们,附加使用我们的服务也可以的。包括我们去降低冷却,绿色化,降低能耗可以提供这一点。像灵活存储服务可以提供ROA,我们提供的是一种技术,来提供服务。

但是,我们不能够解决IT的问题,IT要自己解决问题,IT要有领导的地位,能够把员工、流程还有技术结合在一起,真正来提供资产的价值。

这样的话,我们非常激动在市场上已经看到了一些客户,我也知道某些公司在这里面有一些创新。我们在行业的领导地位,非常兴奋。我们有非常大的希望,也有非常大的信心,能够在日立公司主要的市场上这样做。

再次表示感谢能有机会跟你们做介绍。