访谈人物简介
Dave Hitz
NetApp 创始人兼执行副总裁
作为执行副总裁,Dave 负责 Network Appliance 的未来战略和前进方向。1992 年,Dave 和 James Lau 怀着要像 Cisco 简化网络一样简化存储的热情,共同创立了 Network Appliance。Hitz 以前在 Auspex Corporation 担任过高级工程师,也在 MIPS Computer 从事过工程方面的工作。在从事计算机行业的职业之前,Dave 曾是一个牛仔,在牧场积累了宝贵的管理经验。
在最近的 NetApp TechTalk 播客中,NetApp 全球整合营销副总裁 Elisa Steele 向 Dave Hitz 询问关于技术未来发展的具体见解。完整的采访稿只能从 Tech OnTap 获得。
Elisa:Dave,您认为过去几年中存储界最伟大的一项创新是什么?
Dave: 我觉得不应该把它限制在一项创新,而应该是整个领域。我觉得虚拟化是最有趣的一个领域。虚拟化诚可谓是“你如何把一堆原料变成像模像样的东西?”
如何运用具有数百个(有的领域甚至上千个)磁盘驱动器的存储系统,又不必劳神费力地处理所有这些磁盘驱动器?如果您有一千个磁盘驱动器,而又不想处理“这些数据属于这个磁盘驱动器”或“这些数据属于那个磁盘驱动器”,或者“此处剩下多少空间”或“彼处剩余空间如何”之类的问题,该怎么办?
这正是我们在 Data ONTAP 7G 软件版本中所作的努力,其中包括 NetApp FlexVol™ 和 FlexClone™ 技术等虚拟化周边功能。所有这些功能都涉及虚拟化,我认为它们代表了近年来最有趣的创新。
Elisa:那我们就深入探讨一下。每个人都在谈论虚拟化。您认为其真正含义是什么?
Dave: 虚拟化就是当您获得一件东西的时候,您希望它是另一件东西。我举一个关于虚拟化的例子。我希望我的房子有一条专用线,这样我可以加班。但是我没有专用线,而且房子离得太远,我买不起。可是我有 Internet,我可以通过加密和隧道的组合构建自己的虚拟专用网络。它是虚拟的。
存储虚拟化中有两个方面,我觉得特别有趣。第一个方面,我认为是最大的飞跃,而且在过去几年对客户产生了最大影响,就是如何将所有这些磁盘驱动器变为虚拟池,从而可以更方便地管理。第二个方面确实很有意思,NetApp 创新就是我们跨系统所做的全部虚拟化。这是我们在 Data ONTAP 10G 方面所做的努力,是前些年我们收购 Spinnaker 的成果。
Elisa:这么说虚拟化也是实质地改变了数据中心面貌以及管理方法的方面之一。您认为当今数据中心还发生了哪些基本变化?
Dave: 当我观察公司数据中心时,我觉得在人们改变它们的方式中,最有趣的是 VMware 的变化。一直都有客户告诉我,他们原来使用 50 台服务器,后来压缩成两、三台。有一位我交谈过的客户原来有 500 台服务器,使用 VMware 后,服务器减少到 25 台。如果您想节能、省钱、节约数据中心的物理空间,它绝对是上上之选。
从 Network Appliance 的角度来看,它让我感到有趣是因为一旦实现服务器虚拟化,您就必须考虑应该对存储采取哪些措施。如果虚拟化服务器在可以快速配置的前端,您最好将存储放在同样虚拟并且可以快速配置的后端。因此 NetApp 和 VMware 是非常理想的组合。我认为这是数据中心发生的根本变化。
Elisa:您是否认为它影响了我们在数据中心部署业务应用程序的方式?就开发存储基础结构以支持这些大型应用程序的方式而言,您认为发生了哪些基本变化?
Dave: 我们回头来看 IT 人员遇到的最大问题。他们始终担心设备运行和基本可用性。如果不发生这种问题,也就没什么大碍。如果能够基本地运行,它们就能驱动成本下降?绝对是省钱之道。而另一个重要的大问题就是“如果出现新的商机或者需要部署新的应用程序,我的反应能有多快?”
从存储专业人士的观点来看,客户走进来说:“我需要新的服务器,还要一些配套的存储。多久才能到手?”我认为这就是业务的灵活性。尤其是观察业务应用时,几乎全都是响应某几个问题。
Elisa:转移到其它话题之前,我想借这个机会了解您对 iSCSI 等其它潜在的破坏性技术的看法。具体来说您认为 iSCSI 有哪些破坏性因素,它在市场上会有什么影响?
Dave: 如果从大的方面来观察存储行业,您会发现在过去 10 年或 15 年中,最大的趋势就是从直连存储过渡到各种形式的网络存储,不管是光纤通道网络还是以太网网络,SAN 还是 NAS。
在这个过渡中,最有趣的是低端仍然存在如此之多的直连存储。如果观察价位在 15 万美元以上的 IDC 数据,当今几乎所有存储都连接了某种网络,通常是极为昂贵的系统中的光纤通道。如果观察价位在 5 万或 1.5 万美元以下,则绝大部分仍采用直连存储,它们通常部署在服务器内部。
那么 iSCSI 处于怎样的地位呢?我认为 iSCSI 是存储的另一个方向。就像 SAN 一样。您知道,它在某一点上采用了 Apple 的模型。我认为 iSCSI 所要做的就是让中小型企业以及大型公司中的标准服务器能够获得大型企业从 SAN 中获得的所有益处,而价位和管理复杂性又相对合理。
Elisa:您认为是否存在其它破坏性方面或技术会实质地改变数据中心的面貌?
Dave: 我想说的另一种破坏非常有趣,就是当前我们在加密中遇到的情况。当人们思考在数据方面遇到的难题时,最大挑战之一就是越来越多的数据包含关于某个人的重要信息,而并非仅仅是公司材料、工程图或抽象的材料。这是 Dave 的医疗记录或 Dave 的个人电子邮件。
只要开始访问了对某人具有某种意义的个人数据,就触及了公司责任问题。因此我认为在接下来几年里,随着人们越发警惕将此类个人数据存放在磁盘驱动器上,加密的重要性将会大大增强。
Elisa:讨论磁盘驱动器本身。磁盘驱动器有什么问题?
Dave: 磁盘驱动器技术中最有趣的事情之一是从光纤通道到 ATA 驱动器的转变。或者我应该更明确地解释我说的“转变”。我不认为光纤通道磁盘驱动器会在短期内消失。对于要求最高性能和最高可用性的高端企业应用程序,人们应该使用光纤通道驱动器。
但 ATA 驱动器可以为人们做某些事情制造实在有趣的机会。首先是在不需要绝对最高性能的情况下可以节省资金。我们有许多客户开始使用便宜得多的 ATA 驱动器运行相当高端的应用程序(Exchange、数据库应用程序等),说道:“嘿,这个不需要最高性能。”
ATA 驱动器与光纤通道相比是如此廉价,人们不禁要想:“不必将所有数据立即发送到磁带,相反它可以在运转的介质上存放一段时间”。这样就可以使用原本已是备份数据的数据,这种方法更有趣的多。您可以将其用于法律发现,从 ATA 驱动器恢复比从磁带恢复要快得多,或者搜索可能本已存在的材料。
这样,整个备份区域就变成长期保留和存档的更复杂的东西,数据在运转的设备而非保存在磁带上,如此方便得多。ATA 的廉价确实使人们想到长期管理数据并继续从中获得价值的完全不同的方法。
Elisa:我想我们很有必要讨论一下存储网格。我们制作了一份关于存储网格的播客,人们一直在讨论这件事情。我们很想听一下您对存储网格未来的看法。
Dave: 网格就像虚拟化种类词汇,含义广泛,不好概括。我认为理解存储网格的最佳方法就是问“它有什么作用?”,存储网格在应用网格背后。
着手的最佳方法是从服务器端、计算端来理解网格计算,然后我们可以探讨需要什么样的存储功能来满足这种需求。如果观察网格计算,您会发现存在两种类型,一种用于技术应用程序,一种用于业务应用程序。
我看这两种类型完全不同,原因如下。对于技术计算来说,网格计算并不新奇,没有变革性。这是人们解决这些问题的默认标准方式。如果您观察人们进行技术计算的任何环境?我以芯片设计或软件开发甚至地震处理、好莱坞影片动画等高端科学应用程序为例?您会发现 Linux®(有时是 Windows®)的成百上千个节点老是栽在同一个问题上。这些领域所面临的问题就是如何获得能够支撑多达几百或几千台 Linux 后端服务器的存储基础设施。我们为这些行业的人所做的许多工作就是为了满足这种技术网格需求。我说它没有变革性,并不是说它没有创新性。它只是已经成熟的技术。如果您从事此类工作而不使用网格计算,那么您真的应该思考一下为何存在这种差异,为何不能利用这些材料。
那么业务网格计算又是什么概念?业务网格计算的主要推动力量是 Oracle 和 SAP 等公司,他们提出:“我们为什么不获取技术人员所能获取的益处呢?”。技术人员没有购买极为昂贵的计算机,而是说“我只想买廉价的 PC,用它来运行我的大型材料。”我想 Oracle 和 SAP 也曾在想:“既然如此,我们何不也在廉价的 PC 上运行材料,并通过某种方法使整个环境实现顺畅运行?”。这里遇到的问题与技术网格中遇到的问题有所不同。在技术网格中,我们所考虑的无非是 CPU 负荷以及如何能够在上千台 Linux 计算机上解决同一问题。而观察业务网格时,这个数目通常要小得多。
对于大多数人来说,我认为业务网格的真正好处在于降低复杂性。无需使用数百台单独的计算机来运行所有这些材料,他们可以减少网格,
Elisa:对于尝试简化数据中心所有这一切的人们,您是否有任何总结性建议?
Dave: 这些应用比较复杂。最后,我认为不存在任何绝对简单的方法来看待它们。然而,您应该问的一个问题是,如何在数据中心构建一种基础设施,使你能够尽可能轻松地部署和管理这些应用程序。
有些工具可以起帮助作用,例如 VMware 或 Microsoft Virtual Server 等虚拟化工具,它们使您能够更快地部署新的服务器并营造能够更灵活地运行应用程序的 CPU 环境。
解决服务器端的问题后,您将要问及背后的存储问题,这又直接涉及到克隆、简化配置以及是否可以通过以太网和光纤通道来访问的问题。这确实会比较复杂,但是如果实现虚拟化,您的解决方案越灵活,部署方式的选择就会越多,这些正是我们所追求的。