专访DataDomain创始人:我们领先太多

DOIT原创报道: 2001年10月,李凯等三人创建DataDomain公司,当时他们询问了超过40家企业的数据中心的CIO或是IT经理,从大型企业到金融公司,甚至是中小型企业,最后,他们创建了以虚拟磁带库、重复数据删除技术闻名于世,服务于企业数据保护的DataDomain公司。

仅仅不到10年,2009年7月,两家业内巨头从15亿美元起步,直至21亿美元,为了获得DataDomain打了一场长达三个月的收购持久战,在许多人惊诧的目光中,李凯和他的两位共同创始人朋友,不经意间成就了一场存储行业近三年来最大的一场收购。

9月2日,李凯来到北京,目前担任DataDomain首席科学家的他,仍然是DataDomain在技术和产品研发上的领导人物,而这位曾就读于吉林大学、中国科技大学、中国科学院的华人科学家,已经成为了华人在IT科技行业值得称颂的典范——即使是在创立了DataDomain之后,李凯还经常回到北京参与中科院,尤其是曙光公司的一些科研和开发活动,这其中甚至还包括曙光巨型机文件系统的设计。

而对于采访李凯来说,所有人最关心的问题在于:DataDomain究竟为何具有如此之大的吸引力?未来,DataDomain与重复数据删除、虚拟磁带库技术将会有如何得发展?——这一切,恰好是李凯最具有发言权的部分。

DataDomain:创立源自数据中心“实在”动力

李凯说,当时创建公司的时候,就与很多人的看法不太一样,不是简单的“技术产品化”。

“创立公司的时候,和很多做技术的人的看法不一样,很多学校里面的教授是想把实验室里面做的成功做产品化,有了技术做产品化,但是我认为成功的可能性不大,所以我们做的办法是先做市场调查,数据中心最需要解决的问题是什么?”因此,李凯和他的两位同伴如开头所述,询问40家数据中心的负责人,并一直得出了结论:

“在存储这个领域里,最头疼的事情是做数据保护,本地的数据保护和防灾的数据保护。”李凯说,那个时候才开始考虑“做什么样的产品可以完全代替磁带库的解决方案。”

DataDomain创始人兼首席科学家 李凯

李凯说,那是因为经过调查,“人们都不怎么喜欢磁带,而且不喜欢磁带的原因是多方面的,这不仅是数据中心的问题。”他认为,如果有了好的替代产品的话,没有人会继续回去使用磁带——“现在大家都在用ipod、mp3的播放器,很少有人会回去用音乐磁带,因为我们都不喜欢磁带,很少有人用VCR,而是用DVR或是DVD,他们也是不喜欢磁带。”

但是,数据中心与其他领域不同的是,“数据中心里面需要做出产品来,需要像ipod这么酷,所以我们的产品就是这么设计的,我们的技术是为了解决市场的要求和问题来发明的。”李凯在谈到创立公司时,如是说。

后来的事情我们也就都清楚了,DataDomain成为了业界知名的虚拟磁带库供应商,推动着磁盘在数据保护领域代替磁带的浪潮。

 

虚拟磁带库:为何与“他人”意见相左

不过,与DataDomain不同,在同一个虚拟磁带库市场上,也有人认为,虚拟磁带库只是主存储、近线存储与磁带系统间的一个“中间层”,更得保护,更快的速度,但无法替代磁带,也无法替代近线存储系统,当然,更何提在线存储系统??“他们”认为,虚拟磁带库的主要作用,是在现有的大量采用磁带为基础的备份架构和备份软件之下,加快备份的速度。

但李凯不这么认为,他相信,一方面是“其他人”的产品速度达不到,另一方面,是磁带的消亡还没有那么快。

实际上,由于虚拟磁带库常与重复数据删除联系在一起,以及虚拟磁带库是否能取代近线备份系统,而直接成为近线存储系统,并进而取代磁带的可能,虚拟磁带库的性能一直被人们所关注,而对于DataDomain来说,鉴于一直将虚拟磁带库列作备份的直接系统,而不是“中间层”,这一问题也就显得更为引人关注。

“要看产品的性能,主要是他们的性能不能够代替磁带,要有一个理由,有一些用户要有要求。从刚才的话题来说,ipod代替磁带用了10年,在有些地方还是有人用磁带,不可能几年内就完全的换掉。”对于DataDomain的产品设计,李凯有话要说。

“DataDomain最近推出的880产品,如果用10Gb的连接做产品的话,速度已经达到了物理连接的极限速度,就是10Gb,看下市场上的产品会发现做重复数据删除会比不做的速度还会看。”??李凯表示,这是因为DataDomain从开始就考虑到了性能的问题,并将软件进行了并行化的设计,李凯说,在2001年的时候,他开始对多核处理器的可能性产生了思考,并相信,多核、并行会是一种趋势。

“DataDomain的产品为什么速度会很高,因为我们一开始就把软件设计成并行的,利用多核的处理能力,很多厂商需要带很多磁盘才有吞吐量,带很多磁盘为什么还要用重复数据删除?我们的就是不用很多的磁盘,我们用10个磁盘就可以完成,其他人要用1000个,只要英特尔做更多的多核芯片,我们就能提供更多吞吐量。”??在2001年李凯设计并行的DataDomain处理程序时,x86系统的多核处理器还需要再等3年,当然,2001年的时候,IBM已经在小范围推出它的第一款双核Power 4处理器,但IBM当时是用在了它的RISC服务器中,何谈存储?

李凯还谈到,由于知道“与数据中心的人聊会知道磁带不可靠”。因此,DataDomain的产品是在不停的做校验,写进去马上读出来校验,之后每天每个星期都在校验,磁带库不能够校验,可靠性的量级是不一样的。



重复数据删除:未来的“中间”一层

李凯认为,未来“重复数据删除技术在很多地方都会有贡献的,主存里面也会有”。

“很多DataDomain的用户用产品来做近线的应用,和主存储已经很接近了,他有很多的接口,包括NFS、VTL、NDMP等等,这些接口都可以同时用,多用户多应用的用,就可以考虑,很多用户买的时候可能只用VTL,后来发现不用付钱就可以用作近线存储,他们发现新的用法,用作近线存储的时候自动的解决数据迁移的问题。”李凯认为,重复数据删除技术,未来将会是大众化、普及化的,就像RAID一样,是“数据保护的一个层”,存储系统很自然就拥有的能力。

“DataDomain的重复数据删除,相当于存储系统中加了一层,最开始大家用磁盘的时候没有RAID,就没有可靠性,用多了磁盘就有可靠性,RAID就加了一层,重复数据删除技术就在上面又加了一层,减少你用磁盘的数量,提高了可靠性,因为磁盘越少可靠性越高,减少了用户的消费,这个层会变为标准的一层,很多存储器会考虑这一层。”

当然,李凯也深知,即使是能够删除大量的冗余数据,重复数据删除仍然在成为标准上有需要的做的地方,比如说功耗:

“在数据中心里面,功耗是一个很大的问题,DataDomain的产品在做备份的方面,压缩比能够达到10-30倍,能够减少10倍以上的空间、耗电量,以前可能用10个甚至30个盒子。现在只需要一个,在消耗电量管理人员方面节省了很多。”李凯认为:“这也是成为标准的基本要求。”

不过,李凯在采访中表示,他相信,重复数据删除将会成为“存储系统中一个层”,一个“自然”的层次。

与EMC:很好的结果,一致的目标

谈起收购,李凯表示,EMC最后把DataDomain买进来,是因为公司已经上市了,上市的公司的董事会会为了股东的利益着想,不是创始人、管理层能够做决定的,唯一的出发点就是拥有股份的投资人和拥有股份的人的利益这是不是一个好的决定。

不过,作为他个人来说,他很高兴看到DataDomain未来能够获得更好发展的机会。

“当时成立公司的时候是为了数据中心解决问题,不是从技术角度出发,是从解决问题的角度出发,创立革命的改变让数据中心做数据保护方面用新的办法来做,这是一个主要的出发点。当时主要做这个公司也没有很远的想法,因为很远的事情很难想出来,我们的目的也是为了更多的数据中心解决问题,代替磁带库的解决方案,数据备份、远程备份、近线存储、归档的存储,在很多领域都有磁带,我们想的是要代替磁带。”而在解决数据存储的问题上,李凯看到,DataDomain与EMC的目的和方向是一致的。

李凯表示:“我本人觉得这个结果很好,这和我们最开始成立公司的目标是一致的。”他表示,因为EMC是存储工业里面最大的公司,产品线是非常好的产品线,DataDomain进来之后,可以利用EMC的平台把市场做得更大,为更多的数据中心解决问题。

而对于收购后的公司定位与产品线重叠的问题,李凯的态度是:公司仍然保持独立,定位上很容易。

“EMC的公司好处就是之前收购很多大公司,比如VMware,这些大的公司进来之后,这些公司还按以前的办法来执行,同一批管理人员,所有人都留下,DataDomain现在还是一个单独的EMC下的公司,我们的总裁还是原来的总裁,管理的班子还是原来的。”因此,李凯说所以DataDomain的人感觉没有变化,工作环境、目标都没变化,只不过现在资金更多了,而且市场更大了,大家是这样的感觉,而至于与其他的重复数据删除产品,李凯谈到“实际上Avamar是在备份软件上做重复数据删除,DataDomain是和系统里面做,和所有的备份软件都可以做,中间会有重叠的市场很小。所以定位上很容易的。”

实际上,在7月20日前后EMC全球发布的新闻稿中,EMC方面已经正式表示,“一旦EMC对Data Domain收购完成,将以Data Domain为基础组建一个新产品部门,隶属于EMC存储业务部,专注新一代磁盘备份、恢复和归档解决方案的开发和交付。”而这个新的EMC产品部门则仍将由Data Domain总裁兼首席执行官Frank Slootman领导。

而谈起在中国区的合作,Data Domain大中华区总裁许跃奏表示:“在中国会和EMC有很紧密的合作,但是这个是双赢的,两边的产品都在卖,会有一个合作的,我们现在在做培训,我们的工程师帮EMC的工程师、合作伙伴做培训,我们90%的渠道就是EMC现在的渠道,融合会是非常快和非常容易的。”

李凯和许跃奏都认为,DataDomain在波音、AT&T以及纽约银行的成功案例证明,在找到正确的团队,拥有强大的支持之后,DataDomain能够在中国获得持续的增长和更多的具有代表性的大型客户。

DataDomain对此充满信心。