CommVault全球产品总监漫谈Simpana7.0新功能

存储在线 9月5日消息:接前一篇CommVault中国区总经理徐永兴的致辞,下面的这一篇是CommVault全球产品总监梅立宏先生的演讲


主持人:非常感谢徐总的介绍,接下来大家一定会对Simpana这个产品非常好奇,所以下面有请CommVault全球产品总监梅立宏先生为我们做介绍,请大家掌声欢迎。


梅立宏:各位来宾下午好,下面我开始介绍Simpana7.0功能。


      刚才徐总总结的时候提到两点,每个人都一样,我们收集了很多数据,我们自己想一想,家用电脑、手提电脑、DVD等等里面为什么有那么多东西,真的能用得到那么多东西吗?企业里为什么会保留那么多东西,目的无非是觉得也许有一天用得到。东西越多,找的时候就越难。那万一我有一天找的时候,这个东西没了,所以就很头痛。越积越高,我们要找的东西越来越多,Simpana提供的是能够让你更有效率的查询,然后能够重复使用这些数据。


      这张PPT就是美国萨班斯法规规定。这张图刚才徐总也用了好几次。下端的数据管理池,今天所有使用者的数据基本上都在一个存储设备上,数据本身保留在哪里,有些可能在磁片,有些可能在磁带,有些可能在线。使用者应该把这些数据分的很清楚,如果对在线数据,要管理的方式跟离线数据管理方式是不一样的。就是说以一个使用者的角度来看,我要找的东西在哪里,然后才知道怎样去管理。CommVault提供的就是,不需要设定数据怎么去读取,不需要知道我的信息到底是存在哪里。我们提供给使用者的是虚拟管理读取方式。怎样去找一个数据,每一位都用过Google、百度这样类似的网站,为什么全球那么多人使用?就是因为它用起来很方便,只要知道怎么上网,把中国和CommVault这两个词输进去就可以找的到相关内容。类似于Google、百度能够提供给你的,就是今天在Internet上面的数据。CommVault Simpana7.0提供的就是类似这样的功能,使得企业内部所保留的数据能够以这种方式来查询。今天也有很多可以查询的类似产品,但是它能够让你查询的只是在线部分。对一个企业来讲在线部分的数据可能只是它全企业、全组织数据的5-10%,所以还有大部分的数据没有一个很实用、很简便的查询方式。最多能够做到类似于Google功能,针对你在线部分来查询。


      而今天Simpana7.0提供给使用者最大的特点就是,让你有一个统一的数据管理池,这个管理池可能会把北京、上海、广州三个数据池加到这个管理池里面,这个池由使用者来定。这个管理池里面的数据是怎么来呢?有可能是备份、有可能是归档,也有可能是复制。使用者对同的数据进行处理,7.0所能提供的,就是让使用者以简便的方式查询、使用。7.0版本大概有300多条未使用者提出的建议,建议我们怎样改进产品的方式、功能。这个产品里面大概有70多个专利。通常每一个版本大概有200条客户提出的建议,这个版本比平时多了大概40-50%客户提出来的建议。


      刚才徐总提到,7.0提供一个很大的功能,就是针对数据移动部分提供更好、更有效的方法。什么是移动?不管今天做备份、迁移、归档还是复制,都是针对你原来的数据做了不同的拷贝移动到不同的地方存储。当然备份的格式、归档、复制的格式会不一样,存储的介质也会不一样,但是它最终只是针对原来的数据做了不同的拷贝之后移动到不同的介质中。比如说今天针对某一台服务器做备份,现在在市场上所有的产品都有一个相同点,就是你一定要针对你的数据每次做备份的时候做扫描,看哪些数据被更改,针对同一个数据源要做归档,每次扫描,服务器里面的数据不管有没有更改都要看一下。这个过程每天做,甚至每天要做好几次,带来的后果,第一是时间上的浪费,第二是服务器本身资源的消耗。7.0就提供了这一点,不需要重复每天去扫描,我知道哪些数据是更改的,哪些数据是新产生的。当我需要备份的时候扫描这个步骤就已经解除了。这样的话,相对来讲针对你的服务器本身的资源节省了很多。


      另外,就是所谓的以更好的方式做数据存储,能够做到针对策略为基础。这一组数据可能是多台服务器,比如说今天是针对ERP的数据,或者针对邮件系统。再比如说今天管理所有的PPT,这一组数据要针对一个策略来定,然后来对应相应的功能。比如说三个服务器在三个不同的时段要做增值备份,做了全备份之后再做增值备份,可能在全备份里面就有些东西是重复的,做归档时,不同服务器上面的数据在有相同步骤的情况下,我只需要针对原始数据保留一份,而由不同的指针指到那边。这样的话原来你可能有100G的磁盘能够保留两个星期。但是还有一点,今天的产品能够达到多高的压缩率?我们在做这个产品规划的时候有一个宗旨,今天客户做这么多事情,目的就是能够把数据读取出来。今天所有产品提供给客户最大的特点,就是当他处理数据的时候,不管是做备份还是归档都要付出代价,这样对使用者来讲就没有意义。而我们提供的产品Simpana,是基于以下平衡点提供给客户的:一方面让使用者达到最高的压缩率,同时对恢复速度没有任何影响。Simpana功能会让你所有的数据,可以针对任何种类的磁盘、操作系统数据做管理。


      用户怎样去管理数据,谁有权限读取这些数据,这些数据有没有可能丢失,是我们必须思考的。在美国、欧洲经常发生的事情是磁带会丢失。如果有朋友在HP、IBM上班的话,很可能会收到一个信息说离线存储的时候磁带丢失了。好多客户在数据加密方面有很多的需求,但问题是你要怎么样做加密?加密是一个很好的东西,但是加密的KEY怎么样保留,因为如果丢失加密的KEY就不能对原来的数据解密了。不可能把所有的数据都加密,因为加密这个功能本身会消耗很大的资源,CPU、Service等等。是在服务器中加密,还是在数据中心里面加密,还是到离线存储的时候再做加密,还是在磁盘上面就做加密,还是归档到磁带上的时候再做加密。不同的客户对不同的数据的需求不同,制定的加密策略也不一样。我们在7.0版本中为客户解决了怎样做加密最得当的问题。硬件本身有加密的功能,但问题以使用者的角度来看,磁带本身有这个加密功能是很好的,但是由谁来管理这个KEY变成一个很大的问题,我们就提供了一个数据保护的平台,让客户指定这个KEY来管理,用不同的方式再针对KEY来加密,所以Simpana7.0版本中提供给用户很完善、完整加密的功能。


      很多人问,我今天为什么要花那么多金钱、精力保留那么多数据?为的就是在我需要的时候把信息既又容易地找出来。针对数据所产生的索引怎么样管理就变成很关键的一点,Simpana7.0提供的就是数据管理管理查询的功能。Simpana7.0提供的索引管理可以针对不同的文件、不同的语言,可以针对数据的内容做索引。比如说今天这些服务器,有UNIX、Linux等,可以每天针对它做备份,当做完备份以后,再定一个策略,针对备份的部分做离线的内容索引处理,这样做有什么优点呢?尤其对国外的企业中的有些使用者,在购买Google针对内部数据做索引的处理,但他会发现当他做索引的时候会消耗他服务器上面大量的CPU,大到他不能忍受,所有的数据每天都要做备份。备份是什么?就是在线数据某一个时间点的拷贝,比如说晚上8点做备份,8点备份的那部分数据跟昨天晚上8点在线部分的数据相同,我可以针对离线数据做索引,这就不会影响到在线部分。这时候做索引处理的话,我就知道使用者可以针对数据做查询,但这只是到昨天8点,在线部分也可以做索引的处理,怎么做呢?就像我刚才提到的一部分,可以知道在线部分有哪些新的东西,比如说昨天8点的数据都在这边了,所有的变化会自动传送到这个引擎,这样可以在离线部分做索引的处理,不会影响到在线数据,但我会把在线数据和离线数据整合在一起,是同一个索引,这样当我在查询的时候,就可以看到在线部分、离线部分,在不同时间点,这些都可以找到。这就是索引界面,基本上类似于Google界面。

      还有一点,我们每一个使用者都用E-mail、邮件系统,今天我要查询数据的时候,最起码要到邮件系统里面找,第二到文件系统里面找,最起码要两次。我们可以把所有相关文件、数据找回来,而且不管是在线数据还是离线数据。当然用过Google的人都知道,把两个词敲进去,有30万笔,这时候又要选是其中哪一笔,这个系统还可以针对找到的数据做进一步的调整。比如说从30笔调了以后加一个新的关键词进去,再加一个词里面可能就会减少很多笔。这些数据可能在500个不同的带库里面,但是我把这些需要的数据保留成虚拟文件,我下次来的时候可以看,或者说把数据传给他让他做下一步的处理,因为他才真正知道他需要的东西是什么。这样的话,我刚才说的虚拟技术就升级到怎么样读取信息、使用信息。


      比如说我要找到这个东西,不需要打电话到数据中心把文件恢复过来我才可以读,使用者只要有读取的权限就可以直接读取。这样的话一提到一体化信息管理,可以针对用户的需求来分类、来管理。或者说基于一个策略,比如说一个企业针对数据的管理需求是什么,可以定义一个人的权限是什么,比如说这个使用者的权限只能查询到一部分数据,可以针对权限来管理。


      Simpana7.0能够给客户提供的是:一是以更好的方式来管理数据和存储;另外是,以更好的方式来管理信息存取,当我从那么多TB的数据里面,找到需要50笔的东西,保留到一个虚拟的文件夹;然后针对这些信息怎么样去管理,谁有这个权限使用它、读取它、查询它,要有一个完善的体系,所以能够做到以更换的方式来进行信息管理。Simpana7.0可以提供给客户这些功能,但使用者怎样去使用这要看使用者本身的需求,可以针对它来定这些策略,这就是Simpana7.0提供的基本功能。 谢谢。