2008 LSI存储论坛:LSI谈存储虚拟化

日期:2008年5月21

嘉宾: Nelson Nahum

欢迎大家的到来!

    首先我分三个部分来讲:第一部分主要是讲存储虚拟化如何来解决服务器虚拟化当中的具体问题,我主要讲两个具体的问题,在服务器的虚拟化当中的两个问题,通过存储虚拟化加以解决。第二部分,看看存储的虚拟化如何改进服务器的虚拟化的部署,不简单是解决一些具体的问题,而且能够改善服务器虚拟化的一些部署。第三部分,我讲一些案例,特别是在中国的一些客户,他们已经部署了LSI虚拟化的系统。

    首先谈一谈我们解决的一些挑战。大概有关服务器虚拟化当中有两个挑战,第一个是可升级性,服务器的虚拟化要求SAN环境当中分享SAN的存储,但是SAN的环境与现在典型的SAN的环境是不一样的,因为我们需要对每一个LUN存储的所有的服务器加以分配,并且它们必须是以同样的方式来进行服务器的虚拟化的部署。另外一个是服务器存储与SAN的不同之处是,每一个实体的服务器至少有一定的处理量,有10个到20个机器的处理量,就是相当于20个计算机同时运营,比一个电脑生产出来的数据大20倍。这就是所谓的服务器的虚拟化,与SAN之间的差距。这是在SAN环境当中的一个挑战。

    另外一个服务器的虚拟化是一个动态的拓扑结构,很多服务器在运营,与传统的SAN相比,是富有动态的。我们的客户安装服务器的虚拟化的时候,他们会碰到一些新的挑战,这是为什么呢?用我们的SUN产品来解决这个问题最合适。

    如果没有SUN会是什么情况呢?我们有一个服务器或者多个服务器同步进行运营,每一个服务器可能有将近20个这样的机器,所以在整个存储的整体上面大概有200个这样的机器,所以必须在相互的空间下面进行分享,扩展服务器的时候,所有的这些必须通过同样的设备,每次都给存储的设备添加负载。

    另外,有越来越多的应用和服务器添加进来,性能就打折了,复杂性也在加大,因为我们需要服务器对每一个LUN进行不同的配置,每次添加一次,无论在存储还是服务器都要进行存储,存储虚拟化如果能够解决以上的问题,首先我们可以允许越来越多的阵列能添加到一个存储池当中,没有必要重新进行配置,不需要新的存储装备添加进来。

    存储的虚拟化也允许虚拟的LUN来囊括多种阵列,这样能够来提高它的性能。另外我们也允许一个虚拟的LUN同时进行扩展,而不需要在存储或者服务器这方面做其它任何工作,所以就可以解决这个问题。

    我想给大家演示一下案例。在SVM,我们的产品是怎么表现的?首先我们有很多服务器,有一个单一的存储设施,现在有虚拟化了,我们可以增加更多的设备,扩展这个阵列,而不会影响到服务器,所以应用继续运转,我们有更多存储的设备分布在这个平台上,如果你需要更高的技能,就要安装更高的阵列,另外也解决了配置的问题,所以我们不需要重新配置服务器,通过这个虚拟化。如果没有虚拟化的话,每次添加一个实体的服务器和存储装备,又必须重新部署或者是配置新的服务器,所以很容易出现很多的失误。

    我们面临的第二点挑战就是在存储虚拟化应用当中解决了一个问题,就是灾后恢复。在传统的服务器环境当中,可能没有虚拟的服务器,这出现什么问题呢?因为很多的虚拟服务器在一个存储设备当中工作,所以所有的虚拟化必须在灾后恢复的点上同时进行恢复,多地点同时恢复。如果不同时恢复的话,就无法从灾后恢复数据,必须多个地点同时恢复。如果这些存储同时进行恢复在服务器运行,所以当这个服务器在进行灾后服务的时候,其它的服务器并没有同时这么做,存储是所有的服务器分享。

    有些客户开始做基于存储层面的应用,通过这种方式,只拥有一个阵列就够了,因为每一个阵列自己复制它的存储,有的快,有的慢,根据自己的节奏来做,主要取决于数据流。如果没有SVM,有三个阵列,它们就各自复制,有的快,有的慢,远程的地点数据之间没有同步,有些数据流是几分钟之前传输的,有些数据是半个钟头之前传输的,所以很难在这种环境下为数据进行恢复。如果要恢复这些数据,我们可以看到不同的时间点有不同的数据输入,就很难进行整体的恢复。所以灾后恢复特别是在虚拟环境下,是特别复杂的一件事情,这就是为什么我们存储的虚拟化能够解决这个问题。

    存储虚拟化,我们能够生成保持一致的数据流,同时进行生成。有一些远程的地点,我们将所有的LUN,进行一致性的恢复,在某一个时间点同步,所有的数据流能够在同一个时间点同时恢复。特别是在远程地点,做灾后恢复还能做得更快一点,它们都是同时发生的同步化的数据恢复。

    还有一个特点是虚拟化的恢复可以在远程地点使用一些不是特别昂贵的二层的存储资源,有很多资源、有很多能力,有的时候成本比较低,特别是在灾难恢复的地点可以做不同形式的存储,我们同时也解决了这个问题。

    这个图片,网络层面将所有的存储层进行复制,它们同时进行复制,在灾后恢复的地址,我们马上可以跟当地一起同时进行数据的恢复。通过这个图片我们可以看到,在三个存储的阵里进行恢复,只有一个是高能量的数据表现,客户积累了很多数据,在远程的复制,在不同的存储之间进行恢复。

    刚才我已经讲到了服务器虚拟化当中两个主要的问题,如何通过这种存储的虚拟化解决这两个问题,在这个部分我要给大家讲讲存储虚拟化如何改进服务器虚拟化的能力。下面我简单讲一讲四个不同的能力,当然了除此之外还有其它内容,但是这四个在我看来是最重要的。

    存储能力的节约。在虚拟化服务器当中,每一个机器必须要求至少有8GB的存储分布到不同的虚拟机器当中,不是服务器当中,而是虚拟机器当中。如果有一千个虚拟机器,你至少要分配给每一个8GB,总的加起来,就乘一千。为什么我们需要最低的存储呢?因为在Windows当中,我们的存储在机器瘫痪的时候需要一定的存储来恢复,我们不可能每天都碰到这种情况,可能每周需要这样的准备,但是不需要每天都要有存储的准备。在这种情况下到底发生了什么呢?现在有很多兆兆瓦,我们需要有一个需要去存储的东西,信息量就意味着我们是否能使存储装置有巨大的存储能力,达到我们的要求。我们在备份里需要有很好的存储,有的时候建立一个机器可能不好,就不能够被找到。有的时候在一些瘫痪等等发生的时候,或者机器失忆等等,都有很好的操作。

    举个例子给大家看看,我们如何能够节约很多的存储TB。我们有其它的一些基于环境的,这是因为我们觉得有一种可能性,比如说我们有不同的用户的机器,他们需要在同一的时间有大量信息的存储。同时我们如果需要去把这个数据让每一个用户的机器都能收到的话,对我们来说是一个挑战,现在我们必须要一次一次去做这个复制的工作,我们现在有的时候如果能够通过虚拟存储,让我们跟它同时进行,同时能够有一个非常好的存储能力,这个也是我们的一个优势。

    对于我们的虚拟存储,现在正在不断地提高,我们现在有一个所谓低性能的存储,现在有这样一个应用,比如CLM,可以有十个所谓低能力的快照,能有一个非常好的影射,可以同时做备份的工作。

    还有其它的一些进步,比如我们现在可以把它简单化,减少它的复杂性,对我们现在使用的错误会有一个非常好的纠正,因为我们一般对一个虚拟的服务环境来讲,每一个LUN都需要非常好的对所有服务器都应该发同样的信息,我们觉得非常困难,因为在做数据存储的时候会有停顿。

    虚拟存储使得我们不管是给哪一个服务器配置阵列或者存储,都能够确保它是自动保持完全一致的,不管你有多少,或者你有更多的存储。每一次不管你有多少的服务器,都可以做同样的存储,而且能够确保质量。同时也使得我们的环境变得更加简单,一旦环境简单化了之后,我们的工作量就会大大减少。工作量少了,就会减少犯错误的几率。

    另外一个进步,谈到虚拟存储的时候,现在整个数据的转移,或者存储迁移也是非常透明的。存储的迁移应该是非常大的项目,应该有很多的可能性让我们出错,我们通过这个可以避免错误的产生。同时,特别是当你有成千上万的使用的服务器的时候,我们需要能够把所有的这些服务器,都从一个阵列转到另一个阵列当中去。因此在我们传输或者存储大量的数据信息的时候,我希望它们不间断,也是通过虚拟存储来确保。

    我们需要的是零待机时间,不存在任何停工时间,完全能够确保我们在传输数据的时候非常准确无误。还可以让我们的服务器继续运行,也不需要有停工。我们在做数据存储的时候,有非常好的效率,可以减少停工期。

    LSI存储应用的成功案例。特别是虚拟存储的一些产品,LSI应该是在这个领域非常高端的企业,我们可以说是第一个使用storeAge等等的技术,把数据有效的进入,有效的分离,可以让我们的系统有效的扩大或者增容,有更多的途径可以使数据通过,这就是我们会有高性能、高的传输率。

    我们有非常成熟的产品,从2003年开始全球就大量使用传输和使用我们的产品。我们有非常好的功能板,就是功能集成,比如说我们首先有一个存储的库能够帮助我们,而且是基于SAN的数据管理和流量管理。同时,我们也知道,通过我们所谓的存储池,能够确保我们的存储高性能,而且比如你有一个高性能的池,另外一个是高能力的池,你可以根据自己的需要,做相应的数据的迁移或者管理。

    前面已经谈到了,我们有非常好的,可以把整个存储最大化,而且可以确保特别大流量的存储。而且还有低能力的快照,可以有很多所谓的快照,让它能够确保每一个流量里的数据,都能够有一个非常好的管理,而且不丢失。可以通过这个有非常好的能力的分配和资源的分配,就是说,这是我们非常好的备份,但是同时一旦发生了数据丢失,会有非常好的数据恢复。这个就是让我们根据不同的环境会有一个及时的快照,让我们能够非常有效的保护我们的信息不丢失。

    我们支持所谓全流量的复制,有的时候我们的客户需要,比如想从一个数据库的阵列跑到另一个阵列里去,或者复制到另一个阵列里去,可以保证是全流量的完全的复制。

    还有一个在线的存储迁移,可以使我们不同的序列能够不停顿、不间断,这是非常好的一个特性。

    还有所谓本地的和远程的映射,这也是非常好的,比如有一个阵列是在近的地方进行的影射,还有远的映射,可以保证数据非常好的传递,不丢失。

    现在做数据的存储,不是一个使用者,可能是多个使用者使用。因此我们有非常独特的可达性,来进行数据传输、数据储存的管理。可以有一个多使用者的环境,你要进入某一个界面,必须要进行一些设置,才能进入这个层面进行更好的数据的管理。比如你想掌握这方面流量的信息或者数据的信息,需要有一些有控制的设置或者设施来确保能进入这些信息。我们现在提供的产品,它的性能非常丰富,所有的这些都可以对所有的存储使用,在SAN方面我们有更优秀的性能。

    还有其它的一些案例分析,这是在中国进行的案例。它想把信息从一个传到两个,不光是从一个中心到两个中心,而且需要有非常好的EMCDMX的存储,低成本的信息交流,所以我们的客户看到了不同的替代方案,这是A、B,用我们的产品给他们提供了非常好的解决方案。

    以前有从一个到多个,还可以完成多个点不同的信息的存储,通过这种预设来完成。

    这是我们另外的一个在中国的企业,我们帮它做的信息存储。这是一个长距离的复制,从中国到新加坡,因为这是IBM DS6800到IBM DS4300不同的型号。我们有多元的复制,不但允许我们的数据从中国传输到新加坡,而且有不同的存储,同时还有一个非常低成本需求的国际传输线路,这个是基于前面谈到的快照的数据传输,也是一个非常好的,对于我们现存的通讯线路的很好的使用。

    这是我们在北京的一个客户,这是政府的一个办公室,他们有一个非常有趣的、高的存储在这块,IBMDS8000、EMCC、USP,是高成本的存储,每一次都是自己来做存储。但是我们知道,现在有一个整个的灾难恢复,需要把它存储到另外的两个存储当中。我们使用了这样的同步的存储,把它们做到了EMC、DMX2000,就需要上百万的费用。这个也没有解决他们的问题,因为这个需要有一个非常好的、策略一致的备份,所以我们后来提供的解决方案就是,使他们能够虚拟。因为我们把SVM虚拟化之后,有非常好的高的存储的能力,同时让它完成这个存储的转换和迁移。

    如果大家有问题,可以跟我们北京的同事联系,他们做这方面需求的工作,特别是北京SVM的培训,在北京我们有办公室。

    非常感谢!

提问:

    SVM是一种什么性质的产品?

Nelson Nahum:

    SVM应该说是一种设备,来解决我们做的存储。