2008 LSI存储论坛:SGI谈存储虚拟化

日期:2008年5月21

嘉宾:SGI 解决方案经理 Marti Baldwin

大家好,我叫Marti Baldwi。

    我现在给大家讲一讲的是我们的SGI,我们的环境,如何能给我们提供不同问题的解决方案。同时,我们也在发展我们新的市场。这就是我们今天谈的存储迁移,我们的客户会出现不同的问题,我们有能力解决他们的问题。同时,他们的技术使我们能够有一个完整的数据的服务,给我们的客户提供服务,做数据的迁移。

    你今天在这里要想的是,特别是谈到转移和存储的时候,我们应该想一想,我们如何把信息从旧的平台转移到新的存储设备中去,这是我们要谈的。

    今天我要谈一谈,它的发展趋势是什么。

    我现在跟大家谈谈,我在这个领域工作了多长时间。我在这里谈的议题是SGI是怎么回事,我们做哪些工作,我们的迁移是怎么回事,迁移为什么非常重要,还有我们哪些趋势、应对的挑战、有什么样的办法可以做数据的迁移,还有如何确保你的迁移成功。迁移的过程中,虚拟的环境如何影响迁移的计划,它的好处是哪些。我们现在有的时候需要有虚拟的环境来做迁移,这个就是我们说的SVM的技术。还有我们在做整个迁移的时候有清单,需要注意哪些事项。我们的SGI是如何把它打包,让它更加容易,同时能够更好的应用到客户中去,提供一个非常好的解决方案。我要把我们所有的解决方案应用于所有的环境。

    目前我们的观众主要是高性能的计算,我们是一个开发系统的公司,操作系统是Linux。我们主要技术环境是Linux,还有群集的环境,微软的群集的能力我们也拥有。

    我们有1600个员工,我们全世界都有业务,60多个国家都有业务。市场主要是关注那些需要高性能计算的客户,比如政府部门,他们需要有这种能力来处理多种系统,跨越系统来分享这些存储数据。还有一些业界、企业,也需要大量存储的环境,分享存储。学到的知识,适用于商业环境,这就是技术的解决方案,对我们来说是非常拿手的。SGI是一种新的方法,但是我们所瞄准的这些应用,比如群集技术,大型的数据、数据库、存储等等,我们提供给他们的环境。

    引入商业环境,我们在这里做了25年的业务,这是一个开放系统的公司,我们用的是Linux,要提供一种基础设施,采用一种公开的开放的标准。我们主要在媒体、娱乐、游戏、娱乐环境的后处理等几个领域,都是我们主要的几大业务,不光在美国政府,在全世界很多地方都有业务。

    我们产品的组成有服务器的技术,还XE系统,还有高端的环境,还有一些处理器,还有一些存储分享。另外存储产品我们有自己的一些品牌在SGI,还有我们和LSI的合作,还有数据迁移,特别是数据流的档案管理。还有其它一些文档管理的系统。我们公司主要是在图形可视化方面有一些专长,现在我们提供高性能的可视化的解决方案,整合到高性能服务器环境当中。

    全球专业化服务,我们做很多客户化,特别是高性能的计算方面做客户化,提供给很多科研单位、政府、企业,提供高性能的计算解决平台。

    我们的附加值能够快速的设计、提供、交付解决方案,并且将这种应用交付,并且进行测试,特别是通过工作流的环境下进行测试。

    我主要讲一讲迁移方面的问题。这跟自然界一样,迁移也是一个痛苦的过程,每一个人都有这种本能,自然界也这样,企业也一样,动物迁移找到食物,另外还通过季节变化、更迭,能够促使很多鸟类、动物长距离的迁移,找到更好的生活环境。比如这个员工他好像是在出差,他是在赶飞机,也是一种迁移。

    这是内在的一种本能,很多人并没有意识到自己有这种本能,认为这只是一个战略,其实这是人的一种本能。数据的迁移就是这种情况,没有将这些整合在一起,当我们引进新技术的时候,引进的时候我们要进行迁移,就是数据从老设备迁移到新设备上,怎么做呢?或者怎么将数据从一些性能不好的服务器或者存储迁移到性能好的存储或者服务器上呢?所以迁移不仅是一种战略,而是实际当中就已经发生的。

    有一些迁移当中需要注意的要点,首先是经营层面,首先就是考虑到为什么要进行迁移呢?因为我们效率不高,如果你坐飞机坐12个钟头,你就不可能是高效率的了。宕机时间就是无效时间,无论在IT行业,还是在大自然当中都是这样。财务方面的压力,要很快的短时间的完成迁移,如果没有很好的工具,没有很好的战略到位的话,就无法进行有效的迁移,你就做得比较仓促,可能会有风险,很多人做得仓促的时候,就没有想到后果,所以我们要考虑不要影响到业务,电脑系统中断这是一个挑战。

    另外做迁移应该很好的利用现有的很多产品,供应商他们之间哪个做得更好,即使在一个供应商之间,他们内部有很多产品,是不是作为一个实体加以管理。很多产品有自己的管理工具,有的时候相互之间必须很好的整合。

    另外,还有一个所谓残留的效应,即使你的数据已经迁移到新的平台了,或者说迁移到新的服务器的环境下了,你还必须保证所有的事情都必须正常的运行,这个数据是可以获得的。有些数据不应该受到伤害,变得无用,如果从一个设备迁移到另外一个设备,我们还必须有能力去促使迁移。新的迁移的地点必须使得所有的服务器能够了解它的地点,来保证他们跟新的服务器有很好的连接性。从一个设备迁移到另外一个设备,数据迁移在这方面使数据在现有环境下迁移到一个新的环境下,这需要一个存储器的管理能力,并且有很好的存储的网络。

    是哪些因素促成我们来做这个迁移呢?当然技术的进步是显而易见的。因为有很多新的设备到市场上了,希望能够占有市场,希望能够节约成本、提供新的性能,在一个新的平台上提供新的解决方案。有些旧的平台表现不佳,所以就要迁移到一个新的平台上,充分利用新技术的优势。

    另外还有存储的寿命管理,我们必须在这些新的应用实施的时候,延长这个平台的寿命,这个是非常好的。能够持续利用新的战略,另外整合也是一个很重要的原因。在目前的环境下,我们经常听到要不断地扩大数据平台,迁移不光是从一个平台到另一个平台,而是将多个平台进行整合,整合到一个平台上,这样节约空间、节约成本,对数据能够进行更好的管理。

    另外一个领域,我们要谈一谈对于测试新产品的能力,如果有效的数据迁移的战略,不简单能够将这个数据迁移到你选择的这个产品,如果你有一个很好的迁移能力,就会有理性的选择,选择好的产品,甚至可以进行反向迁移,或者迁移到其它产品上进行测试,测试在新的环境下,什么样的存储产品表现最好,如果没有很好的令人满意的结果的话,可以进行调整。比如原来你是用卫星,发现不好,可以用光缆,可以采用新的存储设备提高效率。另外进行很好的性能平衡,来支持数据的扩展,特别是在现有的环境下,对它的性能特别在意,特别是在多个环境方面进行数据的扩展或者是多个阵列方面进行数据扩展。比如我们要求每秒钟多个GB的数据流量,要求很高。另外我们要用新的存储设备来达到的目。很多人现在用的是低成本的、高能力的设备,它们表现非常好,它们成本低,但是有时候表现不是令人满意,所以我们要购买高性能表现的数据集成系统。有些数据需要高性能的存储系统,另外我们还必须部署二流的存储,性能不是那么高,这就需要你有一个平衡。有的时候如果需要高性能数据的时候,你才能去提取高性能数据。平时只要用这种高能力、低成本的存储设备就够了,不然的话,高性能的存储设备就有冗余,就产生浪费。

    推动这个趋势,首先就是IT行业快速的反映业界的需求。我们经常通过什么样的模式呢?就是往往提前好几周来进行规划,来引进新技术,事实上新技术的引进战略,必须很快做出决策,并且它们的部署是比以往更加加速度的速度来进行部署的,而不是以及周或者几天来计算。

    存储一般是看用户需要多少产品,看看到底在什么样的环境下,引进什么样的产品,是关注它的性能,还是可用性,还是迁移数据的能力,还是说它的长寿命呢?如何来做这个决定,我们现在可选择的面很广,最终我们选择存储设备的时候,有很多的供应商可以选择,但是他们都有同样的存储,比如说光盘,现在我们有很多很多选择,你应该实施什么样的存储平台,如果首先在应用层面确定需求就更容易了,它来决定存储设备的性能。如果这个应用不需要太高的性能,就选择其它的。所以,比如说对于这个应用只是要求它更好的获取能力,对这个性能来说,就需要高性能还有五个通道、网络连接、功能性,这种性能对于其它环境是不必要的,我不需要花钱去买这种性能,有很多选择供你挑。你要确定在最高层面有什么应用,这种应用对数据需求是怎么样的,这样来选择存储产品。你要做决定的时候,你的决定应该基于存储的能力与一个管理层之间的关系,如何选择不同的存储产品,也有不同的界面。如果你这么做就更容易了,由一个界面来管理,涵盖所有的平台。

    我们的挑战是在实施过程当中,对用户的业务运营造成了破坏,另外没有能力去反向恢复,比如有的产品迁移过程当中发现不是适用的,获益迁移本身出现了问题,你希望能够反向的迁移。另外,数据丢失的风险无论在什么时候可能会面临这样一种风险,如果从一个平台到另外一个平台进行数据迁移的话,可能会发生这种风险,意味着这种风险需要保证你所迁移的数据必须是它的复制,数据安置的地方也是合适的,在这个过程没有数据丢失的情况。

    传统的迁移解决方案刚刚我已经提到了,迁移本身一般是在你选择技术以后来做的,一般人们选择公司内部已有的技术来做迁移,比如说备份、存储,这可能是最简单的了。这本身也有局限,因为它是非常耗时,另外也有风险。因为你不知道你做备份的时候会不会出现问题,拷贝形成之后,你必须有能力去反过来寻找原有的拷贝。另外你做拷贝的时候,还要有一个中介环节来进行复制。这是一种临时的权宜之计,就是迁移。这会使得你的存储能力翻倍。

    另外,通过光盘进行拷贝,主要取决于你的带宽。通过网络来进行拷贝,我们知道在网络拷贝的情况下有非常好的可达性。快照式的拷贝,同样我们也谈到了会有一个滞后性,有的时候你抓取一部分信息之后,可能到它的新的设置之上的时候,我们知道在这个同时,可能会有一个视频滞后。映射应该是没有问题的,但是它会有整个段以下的时间,如果它在映射的同时,有的时候也是存在时间差的问题,同时还有返回性的问题。

    再看看前面讨论过的,我们做迁移的时候的需求,要求是什么,一般我们希望它有这样一个要求,我们提供的SGI的解决方案里,有一个不间断性。还有一个SGI的虚拟数据迁移。做这件事情的时候,用这个画面可以很好的、形象的表示出来。有不同的办法来做一个及时更新的数据,同时提供迁移的数据,这是根据不同的环境来决定的。可以自己做一下拷贝,同时可以把阵列改变,同时会基于这种阵列做数据转移。但是所有这些都根据中间整个环境的不同产生变化。我们会有不同的产品,会支持这样的服务。如果我们把它放到光缆之中,就可以来提供非常好的多点对多点的很好的数据的迁移,能够包括不管是有哪些连接到整个网络之上,都可以做很好的数据的存储和迁移。这样对于整个运动,同时可以提供出非常好的服务,特别是在全球范围内,做很好的数据迁移的服务。

    下面看一下整个虚拟的服务,现在它涵盖了所有需要有的信息的传输,来完成这个服务。因此我们知道,我们现在有很好的数据的收集路径,还有管理路径,是能够分开的,控制和管理,能够知道我们在数据收集的时候怎么管理。数据的收集路径是单独分离出来的,能够确保我们的数据传输能在我们的掌控之下,也能确保我们用同样的路径,用同样的功能、同样的技术,保证这个系统非常高效的传输。在这个环境之下,可以把我们的数据自由的传输,而不担心数据的丢失。这是一个基于我们数据的光纤,还有新的光缆出来,能够接收这些数据。同时提供了分层次的支持,比如从A点到B点,这是一个新的存储。我们能够利用光缆传输,同时使这个传输能够通过新的点,不被间断的传输到新的点,同时可以更好的控制它的整个传输过程。特别是根据不同的服务器环境来进行数据传输。我们建立了这样一个环境,有很好的新的设备,他们不知道我们的数据从一个传到另一个,他们现在只需要知道,告诉我们的IO他们的需求是什么,我们就直接可以应用我们的产品和技术来解决,提供很好的解决方案。

    如何做到高效和有效呢?虚拟技术或者是迁移的技术,使我们有非常多这样的优势和好处。第一点,它不会有商务方面的一个影响,因为它是不受影响的,这样我们整个环境不会受到影响,我们把新的信息注入到新的需要中去的时候,不受影响,确保统一性。我们会做技术更新等等,都会做新的数据的迁移。

    当我们在使用新的技术的时候,需要数据传输不间断的情况下要不断地去做。运营中的影响,有的时候会有中止或者数据丢失,特别是在比较传统的数据传输中会出现这样的问题,我们希望能够解决这些问题,有一个回传的能力,不管怎么样都能很好的识别出来,保证数据识别的质量。

    要使整个数据传输简单化,使工作流程简单化,也非常重要,特别是我们会有一个特别的平台,让它能够跟我们的这种网络相接,这样会使我们能够代表不同的传输,进入不同的环境,在不同服务器的环境下相连。还有生命周期的管理,我们的存储产品生命周期可以有这个技术的更新,但是同时我们可以确保这种传输不间断,可以有一个渐进式的整个的数据迁移的情景。我们会分不同的层。这样会有不同的选择方案,还有不同的选择类型、存储类型,可以在不同的层面上申请,适合自己的数据迁移。这样一个应用,应该跟整个服务器环境相关,要看整个存储能力,看你需要存储的时间,同时还可以进行有效的备份。它应该说是一个非常好的、渐进式的数据迁移,而且是基于环境的量身定做的。

    这样的数据迁移可以在业务运行的情况之下做数据传输。同时还可以不断升级这种存储,这样的存储对我们来说,给我们提供了非常好的解决方案,让我们的迁移能力大大提升,能够使我们的客户来加速新的存储的能力。也就是说,我们可以减少我们的待工时间,可以更大幅度的发挥设备很好的性能,就是我们可以完成这个数据。比如我们开始进行数据迁移的时候,能够达到同步进行。比如说我们需要把数据反送回来,或者反送的时候,在现有的设备基础上进行非常好的追溯。设备分组是非常重要的概念,对任何组织都非常重要,因为要考虑成本的问题,所以你可以让我们把钱花在刀刃上,在真正需要投资的时候才去买,而不是花在无用的设备上。

    还有信息量的问题,我们会有分层进行管理,一旦需要服务的时候,就可以选择不同服务的类型,我们有100兆兆瓦传输的量。不管你需要的存储量是多少,应该是跟我们的服务相关的,应该是无线型的。这样经过分层也避免了一些不必要的麻烦,对服务器也是很好的模式。

    通过一些供应商提供解决方案,我们可以去给任何客户提供服务,他们并不需要你必须要有SGI的设备,我们给他们提供的是解决的方案,我们在提供的这些解决方案,会给客户带来非常好的收益,尽管他们并没有其它的一些存储设备等等,也没有关系,我们可以通过提高我们的技术,来给我们的客户满意的答复。

    我们是第一个可以提供进行多点对多点或者任意点的数据迁移,而不用客户进行非常多的接触上的操作的供应商。我们有跟踪的后续服务,给他们解决中介、媒介的问题。

    我们会有集中的多层次的存储管理的工具箱,通过这个工具箱,我也在实验室里用我的工具箱,在SGI的时候,我们会有不同的融合,有不同的产品,在实验室里把各种产品的优缺点融合,在给客户提供服务的时候,确保提供的服务比较适合,这是实验室产生出来的非常有效的,同时也是非常有用的服务工具。可以把我们的环境和基础设施提供给客户。我们会有一个非常好的存储池,我们可以从不同的设备上接收这样的信息,同时把它作为一个单独的实体,所以就不用管理每一个不同的服务设备,这是给我们提供的一个单一的存储池,这也是我们产品非常好的特性。同时我们还可以有非常好的分层次的存储管理,比如从一个平台转到另一个平台的时候,会有基于项目的信息的存储和资源的存储,所有的这些都应该说跟我们不同的分层相关,同时我们可以进行很好的修正。

    又是一个复制,这是整个数据迁移的能力,在基于每一个项目的时候,有数据传输和存储池,我们会把它能够在同一个存储池里面,在不同的区域进行非常好的传输,并不需要知道他们在哪里能找到一个存储池,他可以给我们提供非常好的达到客户要求的数据迁移和传输。

    我们的客户并没有任何SGI的设备或者服务器的环境,他们来告诉我们说,我们来谈一谈,我们如何能够做这样的迁移,它的能力如何,而且这种数据迁移是不能够有数据间断的前提,要非常快的完成数据迁移。我们给他们做了这样一个虚拟的存储,让他们决定我们有非常好的解决方案,我们给他们提供SGI存储平台,是4500的型号。这是一个非常好的数据传输的机制。可以用卫星等等,其实他们是在用信息和数据来更好的管理移动通信的电话,他们需要我们能够24小时一周7天不间断的数据传输。我们大概有25兆兆字节的传输,这是非常大的传输。同时还不能有停工期。首先就是看看我们整个数据要传输到哪个地点去,再看看背景如何,进而提供了解决方案。他们不需要这样一个映射,他们把数据映射回来,返回来,我们给他们做新的数据存储的网络,能够帮助他们把数据反送回来。我们把他们的数据从虚拟的环境传到他们存在的环境里去,所有的这些应用都是在网络上进行的,而且同时不间断的进行。所以我们现在就是给他们提供这一些迁移方案,对他们很有吸引力。

    还有其他的数据服务,比如说用同样的技术、同样的产品可以提供不同的迁移,同时我们还提供灾难恢复性的信息传递。在同一个产品或者服务平台下,我们给他们提供灾后恢复的功能和存储。我们用同样的一个功能,来提供一个快照,给我们新的设置,进而能够对快照进行二级备份。

    另外一个领域,就是用所谓的快照来进行所谓应用的发展,我们有了新的应用之后,提供使用我们现在存在的信息数据,我们尽量做备份和拷贝,对它们进行复制,再用不同的方式、不同的用途发出去。

    总结一下,我们现在有能力来提供迁移方案,在不同的客户之间,一般来说是可以做,没有问题。同时我们整个的迁移的过程是不间断的,同时能够分层,不需要去想如何进行整个迁移,而是去做就可以了。

    我们还可以提供非常全面的商务解决方案,我们现在会有SGI的产品,同时,会有SGI提供很方便的存储,还有产品、能力等等。我非常高兴,我们有非常好的存储管理经验。

    整个的数据迁移,不仅仅是迁移,还应该是对现存存储环境的补充。同时我们觉得,我们需要能够把我们新的虚拟的存储加入到现有的存储环境中去,让它更好的为大家服务。

    感谢大家来倾听我的演讲!