现在,云计算已经成为神州大地风风火火的名词,核心就是IT资源的虚拟化,如何通过产品完成自身IT系统的虚拟化,离不开专业的技术。针对以上问题,在2012年9月25日老城沈阳召开的主题为 “融信息精华 合数据力量”的存储沙龙中,惠普公司的技术顾问王新德给予了解答,他演讲的题目为《IT 虚拟化利器—HP 3PAR》。
以下是王新德演讲实录:
各位领导,各位专家,大家上午好,我是王新德。
下面我给大家介绍一下惠普的企业云方式这种智能存储,这是一款新一代的存储计算架构,它与过去的传统的存储架构有着明显的不同。
之所以产生了这一个新一代的存储的架构是因为我们现在存储的世界,已经发生了巨大的改变。过去,我们通常存储的时候,只是考虑了一下我们的容量有多少,而且数据量没有现在这么大。现在,已经有这种达到了不可预测的工作负载,和高性能的混合的负载。因为我们现在的业务,不仅仅是一些数据的在线的访问,已经融入了媒体还有高清晰度的图象等等信息量。
所以,有大的数据块的访问、有连续的访问,也有在线的、随即的访问。所以,每一种的工作负载都不一样。所以,我们现在如果采用一个传统式的单一的这种结构,很难满足我们的复合的,或者是混合的工作的负载。
我们现在的存储环境,需要满足的这种虚拟化的,满足大数据量的,还有我们现在所谓的架构云里的存储的需求。从业务的角度,我们现在的随着计算机的发展,新业务增加得非常多,这种业务随着计算能力的增多,会有各种各样的不同的业绩。
新的应用程序需要更高的灵活性,让我们的存储,能够适应各种各样的业务的需求,所以,我们现在的这种新程序面临这种的挑战,就是大规模的整合。还有就是安全的分割的数据,以及这种不可预测的应用程序。因为我们随时都会产生新的业务、新的程序,这都是我们现在所面临的问题。要解决这些问题,我们可以通过我们的采用的技术,就是虚拟化,和系统范围内的条带化,还有我们采用网格的设计,再一个我们要支持前面提到的混合的工作负载,再一个就是联合存储。
我们这个3PAR基本上采用的都是这种的方式。
所以,我们的3PAR就是一种专为云计算打造的架构。我们这个是做得更精细化,是按照块来做的,把一些块分成更多的小块,通过盘来做这个。具有的这种系统范围内的条带化,我们可以把我们的一个主机,分开。把所有的数据,在所有的硬盘上条带化,这样的话,就可以从根本上解决我们磁盘访问的IO瓶颈。
还有一个我们最新的设计,是采用网格的控制设计。我们这个可以看一下,在8个节点上,形成的这种网格上,是每一个控制器都可以控制我们的服务器所需要的这个东西,这样的话,当我们有IO过来的时候,可以在8个节点上,可以为主机的存储的请求提供服务。
还有一个,就是混合工作负载的优化。这个就是说,我们过去如果有连续的大IO,上来之后,后面的小的在线的处理的,就要等这个大的做完之后再做。我们现在在3PAR里面,采用了第四代的大规模集成电路,来控制这个信息和数据信息,讲这两种不同的信息,进行了一个隔离,这样的话,就以,而且可以把这些不同的业务,分配到不同的节点区。这样的话,就可以在一个阵列上完全不同工作负载的请求。
这样,因为在云环境里面,肯定有各种各样的数据的请求,我们通过这个大规模电路,由硬件直接控制,实现这种新一代的云架构的数据。
首先,这个我们看一下,(PPT)3PAR在第三方网站的一个测试。这个是我们可以达到45万以上的LPS,这个整个来看,传统的在原来基本上是在30万以下,现在能达到这么高,是因为我们现在的3PAR已经在传统上产生了质的飞跃。
我们前面从应用的角度,看我们面临的挑战,再从资源上来看一下。因为资源的限制,需要我们提高整个存储的利用率,这样,就要求我们,比如说传统的过去就是说,是模式就是需要多少就配合多少,但是呢,你实际上,写入的数据,可能很多都是写了一部分,这种情况下,等你再需要分配新的硬盘来用的时候,已经没有了,这里有很多的浪费的。而现在的解决这些资源限制的技术,就是通过这个一个是精简存储的配置,还有一个是自动化的数据分层。
精简配置就是说,我们可以同样分配这么多,建立这么大的一个东西,但是实际分的物理的空间就是按需要来分。这样呢,这些剩余的空间就可以再建立一个,当我们的池子达到一定的百分比的时候,我们可以采用系统的告警,在需要的时候,再采购新的存储空间,这样使我们的在前期的投入,就会减少很多,而且在这个时候,在整个的阵列里面,浪费的空间相对比较少,节约了开支,降低了能耗,达到了绿色的云存储的技术能力。
之所以重要呢,我们的精简配置和别人不一样,我们是具有一个全面的精简能力的一个技术,别人家的可能说,我就可以建造一个精简配置的盘,之后你用了很多了,你有很多数据删除之后,空间也回不来,这是一种。还有一个,就是说,你非精简的,你要换成精简的也很难,这样我们从三个方面,都可以保证我们磁盘的精简。
首先是启动精简,我们分配的是按16K,我们需要多少写多少,分配多少,这个是我们建一个精简的。
还有一个实现精简。这个是我们具有精简转换的功能,头一个大家提到的精简,大家基本上都能满足,但是做到精简转换,这个是一个比较难的。
第三个保持精简。这个是现在很多的家,很少做得到,但是我们可以实现这种透明的,重新精简的功能。我们的这个3PAR,通过硬件来识别,通过操作系统的配合,可以发现删掉的哪一部分,刷新能成0之后,重新回到我们的精简池里去。所以,这一个卷,删掉之后,可以把空余的收回来。这是一个非常全面的精简的技术。
还有就是,适应化优化。块级做这个子级的分层,SSD的盘非常快,但是价格非常高,我们会有70%左右的IO都集中在很少一部分,只集中在20%左右的磁盘上,在这种情况下,我们就产生了这种技术,叫做适应性的优化,我们经常访问的数据,会放到SSD盘上,不经常访问的放到SATA的盘。这个时候,当我们正常访问的时候,感觉到我这个盘非常快,而且这个盘的容量非常大,这样达到适应性优化。
精简为什么重要呢?就是说,我们现在通过精简技术,可以达到这个看见一个案例的话,可以从非精简是53TB,精简之后就是105个TB,这样节能就达到1800万美元。因为计算机费电是一个非常高的指标,我们都要环保、绿色。这样的话,一个是主频降下来,可以为我们的中心节省很多的钱。
还有一个就是说,大家都知道,存储啊,管理起来过去都是非常非常复杂的,而我们怎么能把我们的存储快速地部署到一个云环境里面去,就是运营的费用,很多的是用在管理的费用上,我们的3PAR是怎么做的呢?我们是通过自动的管理的功能。3PAR具有这种自动的管理功能,你不需要去看每一个盘放什么,你就说,我在这个池子里面放一个虚拟盘,按我们的规则去定,你不用管哪个盘,这样的话,我们管理起来非常简单,所以,就可以实现迅速地部署,甚至重新地部署,我们都可以通过模板来实现这些工作。
这个呢,就是我们采用3PAR的自动化的存储配置呢,来实现我们在这种云环境里边的一个应用。首先,我们3PAR的存储管理员建立一个存储分配的策略,这个是一次性的策略的设置,在整个云管理当中,建立一个模板。整个云管理当中可以使用的一个模板,到我这个3PAR当中,云业务分配多少资源的一个模板。我们服务器这边,整个云管理,按照我们需要的存储,从我们的目录当中,拿到一个模板之后,要一个适应性的卷,就会把你这个卷建到SSD盘上面,你就找一个模板,就可以做,就产生一个盘,分配到你这个业务当中的服务器当面去用。之后呢,就是说,过去的存储,可能管理服务器一套,我们现在的3PAR可以将这些复杂的认证,都整合在一起,建立一个、启动一个模板规则的限制,通过这个限制,就相当于这两个做一个管理,在这个过程中就不需要我那边做完服务器了,还需要一个3PAR。这样的话,一个云管理员就可以管理,不需要额外的,这样很流畅地把我云环境的业务创建起来。
这个就是我们刚才把前面的形象化的给大家看一下,首先在一个云环境当中,我们讨论一下上什么业务。(PPT演讲)
所以,我们说的几分钟就是说,首先一次性地管理员的时间,就是5分钟,把这些东西挑出来就可以,之后报到各部门审批,5分钟,剩下就是配置这些基础设施。脚本运行起来,都是后台自动来进行的,之后呢,环境搭好之后,有自动的云管理的软件,形成一个自动的业务。是一个非常适合在云环境里,整合得非常好的东西。
我们的3PAR是可以包括我们的系统的高速的运转,一个业务的持续的发展,所以呢,它是一个新一代数据中心的一个核心的存储,其实在好多的特性在存储上是很难实现的。因为它是诞生在一个新的时代里,是应运而生的,这个是可以降低我们的运营成本,和采购的成本,就是说,我们刚才说的精简,精简可以降低50%的成本的话,电也会节省50%。
存储管理的负担也减轻了10倍。
提高存储的效率,提高1倍。
这个就是说,我们3PAR产品,在企业存储领域一直是保持领先的,因为我们是最新的、最可靠的一个存储。
首先我们看一下,这个是最快的单体的存储,在这个区间里,我们是站在最上面的,包括执行力,包括整个的设计的前景,都是在这个象限最高的。还有一个,就是在这个国际存储性能组织里面,现在是最高的,而且是比其他的一些传承的,基本上高出1倍,是一个跨时代的产品,是一个最新一代的技术。
还有一个,在我们国家的政府采购网里面已经入围,具有协议采购的许可。
我们在回顾一下我们3PAR存储的领先的优势,首先是这种创记录的效应,智能的架构、完善的解决方案。
性能是排名第一的,还有一个是全面的精简技术,我们也说了,三个方面。还有自动分层,自动分层包括两个方面,一个是我们适应性的分层技术,适应性就是我们把一个建立在三个不同的硬盘上,自己来调整常用的放在哪,常用的放在哪,自动化的存储分层还有一个,可以在线的将我们的某一个卷自动地到另外一个,这个是一个在线迁移的过程。在迁移的过程当中,主机看到的LUN的号是不变的。所以有两种,一个是自动化的迁移,一个是主动化的分层。
还有就是我们3PAR的虚拟域,就是用来保证我们前面提到的多类型的不同的业务的这种保证,是我们通过分区,可以给在线业务的做出一个,也可以给一个大的数据挖掘的做一个,或者是给一些媒体的做出不同类型的。
还有一个动态的优化,实现混合工作流的管理和自动的负载均衡技术。
最后一个是我们全网状的架构。在网状里面,可能过去听说过的网格计算,每一个节点都可以处理,这样就是有更高的级别,也有更可靠的、更多的控制器的价值。
我们的3PAR的产品家族,主推的有F200、F400、V400、V800。不管是中端的还是高端的,都是采用统一的操作系统,他们的功能都是一致的,比如说,我们将来做容灾的话,可以从高端往低端做,所以我们现在有一个完整的一套的3PAR产品,能够满足我们不同用户的不同的需求。比如有大的用户,我们可以用这个,小的就可以用F200,F200是2个控制器,400是4个控制器,V400也是4个控制器,V800是8个控制器,可以给不同的用户提供不同的选择。
分享一个案例,他现在用的是P950,存储是DS4800,现在要提升,达到一个目的,就是说,把容量提高2.4倍,以及备份的解决方案。还有就是目前,感受到的就是性能相对于比较低,系统急需优化。再有一个提高系统的可靠性,建立远程的容灾。之所以有这个要求,是因为不久前,有一个阵列的控制器发生了故障之后,整个系统的性能下降了10倍左右,为什么会产生这样呢?这个是传统的任何一家阵列不可避免的问题。是采用的单点的控制器,一个坏了,另一个用不了了。
一个阵列控制器坏了,没写到硬盘上我的数据也不丢,可是传统的是一对一对的,在这种情况下,如果坏了一个控制器之后,那个就不能来恢复了。所以,是10倍以上,应该还会更大一些,但是3PAR为什么能够保证这一点呢?如果我们这一边采用视控器也没用,我们是网状的,我们不用面临这个问题。我们会通过第四代大规模集成电路,迅速把我们写的东西,转移到另外两台当中,其中的一个节点上去,所以3个节点,还会保证你的继续工作。
所以我们的性能的可靠性是非常高的,目前业界还没有这种高可靠的性能,所以之所以选了我们的,就是看好我们的这一点。
还有一个,就是说,我们在IO处理性能上,IO提高2.7倍,存储量上还支持一些大的负载,我们总的带宽就提高了,接近了8倍,这个是跟大家分享这么一个案例。
之后,我们在这里面,还通过精简配置,还有做的基于精简技术做的三中心的这种容灾解决方案,还有就是说,我们通过精简实现远程容灾,可以减少我们线路的投资。还有就是说,我们已经提到的,就是说,具有的功能,配置和管理非常简单,这能够达到管理的负担减轻90%,还是我们说到的这个管理的过程,是1/10的工作的能力。
这个是我们3PAR的一些解决方案,包括3CV,在云的架构里面我们两种。这样的话,就是把3PAR完整、有机地整合到我们的云环境当中。还有一个是极速的性能,已经是一个跨时代的性能了。还有一个是我们对客户的承诺,客户承诺,降低客户现有存储空间的50%;还有一个增加了在业界内承诺VF2虚拟提高1倍;再有一个是我们的全球唯一的,在这个里,精简的过程,所以,我们精简的性能,和非精简卷的性能,基本差不多。根据磁盘读写的内容,有的高一点,有的低一点,所以,可以和我们的非精简卷保持一致。其他家的就不可以了,说也具有这个能力,但是当你遇到这个能力的时候,性能会受到很大的制约。还有一个是“芯片级”的零检测的技术,所以,还有就是通过“芯片级”来进行数据的处理。
3PAR最好的应用,其实在很多地方都可以用到,我们在数据库方面,在电子邮件方面,在高压和混合负载方面,都是有非常出色的表现。所以,它在可以达到这种虚拟化,还有这个私有云和绿色的IT,因为我们精简的IT,达到了绿色的标准。
下面呢,就是看一下,我们的3PAR客户的案例,有很多。这是我们国内的三大运营商,包括国外的运营商,还有一些Facebook等著名的网站,还有中央电视台、美国的航空等等,在金融方面,我们看太平洋保险,还有上海银行等等,其他的方面也是非常多的,富士康佳能啊、还有其他的企业。
所以,我们从用户范畴看,就是一款可靠性极大,因为很多都是对可靠性要求高,对性能要求高的,对扩展性要求高的用户,所以我们的3PAR可以在各种各样的存储的使用环境里,都会能够满足我们的用户的需求。
以上,就是我的介绍,谢谢各位。