4月23日,由DOIT主办的首届软件定义存储峰会在深圳举办。
新华三云计算架构师姜帅以“超融合—从云计算到云数智融合”为题,结合刚刚在重庆举办的2019Nagative峰会上发布的超融合系列新产品以及云计算的战略,谈到了在超融合领域的最新的进展和个人的一些思考。
本次大会,以“软件定义存储未来”为主题,DOIT主办,中国开源云联盟、中国超融合产业联盟、Ceph中国社区和腾讯云+社区提供支持,吸引了来自全国各地的数百位专业观众参与。大会探讨了SDS业内最热门的六大话题,包括SDS趋势与实践、开源云存储、超融合、Ceph、互联网云服务等等。数十位国内外专家、学者和用户亲临现场,结合软件定义存储技术、应用、现状及趋势进行了深入交流。
新华三云计算架构师姜帅
以下内容根据速记整理,未经本人审定。
姜帅:大家下午好,自我介绍一下,我是姜帅,负责新华三集团超融合业务,感谢虞总的演讲,我学到了很多。
我昨天是从重庆直接飞到深圳的,因为之前我们在重庆有一个峰会,发布了超融合的最新的产品,一些云计算的战略也在会上做了发布。所以我今天汇报一下集团在超融合里面最新的进展和我个人的一些思考。
关于IT基础
我2013年做产品经理的时候就是做超融合这个产品,那个时候华三云也是刚刚起步,我们想把云计算做好,所以当时我们做了一个产品,就是把计算虚拟化和存储虚拟化合在一起,希望找到一款可以满足云计算需求的存储。
2013年推出的产品就是计算和存储虚拟化的融合,这种产品就是一个典型的超融合的产品,到现在5、6年的时间过去了。可以说从超融合的诞生到市场的起步,我们看到超融合的这个变化的趋势。
现在讲超融合的定义没有意义,大家都是IT的从业者,对于超融合的产品形态已经非常清楚了。
最早的超融合就是以存储为核心,又融合了计算虚拟化,这两个因素加在一起就是最原始的超融合的架构,超融合以存储为核心,超融合又是一个非常重要的应用场景。发展到现在大家看业内所有做超融合的厂商他们还仅仅是最初的状态吗?早已经不是了。
去年我们超融合产业联盟发布了一份技术蓝皮书,认为云计算肯定是超融合产品的一个未来的发展方向,换句话说,超融合是云计算的一个最佳交付形态,它的演进过程当中会融合越来越云计算的东西。
云计算是一个很复杂的东西的,我们为很多的客户做了大量的定制化和咨询以及运营模式的探索,投入的人力非常大。但是对于一些初创的企业和中小企业来说,他们是抗不住人力资本的投入。他们怎么办?就是做超融合,超融合是以软件为核心,是把软件硬件化。
这次我们重庆的峰会邀请了IDC的分析师做了演讲,他的一些最新的观点我还是非常认可。比如他的演讲中讲到现在大家都在数字化转型,但转型怎么做,面临的是什么,他列了三大挑战,并且有三个应对的策略。
第一个策略是要建立数字化的愿景与路线图。
第二个是打造以云和智能为核心的数字化原生IT与技术架构。
这里讲了三个,第一个是云原生,它核心的价值就是能够让客户的IT的业务可以快速的开发、部署、变更、以及迭代,它不是一个技术,它是一种模式,大家千万不要认为云原生会是技术,它涉及的技术太多了,我们想想自动化的开发工具和开发流程,这个是云原生诞生的过程,它还需要微服务的治理和改造,这些所有的技术构成了云原生。第二个是多云的管理,无论现在是混合云还是公有云还是私有云,每一个云都是无法互相取代的,如果企业真正的利用这些资源,必然是有多云。会议上他发布了一个数字,问客户有多少公有云在用,大多数都是选择3—4家,这是突破了大家的意识的范畴,多云肯定是未来的普遍现象,多云的现象下如何满足客户的需求,比如需要一个管理平台对多云进行管理。第三个是UI重构,人工智能会改变交互方式,大家都知道IT的发展就是把复杂的东西变简单。智能手机出现之前,大家想想没有手机的时候我们出门消费都不方便。到2023年,中国支持AI的人机交互接口将取代目前50%基于屏幕的B2B和B2C的应用程序。
第三个策略需要去变革组织架构并构建新的KPI。
关于超融合的方向、目标和策略
第一个就是人工智能实现自动化的百分比。上午讲技术的时候很多人都提到了AI,通过AI的技术可以实现自动化的运维和运营,很多的人为的监控的工作比如最后一排坏了怎么扩容,需要人脑计算的东西全部都可以通过AI分析,这个仅仅是SDA里面就有非常多的AI的概念,拓展了IT的架构AI的技术肯定会极大的改变我们IT的运维。
第二个是边缘计算。大家说云计算是数据的大集中,其实是把可以集中的数据集中,很多数据不能集中。这里有两个困难,一是无法解决网络时延和带宽的问题,放到云中心的话首先就是时延,二是带宽,这个时候就需要边缘计算,势必也需要一些边缘计算的设备。
第三个是系统的消费模式。做超融合真的不便宜,有多少客户会说你用了软件定义的方式会便宜,其实没有这回事,只是改变交付的形态。我们和客户讲,超融合解决的不是首次购买成本的问题,是后期的运维和机会的成本。超融合其实是把云计算变成了盒子,它的本质是为了解决云计算环境下或者基础架构下搭载运维的复杂性的问题,这就是超融合为什么受客户欢迎的原因,就是因为它解决了复杂性,一个界面把所有的东西都可以管理起来。
关于IT投资的优先级
刚才讲了数字化转型的一些观点,从新华三的角度看云计算的发展,到现在我们应该关注哪些东西,其实我们讲的第一个,PaaS和数字化转型是紧密连接的,因为要数字化转型,所以要做PaaS混合云和边缘云。第二,中国的市场因为是政府主导,所以需要满足现在自主可控的需求,华三云的超融合已经可以实现部署在完全自主研发的CPU上面。第三,以云承载AI的能力,云是技术架构,AI是上面的一个应用,需要把云和AI融合在一起。第四,要做全生命周期的运维。 第五是要做长期化的解决方案。
这个是重庆峰会上讲的云计算的发展趋势,具体讲到产品,原来讲超融合,现在我们讲ABC和UIS,可以说我们提出了一个概念,我们说它会越来越多的融合云计算的一些组件,之后变成标准件解决客户承载云计算复杂度的问题。其实这个架构大家已经看得很清楚,2013年实现了计算和存储的虚拟化,我们就已经说是非常强大了,虚拟化是非常成熟的东西了,但是讲新华三的体系里面也不是问题,我们一直擅长做这个。
云平台一定是要做很多的定制化开发,让它变成轻量型,中小场景下的话,它的复杂度肯定是满足不了客户的需求,AI还有大数会产生很多的客户价值地。
软件统一在一起承载客户的业务系统,但是客户的业务系统其实是不一样的,尤其是ABC覆盖的面太大了,客户的需求不一样,有些时候要求高密度存储,有的是高密度计算,需要把相应的业务在一个平台上,因为网络需求和一些硬件需求是不一样的。
超融合发展到这样的阶段下,仅仅类似我们这样的功能是不够的,我满足边缘计算或者AI的需求,如果只有这些服务器显然是特性。所以我们是做超融合的形态。华为的首席架构师也讲了一个观点,就是软硬件的解耦是行业的一个模式,但技术的发展和客户的角度还是软硬一体化的交付,他提出了几个原因,和我遇到的情况基本上是一样的。
无论是SDS还是超融合,承载的还是客户的核心业务系统,这里必须要进行全面的测试,而不仅仅是兼容性的测试。我非常清楚做一个兼容测试大概是什么样的状态,就是把这些功能全部测试一遍,测试通过可以实现就可以了,但是这个显然不是做企业级的方式,真正做企业级交付的产品必然需要长期的测试。我们每一个版本测试的时候通常是测试半个月到一个月,兼容性测试通常就是一两天。
强烈推荐我们的客户来去用软硬一体化的产品,但是我也不强迫客户,客户要求兼容性我们也可以做,这些其实就是我们讲的软件定义技术。
我们的计算虚拟化现在也发展到了10年的时间,成为了中国国产虚拟化第一品牌,我们做了很多的业内的首创,比如动态资源拓展,2013年的时候其实就可以实现了并且做性能测试全球范围内两次夺得第一。软件定义计算,这里我多讲一下,还是要做简易的,不要做复杂的。
(PPT图示)
刚才讲到我们有很多的硬件的技术,这个是我们硬件的一个技术,这里的硬件需要满足不同的场景的需求,重庆的峰会上发布了完全自主研发的产品,它其实是一个高片系统,大家知道做得最好的是惠普,我们最早的硬件就是基于他们的技术做的,惠普新产品发布了两年之后我们又发布了这个产品,相当于我们在他们的基础上做了一个最新的架构。
其实他们的产品就是可以实现资源灵活的调度,他们是使用了一个硬盘可以灵活分配的方式实现的,我们在这个基础上加了超融合软件,变成了一个超融合一体机,这个里面还有一些独有的技术,大家可以看到这里可以看到最下面的就是硬盘的数据,可以支持40个硬盘插入,有一些两个半宽的存储节点,可以实现14个硬盘的插入,并且可以实现硬件和软件的同时安全,硬件的安全是把我们的防火墙的硬件插入之后应用,并且它的背板这里一个框子可以卖接近15年,客户买了之后可以随着自己的CPU升级进行升级,背板带宽至少要满足10年的发展需求,并且这里的背板是个位数,我们现在直接进行了一个升级。
我们的超融合管理模块是软硬一体化的设计,右边是我们为ABC做的一些架构的设计,我们的US7000,=其实就是面向我们的AI的场景来承载AI模型的训练和在线推理。
超融合具备的承载能力
讲完了整体架构,今天上午大家都讲云,我们说超融合到现在也已经具备了这三个业务的承载能力,并且有了更多的组件。
私有云做了一个轻量级的平台,一个小时就可以虚拟化环境下搭建好,同时占用的资源非常有限,我们研发的付出让我们实现了这个功能。
对于客户来讲,云计算放进盒子简单易用,同时还可以硬件加速,我们的一些芯片可以实现网卡的卸载还有硬件的卸载,今天上午华为也提到它的一些硬件卸载的技术,基本上大家看到的东西都是一样的。
这里还可以实现分权限的管理,分支机构这里多个肯定我们要分权限,多级管理和多租户这里都可以实现。混合云里面也是集成了UIS的模块,因为底层做了一个最小的系统,每一个模块都做得很大,我们把每一个模块都变成了一个标准的插件,相当于我里面插东西,插进去之后就使超融合具备了一个核心的内容。公有云就是成本不高,可以快速的得到一些资源,并且可以无限的拓展,这个其实是私有云不具备的,因为私有云CPU和设备不够的时候还是要采购的,采购的时候还是比较慢的。
公有云就是上面说的容量和成本,私有云是公有云解决不了的定制化以及和客户业务的强相关,还有客户非常关注的一些业务和数据的私密性的保证,IT发展到现在,谁也不能保证云计算被取代,客户把所有的业务放在公有云的话,这里就是有问题的,或者就是公有云可能倒闭。所以就是公有云和和私有云是共同存在,之后说到混合云发展到现在其实又回到了开始的云计算的状态,就是每一个客户的需求都不一样。
说到边缘云,这里真正实现了ABC的融合,每一个边缘产生的数据都有很多的场景,比如智能的监控还有工业的制造以及物联网还有移动基站等等,产生的数据完全可以搜集之后上传到云中心,之后进行模型的训练,并且直接下放到每一个终端,在终端进行处理。这个就是边缘云解决方案的一个核心的挑战,大家想一下,这个挑战边缘的场景是异常复杂的,是超融合需要考虑的,就是我们怎么来去满足这么复杂的一个边缘融合的环境:首先第一个软件要轻量级部署,当然虚拟机也支持,第二个硬件要协调,第三个是边缘的协调化。
讲到最后。从2013年到现在,新华三客户保守估计是超过了5000个,比如中国人保用我们的机器承载他们分公司的任务,所以说华三首先非常适合做超融合,我们把云变成一个盒子之后卖得很好,因为我们也有大量的分支机构和人员。
今天的分享就到这里,谢谢大家。