大数据催生海量数据 曙光超融合引领下一代数据中心

最近两年,随着云计算的落地和大数据的蓬勃发展,大家对IT基础设施的底层产生了新的看法。也就是说云将底层的计算、存储和网络完全池化,而用户应用所面对的都是软件。这就产生了人们最近经常挂在嘴边的软件定义基础设施。最底层的平台走向融合的基础架构,而最上层走向软件定义。然而,今年曙光公司从用户应用的角度理解这一问题,提出了新的超融合架构,将强大的高性能计算技术引入到数据中心中,也满足了用户的未来需求。在最近召开的大数据技术大会上,DOIT记者正好遇到了曙光的两位专家,就这个进行了采访。

云计算促使海量数据崛起

曙光存储产品事业部存储方案部经理刘冠川首先回顾了IT应用的发展和当前用户面临的困境。最初用户部署了IT系统,后来才发现其实IT资源的浪费问题以及资源共享性并没有那么好,于是就通过虚拟化技术,使得云计算得到发展,基于互联网的方式获得服务更弹性的扩展性非常好的模式。而发展到今天,因为有了云计算的基础,所以在上层很多应用被激发出来,这样就产生了非常多的数据,包括移动互联网,手机客户端,以及朋友间相互沟通等等这样的很多数据。还有基于互联网的兼容的视频、智能电网等等,数据增长非常快。

 

 

 曙光存储产品事业部存储方案部经理刘冠川和曙光大数据部经理宋怀明接受记者采访

为什么表现为非结构化数据的快速增长,这个时候,原来老的数据分析挖掘相当于在仓库上的数据集成,没办法去处理,这个时候叫新的大数据技术,先是高性能计算然后是云计算最后是大数据,还是三个不同的历史阶段,中间是变化相当大,会出现这样的一个问题,有些用户他同时需要到高性能计算、云快速的处理,同时又需要云的服务,还需要数据分析挖掘大数据,而过去的基础架构很难满足现在的实际需求。

来自用户需求“超融合架构”=“高大云”

正是基于这些实际的需求,曙光开始将这三个大的模块系统融合到今天的数据中心中。

关于曙光的超融合架构,曙光公司总裁助理兼存储产品事业部总经理惠润海上次采访的时候这样解释说,曙光超融合计算构架把当下用户IT业务必须三个构架融合起来,为用户业务自动分配运算资源,统一管理任务并分别部署到三个不同的系统构架。曙光超融合计算构架可以理解为云计算和大数据的一个延伸。

 

 

中科曙光在大数据技术大会上的展台

超融合构架和之前的融合架构具有很大的不同,在融合架构中只是将三个或者四个构成部分组合在一起,每个构成部分本身仍然相对独立,而在超融合环境中,所有的构成部分都是无缝衔接在一起看不到任何缝隙。曙光公司副总裁邵宗有对此表示,曙光“超融合”数据中心整体解决方案是目前曙光融合了HPC超算中心,城市云计算中心,大数据处理中心建设的关键技术,打通各业务中心的孤岛建设模式,统一协调管理底层得存储资源,采用统一调度系统管理计算资源。

曙光大数据部经理宋怀明介绍,曙光传统的高性能计算这块儿在国内是连续多年在市场占有率第一,云计算是发展比较早的,大数据其实是最近这几年,超融合计算概念提出来,曙光超融合源自高性能、大数据和云计算这三方面,简称为“高大云”,ITC、云计算、大数据这块儿其实是从我们的用户实际需求出发的。曙光将现在底层后端的研发进行深度的融合,相互把各种不同的技术上提升起来,变成超融合计算的概念。这个超融合有两层含义,一个是相当于超级的计算能力,另一个是超越了过去一般的架构。

其实曙光的这个提法不是在实验室里面想出来的,而恰恰是从用户的实际需求开发出来的。曙光最开始的用户各地超算中心也面临这些转型、挑战,因为超算这块儿应用发展不足以支撑超算中心现在的这种业务转型,支撑他所有的业务。所以云计算到现在很多超算中心的转型叫大数据中心,在云之上的需要一种能够适应多种场景的,超算、云计算、数据分析挖掘这整个适合复杂的业务模式整套解决方案,我们做超融合计算是应着用户的需求而产生的架构。

这两年,集成系统与一体机也在云计算和大数据应用中越来越发挥作用,而且曙光也有自己的大数据一体机产品,谈到一体机与超融合的区别,刘冠川经理解释说,如果说大数据一体机是产品加解决方案的话,超融合计算其实是整个数据中心的解决方案,其实现在曙光提的超融合整体方案本身是开放的,并不只局限于曙光的设备,因为我们曙光是作为一个企业,一方面提出这个概念,另一方面也在里面做很多整体的系统的监控管理运维这方面的工作,有很多软件开发的工作,目前这部分是基于曙光的硬件来做的运维管理的东西。用其他的设备也是可以的,但是这可能具体到运维管理有一些优势不一定能够发挥出来,但是整个框架是支持的,可以针对具体的设备或者是机器架构等等做一些具体的监控、报警等等,逐渐加进去,也是可以支持其他的设备。

用户如何实现超融合

从与一体机的区别大家可以发现,超融合架构是通过架构来实现的,所以就不存在一个厂商产品绑定的情况。也就是说,用户在完善自己的应用系统方面,云计算、大数据与高性能计算这三个大的系统模块,可以循序渐进按需求来实施部署的。曙光所服务的用户分为两种,一种是传统的用户,最初他们是用信息化系统上到云和大数据,然后升级到高性能计算模块,成为了超融合,另一种则是过去的超级计算中心,他们本身是HPC架构,他们也希望通过云计算整合将自己更多的资源和计算能力对外开放,成为一个大的云和大数据的平台。

宋怀明介绍说,曙光在早些年就开始做海量数据处理的的工作了,那时候偏结构数据多一些,当时大家还不叫他大数据。2012年的时候曙光推出自己的Hadoop版本,慢慢的应用就多起来了,包括今年做的案例三十多个,行业现在覆盖的比较广,大数据应用还没那么深入,所以我们现在包括新华社、北京公安、中国航信、银联、农业银行总我们都做了相应的大数据部署,有的是平台、有的是平台加应用。从大的行业来看,政府这块儿是最大的一个市场,其他的科研这一块儿,因为科研包括中科院很多院所环境治理,最开始是高性能计算为主,天气预报、大气治理,现在由于数据量积累的很多,用大数据方法做数据分析预判,整个因为他的系统规模是非常大,所以在上面构建了云计算对外服务的环境,后端是大数据和超算,具备这两个功能的系统。

可以这样说,随着大数据的不断深入发展,各行各业所产生的数据会越来越多,相信大家对曙光的超融合架构会越来越了解。