IDC研究表明,数字领域存在着1.8万亿GB的数据。企业数据正在以55%的速度逐年增长。面对这样的发展趋势,企业的CIO们正在绞尽脑汁,希望利用大数据帮助公司获取新客户减少业务波动性,进入新产品、服务和区域市场,并寻找新的创新以获取竞争优势。
大数据在带来商业契机的同时,也为企业IT带来新的挑战。企业用户需要从IT基础架构、智能分析软件等方面全方位进行考量,而确保企业大数据应用成功的重要开端,就是打造一个适合大数据整合的基础架构。
然而,面对市场上形形色色的大数据解决方案,CIO们未免感到有点束手无策,因为很多大数据的处理和企业的关键应用密切相关,这就对大数据的基础架构提出了更高的要求,比如大数据平台能否稳定运行,能否快速处理和分析数据,能否随着业务的发展而便捷地扩展,能否将企业中现有的异构平台有效整合,能否保证数据的安全等等。这一切都让CIO们在选择大数据平台时不得不谨慎行事。
那么企业在选择大数据平台时究竟需要考虑哪些因素呢?什么样的平台才能满足企业大数据整合的需要呢?在前不久举行的主题为“大数据危机 大整合出击”IBM ELS主机大数据策略发布会上,IBM和IDC的专家们给出了明确的答案。
大数据平台的五大基因
业内对于大数据基础平台的选择有多种建议,都是“公说公有理,婆说婆有理”。不过,国际知名分析机构IDC对于大数据平台的5点建议在业内最具代表性,最主要IDC的结论是建立在对企业的广泛调研的基础上。
IDC中国行业研究与咨询服务部助理副总裁武连峰表示,IDC对支持大数据基础设施包含了5点要求,也即该平台必须易于数据的整合和集中,包括与现有的IT环境的整合,也包括未来可能的异构环境;易于扩展和伸缩,适应未来巨大变化的需求;易于管理和维护,包括现有的异构环境;具备极大的可靠性、可控性、安全性;降低总体拥有成本,不仅包括硬件,还有管理、电力、人力等。据IDC的统计分析,2012年企业在服务器管理方面的花费将超过服务器硬件花费,因而易管理的服务器平台在大数据处理中更能节省人力和物力成本。
“企业实施大数据方案时对基础设施的需求,要选择适应工作负载的架构,这是基础。可靠性、安全性、高性能是关键。易管理和绿色也是重要的考量因素。开放性和可扩展性能够适应未来企业的发展。最后是大数据支持企业转型创新,可以支撑企业实现差异化。”武连峰强调。
IDC还从基础架构、数据的组织和管理、决策支持和自动化接口四个角度将大数据解决方案供应商分成了四个层次。武连峰表示,从厂商来看,只有IBM等极少数厂商能提供全方位的服务,服务范围从基础架构到数据管理、决策支持、界面自动化。而其他企业则会结合自身的不同领域,在某一个方面或者某两个方面来提供大数据的服务。
ELS:大数据的新思路
目前,市场上通常采用x86服务器和分布式结构来处理大数据,这种方式对付非关键类应用应该说是可以适用。而一旦涉及到企业的关键应用或者超大规模数据库,企业往往不敢轻易冒险。在IBM ELS主机大数据策略发布会上,IBM建议用一种全新的思路来应对关键应用和大规模数据整合的挑战。
具体来说,就是采用基于主机架构的企业级Linux服务器(Enterprise Linux Server,缩写为ELS)作为大数据处理的基础平台。IBM系统与科技部大中华区主机产品部总经理施东峰表示,IBM ELS系统以其高效性能、灵活扩展、运行稳定、支持异构环境等优势,不仅在关键业务应用领域发挥着无可替代的优势,同时能够帮助用户实现异构环境大规模数据整合。
根据测试,ELS可以整合4倍于Unix平台的工作负载,最多能够整合3000台x86服务器,凭借在性能、扩展性、可靠性、安全性、虚拟化能力、绿色节能等全方位的优势,IBM ELS成为适合大数据整合的理想系统平台。
“在用户多平台的环境中,ELS能够跨平台整合不同来源、结构化和非结构化的数据,这一独一无二的优势使其成为数据整合的利器。”施东峰表示。
开启大数据整合之旅
数据的集中整合是目前众多用户大数据之旅首先需要面对的挑战。随着各行业用户的数据激增,数据类型的多样,如何进行大数据的整合和管理得到更多关注。有统计显示,有效地整合IT基础设施的规划和执行,可实现持续的容量增长,有望使基础设施容量加倍,或者使运营费用降低高达50%。
然而,早先一贯的做法是“头疼医头,脚疼医脚”,也就是企业过去总是随着业务增长而一味增加服务器或存储设备。当整个数量达到一定量级的时候,无论是管理还是能耗等方面带来的支出已经让企业不堪重负。目前,中国很多企业在运维方面的支出超过了每年IT支出的一半,而用于IT和业务创新的经费则少得可怜。
“企业用户需要通过部署合理的基础架构,集中整合更多服务器、更多工作负载、更多应用程序和更多数据,以降低管理和能耗等方面的支出。而ELS在大规模数据整合方面的卓越优势,恰好为用户整合大规模数据扫清了障碍。”IBM系统与科技部中国主机产品部新兴市场总经理唐多表示。
当前,多平台是用户IT基础架构的普遍现状。企业往往将关键应用部署在大型主机、Unix平台上,Web应用等一些非关键应用部署在Unix、x86平台上,将关键业务数据和非关键业务数据整合是有效利用大数据的基础。例如对银行来说,交易数据来自关键应用,而电子商务数据、通话记录,甚至社交媒体上的数据则来自非关键业务,有效地分析利用大数据需要整合不同架构平台的数据,这意味着工作量和成本的巨大的挑战。
另外,从整合平台的角度来看,x86服务器只支持Windows和Linux系统,显然不能满足银行基础平台整合的要求;Unix服务器支持Linux、Unix等系统,但缺乏对z/OS的支持。反观IBM zEnterprise,它能够跨平台统一管理运行在主机、特定的Power 7和System x服务器上的工作负载,灵活地管理包括z/OS、AIX、Linux on System x及Windows on System x在内的异构平台,从而大大简化数据整合过程和减少整合成本。
IBM大型主机整合银行大数据基础设施的一个典型例子就是新西兰银行。新西兰银行在经过测试和对比后,把200台Sun服务器整合到一台运行红帽Linux操作系统的z10服务器上。通过整合,新西兰银行机房空间减少30%,总能耗降低接近40%,一个管理员就可以管理200台虚拟服务器,而整个部署也只需几分钟。
在交通领域,IBM大型主机同样扮演着大数据整合利器的角色。某市智慧交通实现了120万辆机动车电子卡、4万辆机动车的实时GPS定位数据、200万笔公交IC卡数据、518个高清卡口的大规模、不同类型数据的处理,IBM ELS系统的高效性能可以支撑1秒钟内调出一个月内的卡口图片。这样的速度和效率在过去是无法想像的,IBM ELS系统在应对大数据整合方面的效果也由此可见一斑。
四大特性打造大数据整合“航母”
ELS系统以久负盛名的IBM大型主机作为基础平台。IBM大型主机尽管已经经历了数十年的辉煌,但依然是“老兵新传”,继续焕发着青春。在企业关键业务和核心领域,大型主机的霸主地位依然难以动摇,目前全球财富500强企业中有71%是IBM大型主机的用户。
虽然如此,IBM还是不断给大型主机赋予新的技术和角色,以满足甚至超越时代发展的需要。2009年,IBM推出了基于主机架构的ELS。ELS一经推出就获得了高成长型企业的青睐,拓展了大型主机的应用领域和应用行业。IBM系统与科技部大中华区System z技术支持总经理蒋伟东介绍,如今的IBM大机不只是System z服务器,而是一个异构整合的架构,其前端是IBM专属zBX(zEnterprise BladeCenter Extension),后端IBM传统大机,中间则通过URM(zEnterprise Unified Resource Manager,统一资源管理器)管理整个系统。以ELS的基础平台——新一代主机z196为例,它具有灵活扩展、高效性能、稳定运行和高安全保障四大特性,这也使得IBM ELS足以应对企业关键应用和超大规模数据整合的重任。
灵活扩展??? 数据在以飞快的速度增长,大数据基础平台自然得水涨船高,能实现灵活扩展。一般而言,系统平台的扩展分为纵向扩展和横向扩展两个方面,普通的平台往往只具备其中某个方向的扩展能力。而z196兼具了双向扩展的能力。
蒋伟东介绍,z196单机能提供最高96颗5.2GHz CPU,内存高达3TB,最多支持60个逻辑分区和32个HiperSocket。它能管理4台zBX,里面最高可以容纳112个Power或者System x刀片。这些特性使得z196具有超强的纵向扩展性。横向扩展方面,ELS可以通过Parallel Sysplex和zVM SSI集群进行横向扩展。此外,ELS还可以进行随需容量升级,并且在升级过程中不需要宕机,这样保证了业务的不间断。
高效性能??? ELS的高效性能则体现在z196最多96个处理器,其中80个用户可以根据需要进行配置,60个完全隔离的逻辑分区足以满足企业众多应用的需要。同时,专用I/O协处理器高效处理和卓越的批量处理能力保证了系统的高处理能力。
蒋伟东表示,ELS独特的设计提升了整个系统的使用效率,CPU的使用率可以接近100%。这些得益于IBM对大型主机在I/O和操作系统上的专门设计。而相比于Unix系统,一般企业用户只会让CPU保持在50%的使用范围,因为一旦超出这个范围系统可能就会不稳定。
稳定运行??? 由于z196是单一的主机系统,其内置的冗余性、容量备份、热插拔I/O等特性,使得其平均无故障时间大于30年,并且极少需要计划停机。此外,z196自带的动态负载管理工具、灵活的不中断地扩展等特性,确保了ELS系统能够长期稳定地运行。而这也正是关键应用类大数据解决方案所亟需的。
蒋伟东表示,很多高端客户比如银行,他们看中主机的一点除了处理能力外,就是非常稳定的运行。“IBM大型主机有几方面的保证,才能够让达到稳定运行的目标:单一系统的设计;内置的冗余性,比如说风扇、电源等都是N+1设计,所有元器件的选择,IBM主机都是非常高质量的。”以上特性,使得IBM大型主机可以达99.999%的高可用性。
高安全性 蒋伟东介绍,IBM ELS主机具有完整的、全面的安全性考量,ELS的高安全性保障体现在其逻辑分区实现硬件级别的物理隔离;全面内置的安全功能;集中、简化的安全管理;针对敏感数据的硬件加密;加密加速器和集中的密钥管理;互联网安全支持;协同软件实现跨平台、企业范围的身份和授权管理;监控、稽查和强制工具等等。
“逻辑分区之间相当于进行了物理隔离,能满足美国国防部EAL5认证要求;系统里面有加密的处理器,符合美国联邦FIPS4+加密要求;另外还有很多安全监控机制,包括最高安全级别的ISCF系统,能够保证整个客户在这个系统上帐号的管理。”蒋伟东说。
此外,ELS对异构环境的支持和整合也是其最大的特色。IBM主机可以整合Power和x86负载,管理包括z/OS、AIX、Linux on System x及Windows on System x的异构环境,这样就减少了数据大整合的限制。“在每一个IBM主机外面可以另外接zBX的扩展柜,里面可以放多个刀片,可以运行各种各样的系统,可以跑z/OS、TPF,企业可以将不同的数据管理和分析软件运行在上面,在一个主机环境中实现大数据处理的全过程。”蒋伟东说。
IBM ELS的诸多特性,可谓是很好地匹配了IDC关于支持大数据基础设施的5点要求,很多性能指标甚至远远超过了要求的范畴。ELS正是凭借着在高性能、稳定性、安全性和扩展性方面的优异表现,成为了应对大数据挑战的最佳之选。
IBM系统与科技部中国主机产品部新兴市场总经理唐多表示,确保企业大数据成功应用的重要开端,是具有支持灵活扩展、异构环境、高效性能和运行稳定的基础架构。目前来看,ELS完全具备了上述特征,已经成为企业大数据整合的利器。