对于高性能计算(HPC)而言,云计算并不是一个全新的概念。事实上,已有近30年发展历史的超级计算中心就是一种早期的云计算模式。然而,当前的云计算还不完全适合HPC类应用。而Platform ISF的出现则改变了这一切,将高性能计算带入到“云时代”。
云计算和高性能计算
“高性能计算”和“云计算”同为当前最为热门的概念,二者之间很有渊源,比如都使用了分布式计算、集群、网格、高密度计算等技术,维基百科甚至直接将云计算定义为“网格计算下的一种新的标签,它使用共用计算或其他方法来共享计算资源”。但实际上,云计算与高性能计算之间还是有一些区别。
云计算是一种基于互联网的计算模式,其计算资源(包括计算能力、存储能力、交互能力等)都是动态、可伸缩、被虚拟化的,而且以服务的方式提供。只要有网络,用户可随时随地获得个性化服务,买计算而不买计算机、买存储而不买存储器、买带宽而不买交换机。云计算强调需求驱动、用户主导、按需服务、即用即付、用完即散。用户无需自购软硬件,无需将自己的软硬件系统交给他人托管,甚至无需知道是谁提供服务,只关注自己需要什么样的资源或者得到什么样的服务。这种计算资源的虚拟化组织、分配和使用模式,有利于资源合理配置并提高利用率,促进节能减排,实现绿色计算。
高性能计算(HPC)则通常指使用多个处理器或者某一集群中组织的几台计算机的计算系统和环境。高性能计算属于计算密集型的应用,主要面向科学计算、工程模拟等领域,而云计算主要集中于企业IT建设和信息化等领域,以数据密集型、I/O密集型应用为主。
然而,越来越多领域如今迫切需要采用云计算从事HPC类的应用。云计算的核心技术是计算资源虚拟化,因此构成了软件即服务(SaaS)、平台即服务(PaaS)、基础设施即服务(IaaS),从数据共享、信息共享走向服务共享。实际上,云计算已经成为一种高性能计算的资源,在类似云的基础设施中,只需稍加改变,高性能应用程序便能让云的力量大显身手。
Platform开辟从高性能计算到云计算新途径
Platform Computing(简称Platform)是全球领先的集群、网格、云中间件和云管理平台提供商。Platform拥有业界领先的企业级分布式计算技术,其核心产品Platform LSF、Platform Symphony、Platform ISF等已经在高性能计算和云计算领域得到了广泛的应用,帮助客户管理、调度和高效且灵活地使用计算资源,提高IT响应速度并大幅度降低成本。
Platform ISF云基础架构管理平台是一个集中管理异构的虚拟和物理资源,并为运行在其上的各种应用提供快速部署、动态资源调度和弹性计算的资源管理和调度平台。它不仅可以提供IaaS功能,让用户通过该平台实现自助式且按需的计算、网络、存储资源的申请和使用。更重要的是,它能够让中间件和分布式应用软件方便、快速地迁移至云平台,使其具备提供PaaS和SaaS的能力,从而让中间件和分布式应用软件的提供者可以专注于自身的应用逻辑,无需考虑对底层计算、存储、网络资源的调度和管理。
Platform ISF在云基础架构管理方面具备一系列特性和优势:
异构资源管理。Platform ISF支持多种虚拟化技术,如RHEL Xen、RHEL KVM、VMware、Citrix Xen等,以及多种物理机管理系统,如Platform PCM、xCat等,它还可以将这些异构的资源纳入统一的管理平台,成为真正的统一云资源管理平台。这使得资源的管理更为高效,同时让用户在部署云基础设施时拥有更多选择权,保障已有投资。
高效的资源调度策略。Platform ISF以其高效的资源调度策略闻名于业内,它由资源预约调度和运行时调度两阶段构成,并提供了灵活的可配置的调度选项,以适应不同的应用需求,在满足服务品质的基础上,保障资源被合理和高效的使用。
中间件和应用支持。凭借应用工作流的设计,自定义的管理策略,以及定制化的系统部署和配置功能,Platform ISF为中间件和应用提供了无缝的集成方案,可以加快中间件和应用进入云计算领域的时间,让提供商和运营商摆脱了复杂和繁琐的底层资源管理和调度,而仅专注于中间件和应用自身的开发和运营,同时也能享受云计算带来的按需使用、动态部署、资源共享等优势。
规模和扩展性。Platform ISF可以同时管理多个数据中心,并作统一调度。其管理规模和扩展性已被业内认可并在多个大规模用户环境中得到验证。
可靠性。Platform ISF提供多种基于角色的用户权限控制、支持多种流行的用户认证系统并内置有高强度的数据加密策略,其容错、系统管理和安全性能已经在全球多个的关键任务环境中得以验证。
Platform满足云时代的高性能计算需求
近期,全球著名行业分析公司Forrester Research发布的一份有关云计算发展的报告吸引了业界的广泛关注。在这份题为“私有云解决方案市场概述”(2011年第二季度)的市场报告中,Forrester Research根据十项云计算标准对全球15家领先的私有云解决方案提供商进行了分析和评估。最终结果显示,Platform公司一举超越IBM、惠普、微软、戴尔等传统IT巨头,一跃成为排名全球第一的私有云解决方案提供商。这份报告的发布被Cloud Computing Journal(《云计算杂志》)称作是“掷入云计算市场的一颗重磅炸弹”。
Platform提供的一系列强大而灵活的HPC云解决方案,使用户可以通过配置HPC数据中心,来满足云风暴的需求。Platform可以帮助用户提高在云基础设施中运行的HPC应用程序的利用率。Platform提供的工具包括提供动态主机功能的Platform LSF、Platform MultiCluster协调工具和用于基础设施共享的Platform ISF,为创建满足高性能计算应用程序需求的云环境提供方便。
工作负载调度。使用云环境下的Platform LSF动态主机功能,云资源在运行时就像是拥有本地IP地址和主机名称的现场HPC数据中心。任务提交后,内置在软件中的Platform LSF守护程序可让云资源识别映像请求,并通过添加有效映像来准备好处理工作负载的资源。发送到云的工作负载可进行完善,只要允许用户标记某任务,确保应用程序、数据和云资源经配置后,就可在云中运行。
多集群管理。使用结合Platform LSF的Platform MultiCluster协调工具解决方案,用户就能开始与任何云或主机托管提供商一起建立新的集群,而不需要专用链路。云集群变得可用,用户可以使用 MultiCluster来处理工作负载在内部HPC集群与基于云的外部集群资源之间的分配。当然,还必须考虑安全、监管、服务级别协议/服务级别目标 (SLA/SLO)等因素驱动。
云管理。Platform ISF拥有处理多种不同类型系统的资源工具包,其中包括物理或虚拟系统;Linux/Unix/Windows系统;VMware、XEN、Hyper-V和KVM等虚拟机;亚马逊和Rackspace等云资源。
通过结合使用Platform ISF和Platform LSF,用户能够自动向上或向下扩展集群。Platform ISF可以管理物理资源和虚拟化资源,同时还能向外扩展到其他服务器——或者扩展到企业内部的基础设施,或者扩展到企业外部的云托管提供商、云计算公司或其他类型的服务提供商。物理资源还可以根据需要,自动重新配置,以满足应用程序的需要,比如操作系统的特定要求。
此外,Platform ISF具有政策管理功能,可用于专门针对处理任务、满足服务级别协议(SLA)所要求的虚拟资源类型,为不同的应用程序量身制定政策;可以根据应用程序动态向企业内部扩展、向企业外部的云环境扩展,也可不扩展而用于独立定义工作。
CERN(欧洲原子核研究组织)为全球270个研究中心的17000余名科研人员破解宇宙奥秘提供保障,需要构建经济高效、能够管理任何服务器上虚 拟机管理程序和操作系统、共享的计算基础设施。CERN利用Platform ISF实现私有云,管理大型的强子对撞机(LHC)集群工作负载,为多个虚拟和物理平台提供高效的工作负载应用管理,把不同平台组合到单一动态的共享基础 设施中,在资源较少的情况下显著提高了平台的利用率。利用该平台,科学家们可以选择自己的应用环境,动态控制项目,确保充分发挥私有云的功效,在成本更低 的情况下实现高效率。
随着技术不断改进,高性能计算云应用的范围也迅速拓展。如今,全球众多企业已经采用了Platform公司的集群、网格计算和云计算的解决方案。在 国内,包括北京计算中心工业云、上海超级计算机中心魔方、中国科学院网络中心、深圳超级计算中心星云等均已采用了Platform的云解决方案。事实证 明:Platform在技术上切实可行并且带来了可观的经济效益。