近日,Exadata、ExaLogic之后,甲骨文正式在中国发布Exa系列的第三个成员——Exalytics,一个基于内存计算技术的大数据分析系统,试图充分借助自身数据库和内存计算方面的优势,通过提供一个整体的“数据驱动的决策”解决方案,抢占大数据时代的市场先机。
数据驱动的决策对于企业的发展有着十分重要的作用。麦肯锡全球研究机构在2011年5月发布的《大数据:创新、竞争和生产力的下一个前沿领域》 (Big Data–The next frontier for innovation, competition and productivity)中也表示,充分利用大数据可帮助全球个人定位服务提供商增加1000亿美元收入、帮助欧洲公共部门的管理每年提升2500亿美元产值、帮助美国医疗保健行业每年提升3000亿美元产值,并可帮助美国零售业获得60%以上的净利润增长。
然而,大部分企业却苦于找不到一个可视化的、交互性的,有洞悉力的解决方案。由于时间仓促、要求复杂、预算越来越少,大多数企业的IT部门一直找不到一个适合的解决方案。更让企业IT人员头疼的是,大多数企业的分析解决方案需要先从不同的软件和硬件厂商去购买硬件、软件和网络等等,这就导致前期大部分时间浪费在硬件和软件等组件的集成上。
Oracle Exalytics内存机 (Oracle Exalytics In-Memory Machine)就在这样的背景下诞生了。Exalytics号称世界上第一个专门针对交付高性能的分析、建模和计划而设计的工程系统(engineered system)。所谓的“系统工程”也就是意味着包含了硬件、软件网络等多个组件,并针对分析应用做了专门的调优。
据Oracle介绍,Exalytics在速度、虚拟化和扩展性能方面都十分强大,为企业的分析工作负载提供了极强的性能。Exalytics提供的企业性能管理应用,使得一类新的智能应用成为可能,如收益管理、收入管理、需求预测、库存管理、定价优化、盈利能力管理、滚动预报和虚拟关闭等。Exalytics不需要重新设计应用程序,可以直接单独部署到现有的应用环境中,也可以与Oracle Exadata和(或)Oracle Exalogic一起部署。
如下图所示,Exalytics是由内存分析硬件、内存分析软件以及优化的Oracle商业智能基础套件等三个部分组成的工程系统。

图1: Oracle Exalytics 是由硬件和软件组合到一起的工程系统
Exalytics内存机硬件部分是一个单一的服务器,针对商业智能负载所需要的内存分析的进行了最佳配置,包括了计算能力、海量内存以及快速网络等选项。
Oracle Exalytics的硬件架构-内存计算的基础
Oracle Exalytics硬件被设计在一个3U的机架单元中,并针对商业智能工作负载中的内存分析进行了优化。多个Oracle Exalytics机可以聚集在一起,以扩大可用内存容量,从而提供高可用性。Oracle Exalytics包括了强大的计算能力、丰富的内存、和快速的网络选项,以及能够直接连接的存储选项。
甲骨文Exalytics是由四个Intel XeonE7-4800系列处理器支撑,其特征之一是处理器和I/O之间的高速互联技术。每一个处理器支持10个计算核心,因此,Exalytics一共包含了40个计算核心。每个核心有两个虚拟执行线程,总共达到80个线程。这样的计算能力再加上1TB的内存为内存分析提供了充分的保证。
我们都知道,要实现高性能的商业智能系统需要与数据仓库、操作系统和数据源之间建立快速的连接。此外,在搭建具有高可靠、负载均衡以及灾难备份功能的集群时,高速的网络互联也是一个必不可少的条件。因此,Oracle Exalytics提供了下列网络接口,来支持上述需求:
InfiniBand:每一个Exalytics提供了两个四数据速率(QDR)40 GB / s的InfiniBand端口。当Exalytics与Exadata连接时,Exalytics就成了Exadata私有InfiniBand网络中集成的一个部分,拥有高速、低延迟的数据库服务器访问性能。而当多个Exalytics机器连在一起成为集群时,InfiniBand光线也可以充当高速集群之间的互联通道。
10GB以太网:每一个Exalytics提供了两个10GB/s的以太网端口,用于连接企业数据源和客户端访问。
1GB以太网:每一个Exalytics还提供了4个1 GB/s以太网端口用于客户端访问。
专用集成的Lights Out管理器(ILOM):Exalytics还为远程管理提供了以太网端口——ILOM。
所有的网络接口都支持故障转移,可以用于创建没有单点故障的集群。同时, Exalytics还包含了冗余的、可热插拔电源和风扇。
Exalytics包括了一个高性能的直接附加存储系统(direct attached storage system),包括高性能的RAID HBA和3.6TB原始磁盘容量。或者,甲骨文Exalytics机集群可以利用NAS(network attached storage,网络附加存储)来保存共享元数据和配置数据。
甲骨文Exalytics通过ILOM(Oracle集成的Lights Out管理器)提供了完整的服务器管理基础设施。Oracle ILOM通过遥控器(SSL,HTTPS)和串行连接对服务器硬件进行管理。
Oracle Exalytics软件架构—实现数据驱动的决策
Exalytics运行的软件是Oracle商业智能基础(Oracle Business Intelligence Foundation)和OracleTimesTen内存数据库。为了在Exalytics上获得更好地性能,BI Foundation和TimesTen内存数据库都经过了优化。事实上,TimesTen来自于甲骨文07年收购的一家同名的数据库厂商。而更有意思的是,TimesTen于1996年从电脑厂商惠普(Hewlett-Packard)剥离,成为独立公司,当时员工约为100人。
Oracle BI Foundation:Oracle BI Foundation提供了市场上最完整的、开放的和融合的商业智能平台。为商业智能提供了综合的、完整的能力,包括企业报表、公告板、专案分析,多维OLAP,评分卡以及基于整合平台的预测分析。Oracle BI Foundation 包含了业界一流的服务器技术,用于相关性分析和多维分析,并提供了丰富的终端用户体验,包括可视化,协作,警报和通知,搜索和移动接入等。
针对Exalytics优化的TimesTen内存数据库:Oracle 内存数据库 TimesTen 是一个针对内存进行了优化的关系数据库,它为应用程序提供了当今实时企业和行业(如电信、资本市场和国防)所需的即时响应性和非常高的吞吐量。
TimesTen 通过改变数据在运行时驻留位置的假设来提供实时性能。通过在内存中管理数据,并相应地优化数据结构和访问算法,数据库操作能够以最大效率执行,从而大大提高响应速度和吞吐量,甚至能够与完全使用高速缓存磁盘的 RDBMS 相媲美。Oracle 内存数据库 TimesTen 可嵌入到应用程序中,从而消除了进程间通信和不必要的网络操作,以进一步提高数据库操作的性能。
柱状压缩:甲骨文TimesTen内存数据库Exalytics支持柱状压缩内存数据,减少内存占用。可以实现5倍的压缩比,有利于扩大内存容量。分析算法压缩数据直接操作,从而进一步加快内存中的分析查询。
Oracle Essbase的是一个多维OLAP分析应用程序服务器。在Exalytics上运行Essbase对内存操作而言有很多好处,比如可以改善整体存储性能,优化并行操作,优化MDX语法,MDX搜索引擎的高性能。Exalytics上运行Essbase 提供了高达16倍的查询速度,并且减少了6倍写回和计算操作,包括批处理过程。
Oracle NoSQL数据库:为了快速、实时地捕获所有大数据,企业需要处理大数据量、低密度的信息,需要频繁更改应用程序,而且还必须横向扩展以满足急剧扩张的部署计划。作为一款分布式、高度可扩展并能够提供关键价值的数据库,Oracle NoSQL数据库专门为管理海量数据而设计,可以帮助企业存取非结构化数据,并可横向扩展至数百个高可用性节点。同时,该产品能够提供可预测的吞吐量和延迟时间,而且更加容易安装、配置和管理,支持广泛的工作负载。
分析沙盒:目前,企业所面临的挑战包括拥有现有Oracle数据仓库、对大数据进行分析、不允许对数据仓库SLA产生负面影响等。通过分析沙盒,企业可获得分析工作区,控制对资源和数据的访问,而且完全不影响生产系统。它还可以将沙盒功能与安全、可伸缩、易于安装的Oracle企业管理器进行集成,从而帮助企业高效利用服务器、通过付费方式进行自我管理。
针对Hadoop 架构的系统:大数据组织和提取面临的挑战还包括将大数据转换为易于分析的内容、避免编写大量 Hadoop代码以及数据快速载入 Oracle 数据仓库等,Oracle大数据机中的开源Apache Hadoop、Oracle数据集成Hadoop应用适配器、Oracle Hadoop装载器、Oracle Direct Connector,可以帮助企业充分应对这些挑战。
Oracle数据集成Hadoop应用适配器通过Oracle数据集成器易于使用的界面,自动生成Hadoop MapReduce代码,简化了Hadoop应用与Oracle数据库的数据集成。Oracle Hadoop装载器使客户能够利用Hadoop MapReduce处理功能建立优化的数据集,从而在Oracle数据库11g中进行高效率加载和分析。Oracle Direct Connector可通过SQL语言从Oracle数据库直接访问Hadoop分布式文件系统上的数据。
R语言:在分析大数据时,企业需要访问所有数据,使用R语言进行统计分析,但通过便携机进行分析速度较慢且不安全。甲骨文提供的Oracle R Enterprise实现了R开源统计环境与Oracle数据库11g的集成,分析师和统计人员可以运行现有的R应用,并利用R客户端直接处理存储在Oracle数据库11g中的数据,从而极大地提高可扩展性、性能和安全性。Oracle数据库11g与R开源统计环境的整合为进行更进一步的数据分析提供了一个企业就绪的、深度集成的环境。
价格
根据价格单所示,Exalytics硬件价格为13.5万美元,其中包含了3U的Oracle-Sun服务器,包括10核的Intel至强处理器和1TB内存。估计Exalytics的技术支持以及软件许可证价格将保持在每年3万美元的水平。
Exalytics中的TimesTen软件价格为:每个用户366美元(300美元的许可证费用和66美元的技术支持费用),按处理器来算则为4.2万美元每处理器。此外,Oracle商务智能基础套装(Oracle Business Intelligence Foundation Suite)将匹配TimesTen软件。根据另外一份价格单显示,Oracle BI基础套装费用为每用户4500美元,或每处理器55万美元。
甲骨文本次发布的为官方价格单,据记者了解,一些客户在于甲骨文沟通的时候往往能够得到70%甚至更高的折扣。
型号
Exalytics In-Memory Machine目前只有一款基于Sun Fire X4470 M2(去年6月公布)高端x86服务器的型号,这个内存设备被称为Exalytics X2-4,应该还会有更多更低端和更高端的型号。