商业智能性能助推器:中心辐射型架构

从90年代开始,中心辐射型架构已经被作为数据仓库和BI实现的最佳实践。其基本的设计理念是数据仓库(如,集线器)是专门为了从运营系统和其它数据源加载、清除和存储大量信息而创建和优化的。同时,各种数据集(辐条)是针对特定BI使用进行设计和优化的:处理需要填充到仪表板和报告以及回答在线分析处理(OLAP)查询的数据。中心辐射型设计是良好的BI性能的基础。如果想用单独一个数据仓库来处理一切事务,您需要对它进行数据整合、加载和查询等方面的优化,这是一个艰巨的任务。当您的BI工作负载较轻时,它应该是可行的,但是它不会随着业务用户增长或查询量增加而扩展。

一个更好的信息架构是能够在成本控制范围内随着BI需求的增长而扩展的,这就是“超中心辐射”设计。在这个设计中,辐条本身可以成为较小数据集或OLAP数据库的集线器。这个方法可以改进底层数据库来满足不断增长的特定查询模式,从而可能减少购买更多硬件的需求,从而避免查询响应时间发展到不可接受的程度。

当您开始设计您的BI系统以实现最优性能时,其中有一些任务是您必须考虑的,包括空间建模、OLAP数据库设计和数据库设计与优化。虽然这会增加您的开支,但是安排一个“真正的”数据库管理员,而不是担任DBA角色的应用程序程序员,对于保证您创建的数据库能够支持所需要的BI性能级别是至关重要的。

BI项目成功的另外一个关键是在您的业务用户社区部署不同组合的BI工具,包括仪表板、性能记分卡、即时查询工具、报表软件和电子表格整合功能。在“过去”,这样做往往会成本很高,因为必须从不同的BI供应商购买各种产品。现在很多供应商都提供包括所有这些技术的完整BI套件,这会使他们更容易接受。这一点是很重要的,因为提供匹配一个组织各种不同需要的各种工具有望避免用户对BI系统失去信心而重新用回他们唯一可依赖的电子表格。

创建BI开发标准是另外一种有利于将开支保持在可控制范围并使您的IT和BI员工更具生产效率的方法。使用通用的模板或者样式表来设计BI应用程序可以让您的开发人员不再浪费时间做同样的事情,同时可能提高他们准时交付新功能的能力——以及减少业务用户由于不同应用程序之间差异而混淆的可能性。标准化的方法也可以在重复的BI过程中创建,例如数据聚集。

当您已经准备好部署BI系统时,那么并不总是最昂贵的技术配置就能够提供强大BI性能。下面是一些必须谨记的事项:

要在各种物理或虚拟服务器之间传播数据库,以及提取、转换和加载(ETL)过程和BI查询。其中的技巧就是以一种最化的方式分配数据工作负载和处理,并考虑它们在整个一天、一周和一月之内是如何波动的。

尽可能多地使用更多的内存,并在条件允许的情况下利用全内存分析和ETL缓存技术。使用64位架构是很有好处的,特别是对于全内存功能。

数据存储一般是一个您无法避免花费的地方——因此要明智地购买产品。

以联机方式将运行系统的数据集中到一起的数据虚拟化是为BI使用整合数据的一种划算方法。但是它也有一些局限性:虚拟化会增加所需要的存储,但是它仍然是最适合于开发和测试环境。

满足商业用户对功能和性能期望的BI系统确实需要一定的投资,但是这个费用并不会影响您的预算。但是,需要提醒的是:较为廉价的初始设计可能会迫使您在随后付出更高的成本,可能是由于需要增加基础架构开销,或者在无法满足预期压力时BI系统出现故障。总之,一个业务并不使用的廉价系统并不是真正的节约成本。