普遍化商业智能 —— 数据库驱动洞察力的最新趋势

今天的企业级数据仓库(EDW)– 高端分析计算平台 — 在未来将会继续提供强大的战略分析功能。然而,操作型数据仓库将会成为数据库驱动洞察力的最新趋势。操作型数据仓库具备包括实时制定运营决策以及战略数据挖掘在内的许多新功能。业界对这一类实时集中式数据仓库的使用需求一直在不断增长,而且更趋多样化。对于这一新方法,人们通常称之为普遍化商业智能(PBI, Pervasive Business Intelligence)。

普遍化BI并非未来的愿景,它早已经成为现实。通过部署PBI,那些最优秀的企业将知识管理水平提升到了新的高度:即主动式知识管理。不久,被动式知识管理时代将一去不复返。普遍化BI可以帮助那些用全景视角与客户和企业真正互动的员工快速实现知识管理能力的优化,为其提炼出可指导行动的战术智能从而获取有形经济价值。

精通业务和IT技术的梦想家希望立即就能受益于普遍化BI,于是他们开始了创造性的探索工作。因此,在2001至2002年间,很多企业都通过各种途径提升了将数据载入EDW以及从EDW中提取数据的速度。这些梦想家成功地在他们的POS机、航空公司登机口服务人员、网站、呼叫中心以及其他许多一线用户与EDW之间建立了直接联系。正当企业IT部门继续向前冲锋的时候,软件供应商也在同一领域发现了改善产品的契机。于是,IT专家和IT厂商建立共生关系,合作研发实时技术。

他们是如何做到的呢?被攻克的障碍又是什么呢?首先,三种技术子系统亟待改善。其次,IT部门需要新的设计和流程。

这三种技术子系统 — 数据整合服务、决策库和决策服务 — 组成了信息供应链的一部分。首先,原始数据要进行转换和清洗。接着,这些数据会被重新包装、存储及再次重新包装。最终,这些数据在经过分析之后就会被发送出去。

数据整合服务系统是一个数据汇聚点,或者说是一个集散中心。它把从多个来源和生产应用获取的各种各样的数据整合在一起,为数据加载到EDW做好准备工作。为了达到"一小时以内"或"五分钟以内"的"服务级别"目标,原始数据的传送必须是"保障传送",以确保传给数据整合中心的数据没有出现丢失且一切都是准时完成。数据整合服务系统还必须对数据进行迅速清洗,否则不准确的数据将会降低决策质量。它必须删除重复数据,分析姓名和地址,并且将"代码"转换成更易理解的值。而所有这一切与多个数据流或持续或间歇式地加载至数据整合服务器必须是同步进行的。

决策库系统 (数据仓库和数据集市) 需要以尽可能快的速度加载数据及提供数据。这一点是较难实现的, 因为数据加载会消耗整个EDW服务器的容量,从而导致一线员工和后台员工无法进行访问。因此对一线及后台用户来说,系统在数据加载的时候其系能是非常糟糕的。然而在2002年左右,Teradata开始提供实时数据加载程序以及混合工作负载管理工具来解决上述问题。所谓混合工作负载管理,即根据业务规则在数据仓库内对各项任务进行优先排序。这使得企业可以把最高优先级分配给呼叫中心的员工,而报表优先级列于其次,数据加载优先级最低。这样,在系统顺利处理数据加载任务的同时,报表也能很快得到处理,而呼叫中心的运营将是最快速的。

接下来,决策服务系统对EDW数据进行攫取、重新格式化和分析,并将其提供给一线用户。由于一线用户没有时间仔细阅读报告,因此需要的信息必须简短,而且是针对具体的商业任务的。这也就意味着将分析信息提供给整个知识网络:BI仪表盘、员工门户、移动设备以及现代"组合型应用"。由于目前接近50%的IT开发项目都是组合型应用,EDW和决策服务的功能必须适用于那些开发工具和应用。这样就能在任意一个业务流程里提供分析洞察力:普遍化商业智能。

有了普遍化BI,企业终于可以激活那些存储在海量数据库里的数以TB计的被动数据。他们可以几秒而非几个小时的网速将知识迅速转换成经济价值。他们能够为各项业务带来无限的适应性,创造如同其集中式数据库功能一样真正可持续的企业竞争优势。