在当前的全球化竞争日益激烈的经济环境下,企业的生存发展,关键在于它是否能够对各种不同的用户需求做出快速的反应及正确的决策并提供优质的产品和服务。商业智能(Business Intelligence, BI)系统是指运用数据仓库,联机分析和数据挖掘技术来处理和分析商业数据,针对不同的领域提供不同的应用解决方案,协助用户解决商务活动中的复杂问题,从而帮助决策者面对商务环境的快速变化而做出敏捷反应和合理商业决策的管理系统。
商业智能的实质是从数据中有效地提取信息,从信息中及时地发现,为人类的思维决策和企业战略发展服务。传统的信息系统是处理离散事务的。这些系统不是设计为让用户去从不同聚集层去抽取数据,并使用高级的方法来分析企业数据的,而是适应用于服务于单一目的的商务过程或程序,如会计过程等,所以系统使用者很难通过传统离散的事务处理系统对商务环境进行整体了解。
由于商务智能系统不是针对处理离散事务的系统,所以它的组成与其他的信息系统与一定的区别。IBM商业智能专家Michael L. Gonzales在《IBM数据仓库及IBM商业智能工具》中给出商业智能组成为数据仓库、数据源、数据目标。
数据仓库的典型工作是对集成、清洗、聚集、预计算和查询服务所需的大量数据进行批处理。数据源可以是操作型数据库、历史数据、外部数据或是己有数据仓库中的数据信息,也可以是相关数据库或是其他任何支持商务应用的数据结构。数据源可以存在于多种不同的平台,并且包括结构化信息,如电子表格,无结构信息,普通文本,图片等等。
一般来说,数据预处理、建立数据仓库、数据分析、指标展示是商业智能的数据流程。数据预处理是整合企业原始数据的第一步,包括数据抽取、转换和装载三个过程。源数据采集、筛选、整理及转换基本上是从前台作业系统、业务部门及企业外部的各种类型的数据库(如:ORACLE, SYBASE, SQLSERVER, FOXPRO, ACCESS,工NFORMIX等)中获取数据的,这些数据必须依用户所需,按照数据仓库的要求,以统一定义的格式从各个系统抽取出来,经过数据筛选、整合、转换纳入数据仓库。
建立数据仓
建立数据仓库是处理海量数据的基础。商业智能系统的核心构架是数据仓库,其主要功能既包括传统的联机事务处理(OLAP)及统计查询,又包括决策支持和联机分析处理(OLAP),数据仓库包括数据提取模块、数据清洗模块、数据转换模块,实现数据的提取、净化、过滤及数据标准化。
数据分析
数据分析是体现系统智能的关键,一般采用联机分析处理和数据挖掘技术。联机分析处理不仅进行数据汇总、聚集,同时还提供切片、切块、下钻、上卷和旋转等数据分析功能,用户可以方便地对海量数据进行多维分析。数据挖掘的目标则是挖掘数据背后隐藏的知识,通过关联分析、聚类和分类等方法建立分析模型,预测企业未来发展趋势和面临的问题。
指标展现
通过数据分析,系统得出结论,并提交给决策者。指标展现的主要方式有以下几种方式:
1. 查询。定义查询、动态查询、OLAP查询与决策支持智能查询;
2. 报表。产生关系数据表格、复杂表格、OLAP表格、报告以及各种综合报表;
3. 可视化。用易于理解的点线图、直方图、饼图、网状图、交互式可视化、动态模拟、计算机动画技术表现复杂数据及其相互关系;
4. 统计。进行平均值、最大值、最小值、期望、方差、汇总、排序等各种统计分析;
5. 挖掘。利用数据挖掘等方法,从数据中得到关于数据关系和模式的知识。
可见,商业智能涉及一个很宽的领域,集收集、合并、分析、提供信息存取功能于一体,包括抽取、转换、装载软件工具、数据仓库、数据查询和报告、联机数据分析、数据挖掘和可视化等工具。