何为BI项目,相信大家说起BI项目,能说出一大堆的名词,如数据仓库、多维分析、ETL、数据挖掘、数据联动与钻取等等,但很少有人将这些内容联系起来给出一个完整的理解,那么何谓BI项目,我的理解是BI项目应该包含如下内容:
数据仓库:一个重要的可选项
数据仓库的建设与否直接决定了BI项目的成败与价值,数据仓库的建设过程是对企业流程和绩效指标的收集、分析过程,他能帮助企业梳理数据采集流程、统一考核口径,形成企业统一的指标集。但是建设数据仓库对企业来说是一个庞大的工程,其数据仓库建模过程随着业务需求和业务复杂度的增长而增长。因此当企业想上好BI的时候,首先应该考虑我们企业是否具备建设数据仓库的条件,是否准备好足够多的时间来实施我们的数据仓库建设过程。
ETL:一个肯定会出现的内容
ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。ETL的定义就决定了所有的BI项目肯定会需要ETL,因为所有的BI项目都会或多或少的牵涉到数据集成,只是ETL在项目中的形式有可能是从业务数据库到数据仓库,也可能是从Excel、Text等数据文档到数据仓库。ETL是一个费时的工作和过程,其良好的性能和完全无误的运行结果是BI项目的一个重要里程碑,同时ETL实现过程是复杂的,往往会在项目的整个实施期间存在,同时也是运行时的薄弱环节。
数据展现:一个能打动企业的必选项
无论其他功能(如:数据仓库,ETL、数据挖掘等)做得多么的完美,没有一个简洁、美观、大气的呈现,企业就不能有一种直观的认识和身临其境的感受。因此BI项目中数据展现不仅是必须的,而且还应是栩栩如生的。
多维分析:一个实用功能
多维分析往往代表着一个BI工具的能力,其特有的、灵活的分析方法往往能赢得企业的喝彩用户恰当的选择和运用多维分析是上好BI的一个重要选择。多维分析是指对以多维形式组织起来的数据采取切片、切块、旋转、上卷、下钻等各种分析动作,以求剖析数据,使最终用户能多个角度、多侧面地观察数据库中的数据,从而深入地了解包含在数据中的信息和内涵。
数据预测:一个令企业渴望的幸福功能
数据预测应该是目前BI项目比较容易达到的一个高度,它不像数据挖掘那样是一个非平凡的过程,数据预测更多是研究过去,对比现在,预估未来的一个经验体现,企业内部有很多的正式和非正式的预测,如年度任务、月计划、产销匹配度等。如何实现项目的预测需求,应该更多关注企业预测的目的,预测数据的来源,最接近业务的预测是最准确的。
数据挖掘:智慧的最后1公里
数据挖掘就是从存放在数据库、数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。
咨询服务
没有一个企业的业务是完全相同的,也没有一个企业的数据采集流程是一模一样的,同样也没有一个企业对美的理解是一致的,因此在BI项目中每个以环节都有不确定的因素存在,而唯一能降低、减少这些不确定因素的就是,专业的、富有经验的项目咨询和服务团队,只有一个优秀的团队才能成就一个好的BI项目。
总结一下, BI项目不应该是一蹴而就的,应该是一个有计划、有步骤的实施活动,BI咨询公司有责任、有义务向企业提供适当价值的BI产品与服务,同时企业也要根据自身的发展与需求来规划配置资源,打造一个真正适合自己的企业级BI平台。
关于BI:
商业智能也称作BI是英文单词Business Intelligence的缩写。商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这里所谈的数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商等来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。而商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。
因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。 商业智能的概念最早在1996年提出。当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。
这里所谈的数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商资料及来自企业所处行业和竞争对手的数据,以及来自企业所处的其他外部环境中的各种数据。而商业智能能够辅助的业务经营决策既可以是操作层的,也可以是战术层和战略层的决策。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。