在我们所处的这个时代里,信息的价值无论怎么评价也不算高估。不过,说起来容易做起来难,让这些信息真正发挥作用并非易事,企业要么无法获得所需的信息、要么无法让信息为己所用。为了响应企业的这一普遍需求,IBM提出信息随需应变(Information On Demand,以下称IOD)这一战略构想。
信息是企业的核心资产
IOD所倡导的一个重要理念就是信息是企业的核心资产。很长时间以来,企业习惯于将它们的员工、专利、商标甚至厂房和设备看成企业的核心资产,现在,在核心资产清单上该添上一个新成员了,这就是信息。
然而,在企业已经看到信息的重要价值、开始重视信息的整合之后,很快他们就发现自己陷于信息的重重包围之中,一方面要不断在数据的获取上投入,而另一方面,却无法从纷繁芜杂的数据中得到真正有价值的信息:今天的企业需要面对太多的信息,这些信息以各种不同的形式存在,有结构化的信息,如传统的表单,也有非结构化的信息,如Word文件、音频、视频、图像、电子邮件等,它们通常会被封锁在各个不同的地方。以下是企业在利用信息时常面临的困境:
1. 信息被封锁在众多孤岛式的信息源中,限制了信息的自由获取,而无法以一种方便的方式操作。
2. 信息量和信息的种类成指数级增长,仅仅是保存和维护如此海量的信息已经让企业不堪重负,更谈不上消除各个部门信息中的冗余、保持一致性、对信息进行整合了。而日益激烈的市场竞争需要企业具有比以前更加快速的响应能力。
3. 对信息的准确性缺乏信心从而限制了信息价值的发挥程度。比如,由于多种原因,很多组织保存的数据中存在不少重复的记录、不完整的记录以及无效的记录。
"由于信息的爆炸式增长,使得企业保证在第一时间得到精确的信息成为它们保持竞争力的关键,其中涉及三个要素:信息、人或流程以及时间,只有三者能流畅地配合,即实现了在需要的时间能立刻将正确的信息传递给需要的人,才表明企业的信息系统已相当完善,这就是IBM的Information on Demand要达到的目的。"IBM软件集团高级副总裁Steve A. Mills在Information on Demand 2007的开幕式再次明确了Information on Demand的含义。
Information on Demand背后的含义
Information On Demand 是IBM对解决信息的整合和利用难题的一种通俗表达,它屏蔽了背后的技术复杂性,这些复杂的技术是由IBM及其合作伙伴来共同完成的。尽管用户完全可以不用了解其技术实现,但是这种了解无疑会有助于我们理解IBM提出这一宏伟构想的真正原因。
从本质上说,Information On Demand要实现的是业务流程真正的端到端集成,也就是在一个企业内部及其合作伙伴和客户之间进行集成。这意味着信息需要能够在这些流程之间自由流动,换句话说,各种格式的信息需要能够从它当前驻留的应用程序中释放出来,同时信息必须能够作为一项服务进行交付,能够被需要它的人和流程轻松地存取。
Information On Demand提供的解决办法分为两个部分。一是通过开放标准公开这些服务:当前的应用系统大多是通过传统的编程方法建立的,系统内部紧密耦合在一起,这样的系统改变很困难,缺乏灵活性,IBM通过采用像 Web 服务和 XML 这样的开放标准以及像 SOA 这样灵活的架构,帮助企业把服务发布出来,从而只要付出较少的努力就可以更快速地解决问题。由于采用开放标准,更多开发人员能够更轻松地存取他们所需的信息。
另一个部分就是让信息更可用或者说提升信息的价值。比如IBM提供有这样一些服务,它们集成信息(包括数据和内容,而不管它们在什么位置)以提供一个统一且精确的视图;向原始信息添加业务上下文;暴露信息中的复杂关系。Information On Demand可以为这些服务提供一个开放的框架。
不过,这还仅仅是Information On Demand表面上的意义,其更深一层意义在于,IBM认为要从根本上改变目前信息系统的构建方式。
众所周知,现有的系统是按照功能设计和构建的。如典型的套装软件就是按照功能设计,一个系统完成某一特定的功能,为完成这些功能需要存储某些数据,这些数据完全依附于这个系统,系统之间的数据很少有交流。在IBM看来,这种传统的应用构建方式正是现有的IT系统无法跟上业务变化的原因。IBM认为,信息作为企业的核心资产,它应该脱离应用存在。IBM通过引入XML技术,力图让业务人员可以不用IT部门的帮助自由地设计出业务需要的各种数据模型,再结合用SOA技术封装的各种流程相关的组件,使得业务人员也可以自由组装出所需要的应用,从而摆脱对套装软件的依赖。
"以一种高度可用的方式存储和保护数据或内容的传统应用目前仍然是信息管理的重要方面,但是一种更灵活的应用构建方式已经出现,并已通过工业技术方法取得了显著的进步,同时最好的实践也已经出现,这就是Information On Demand。" IBM软件集团信息管理部总经理Ambuj Goyal在接受记者采访时表示。
对非结构化数据的管理
在IBM Information On Demand战略构想中,对非结构化数据的管理是一项关键功能。这一功能的第一支柱当然是IBM的新一代数据库产品DB2 9,其采用的pureXML可以称做Information On Demand战略的核心技术。实际上,在2006年夏天IBM发布DB2 9.0时,卓越的XML支持特性就被作为其中的最大特性来宣传。
XML诞生于上个世纪90年代,设计之初主要应用于数据交换,但这种新型的数据组织方式却在应对信息的复杂性、可理解性和灵活性的挑战方面开启了新的道路,迎合了技术发展的方向和潮流。更重要的是,XML对非结构化数据的支持能力正是现在所需要的。统计表明,现有的数据中60%以上属于非结构化数据。IBM要倡导信息随时可取首先就必须完成对这部分非结构化数据的管理和整合。
IBM在去年发布的数据库 DB2 9中第一次实现了关系型引擎与层次型引擎的结合,实现了混合数据库。IBM将此技术称为pureXML技术。与一般关系型数据库的XML增强功能不同,pureXML技术第一次真正意义上提供了一种与XML层次型结构相匹配的层次型存储方式和相对应的操作访问方式。
IBM对XML的支持不仅体现在DB2上可以存储 XML,DB2还具有一些服务,能够把XML文档分解成关系表结构和从关系表结构组合成XML文档。为了易于开发,DB2中还有一些特性能够帮助确保 XML 的完整性,比如模式和 XSLT 支持。数据库也支持基于XML的Web服务对信息的请求,比如 SOAP。
目前,对非机构化数据的支持能力已经扩展到IBM的其他产品上,在IOD大会IBM发布的最新数据仓库产品DB2 Warehouse 9.5就把对XML的支持推进到数据仓库产品上,从而提供了针对非结构化信息的分析能力。