DoSTOR存储分析:当我们在谈论这个数据爆炸年代如何去存储信息的时候,往往我们忽略了一个更加严峻的问题,那就是信息资源的开发利用,毕竟在这些正处在爆炸式增长的数据中,蕴含着人类赖以持续发展的智慧,同时,在这些数据中,也并不都是精华,也有糟粕。于是,这就对我们如何良好的开发信息、利用信息资源,提出了一个严峻的问题。
近日,作为国内较早关心信息化建设,关注信息资源开发利用的大型综合性媒体集团,《光明日报》举办了“信息资源开发利用专题研讨会”,组织了业内许多在信息资源开发利用领域有着丰富经验的专家、学者参加,包括中国社科院计算机网络中心主任、社科院信息办主任解延德、国家信息化专家咨询委员会委员、国家行政学院教授汪玉凯、武汉大学信息管理学院院长陈传夫等知名人士,同时,作为国际上的权威调查机构,IDC中国公司副总裁万宁先生也出席了此次会议。另外,在信息数据存储领域有着领先地位的EMC,作为本次研讨会的厂商代表,EMC公司客户解决方案总监马隽也发表了其对信息资源的开发利用看法。
信息资源开发利用的现状
作为国际上权威的调查机构,IDC一直非常关心数据存储产业的发展,在研讨会上,IDC中国副总经理万宁引述IDC最新研究报告《数字宇宙膨胀:到2010年全球信息增长预测》数据指出,2006年全球每年制造、复制出的数字信息量共计1610亿GB,中国数字信息量为127.1亿GB ,占全球信息量的7.9%;受“富媒体”、用户创建内容和16亿网民三大因素推动,到2010年,全球数字信息量预计为9880亿GB,而中国的数字信息量预计为900.5亿多GB,占全球信息量的9.1%。由此看出,中国的信息增长速度还要高于全球,2006-2010,全球信息量增幅为6倍,而中国则高达7倍。相比之下,印度的数字信息量预计为172亿GB,韩国的数字信息量预计为157亿GB,日本的数字信息量预计为520亿GB。
这就说明,我国信息资源不仅整体规模十分庞大,而且仍处在一个高速发展的阶段,对于如此众多的信息的存储、利用是全社会,尤其是以国家主体的政府政务系统和以商业企业为主体的商业商务系统非常关心的一件事情。
对于电子政务与政府机构领域的信息资源开发利用,解延德主任表示,目前在实际工作中,他们遇到了很多问题,他表示,10年来我们国家信息化建设是急速发展,但真正的信息共享、电子政务、电子商务我们还没有做到,特别是在信息开发和信息应用过程中,我们确实有许许多多的问题需要解决。现在网络是基础、信息是关键、应用是问题、管理是保障,必须要融合到一起才能健康地发展,最难的是数字化办公、电子政务、电子商务,我们还处在现代信息技术和现代办公流程简单结合的层面上。
他认为,对信息资源的保护、分析和利用对于提高执政能力、加强自身建设、推动社会进步发展是非常重要的,同时也是当前我们面临的最重要的问题。因此,当前只有以应用为目推进信息化建设,才能取得实质的进展。
而对于目前我国存储设备的购买、管理和利用,很多业内人士都表示还非常的不健全,举例来说,前一段时间,某个用户为了部署其应用,购买了一些EMC的产品,当部署完成之后,用户要独立的进行再一次的设备备案工作,但是十分令人诧异的是,我们的用户既不会从硬件设备本身读懂产品型号、容量、随机软件等基本参数,也不会通过管理程序查看产品的设备信息。
对于这种情况,来自EMC公司的马隽先生可谓感同身受,但是,更令他感到忧虑的,则是更深层面的事情。“数据的价值并不体现在量上,而是体现在质上。”他认为,目前国内很多的信息化建设最大的问题就是,有人管设备,没人管信息,管设备的人很多,甚至管数据的人都很多,但是对于信息的管理,我们国家的很多企业、政府都没有人管信息。
除此以外,目前企业对信息资产的分级、分类归档工作做的非常不到位,马隽谈起信息的分级分类时表示,以前企业里都有资产分类,资产有资产标签,有所有者、管理者、使用者,而对于信息资产来讲,EMC目前从项目和业务角度来看,事业单位、政府机关、企业基本上没有人对信息资产做标签,而且也没人知道到底信息在哪里,只是知道有一个存储和数据,存储和数据不完全代表信息。所有这些对于信息的不完全分类与分级,所造成的后果只有一个,就是鱼目混珠,良莠不齐,用户将会用大量的存储成本,去存储那些没有任何意义的,没有存储价值的垃圾数据,而目前在国内很多用户的系统中,垃圾数据正在严重影响数据的质量。
开发利用 仍待步步为营
对于我国目前所处的信息化发展阶段,国家信息化专家咨询委员会委员、国家行政学院教授汪玉凯先生,提出了关于信息化建设的全球信息发展趋势分为三个阶段的理论,即第一个阶段,各个国家主要搞大规模基础设施建设,注重技术开发,技术和应用是分开的,各自为政。第二阶段,政府开始制定统一的政策目标,把分散的技术应用整合,这时候信息资源开发利用更为迫切。第三阶段,政府通过制定统一的政策目标,通过深入地整合各个领域的应用,最后可能会引起整个社会结构、组织结构的重大变化。“只有到了这个时候,人类才可以说进入了信息社会。” 汪玉凯先生显然已经把信息资源的开发利用,提升到了对于人类未来发展至关重要的相当高的地位上。
以北京电子政务系统的建设为例,汪玉凯先生表示,近六年北京市电子政务投入79亿,构建了480个项目,虽然前一段时间的国务院信息办召开的第二次政府工作座谈会,谈到我国的电子政务将投入500亿元,但是从北京来看全国的投入绝对不止500亿,整体投入肯定还会更大。
这就表明,我国目前仍处在第一以及第二阶段,正在大规模的进行信息基础设施建设,许多本土厂商以及国家机构,通过与类似EMC这样的国外厂商的合作,正在逐步完善我国的信息基础环境,同时,对于北京、上海、广州这些信息基础建设已经初具规模的城市,他们发现,自己的基础设施已经建立起来,但是信息资源的开发利用还稍显稚嫩,因为城市的发展几乎无时不刻的在对信息进行贪婪的“索取”,如果不能及时的提供信息,实际上就是阻碍了城市的经济和社会发展。因此,对于这些较发达城市来说,信息的资源利用显得尤为重要,他们正在整合应用,集中资源,处在了信息资源利用的关键门口,他们正在踏入这个门口的过程中。
而在这个过程中,所需要的力量除了类似EMC这样的数据存储厂商,以及政府和社会的通力支持,也许法律也是一个重要的组成因素。作为国内较早关注信息增殖利用的“学院派”人士,武汉大学信息管理学院院长陈传夫先生一直以来都对信息资源的开发利用非常关注。“将来我们国家制定政策的时候,管信息还是管事实?丢失了一条数据到底负什么责任?是负信息责任,还是负事实责任?” 陈传夫先生对信息的安全责任显得尤为重视,他表示,信息质量是一个非常大的问题,制定“信息资源增值利用法”是实现信息有效的、合法的、高效率的开发利用的一个法宝,统筹信息的公开、利用的标准问题。
另外,他对信息的质量也非常担忧,陈传夫先生曾为当时为国家科技部咨询中心做知识产权战略对策报告,结果发现几乎没有一个网站能够把柏林国际条约能够完全正确地反映出来,不是没有信息,是这些信息调查者并不敢用。比如一些网站,说是有些信息是政府文件直接打上去,有些信息是专家学者讲话直接打上去的,最后学者引用的时候你引用的是张三的,我引用的是李四的,整个信息的质量是不高的。实际上,信息质量涉及到很多问题,陈传夫先生目前正在从事的研究就涉及到这个领域,一个是信息的权威度,法律文件是不是就是国家政府发布的,还是引用的发言。另一个是实效的问题,有些数据已经更新了,但是网上数字或一些文档中的并没有更新。
实际上,我们看到,在对于数据的质量问题上,陈传夫先生与马隽先生的观点不谋而合,他们都认为,在信息资源开发利用迫在眉睫的今日,信息的质量是决定信息开发利用程度与有效性的一个重要因素,信息的质量必须提高,而对于如何去掉垃圾信息,利用和保护有效信息,是必须要做到的。
如果把陈传夫先生与马隽先生的观点串联起来,我们可以得出一个完整的有关信息质量的解决办法,即从法律的角度规定信息的生产、刊载,从而避免产生垃圾信息,并限制垃圾信息的重复发布和存储,而马隽先生的角度则是从地地道道的存储去看的,通过分级、分层系统,将数据按照重要程度进行分层存储,重要的数据存放在高端设备中,不重要的,甚至是垃圾数据可能存储在低端设备中,甚至通过重复数据删除技术都清除掉。这样一来,无论是从国家法律这个角度对信息资源给予了强制性的法规遵从,另一方面,从EMC这些厂商来说,也能够通过分级、分层存储来帮助用户降低总体拥有成本,提高系统利用率。
以信息服务为导向的信息开发利用
在谈了如此多的关于信息资源利用的现状、需要解决的问题以及如何解决问题之后,我们仍应该知道,有哪些实际的工作是我们接下来是必须做的,这样我们才不会出现“空口说白话”,甚至是陷于“说”的境地停步不前。
也许正因为如此,在此次研讨会上,《光明日报》才会邀请EMC作为厂商代表,来从厂商的角度说一说信息资源利用开发的问题。这也是本次研讨会的一个亮点,一般来说,这种研讨会仅限于学者和专家之间,虽然这些专家在信息资源开发利用领域有着多年经验,但是毕竟很少从企业的角度去开发产品,更很少有机会面向最终客户,对于用户的需求和变化掌握的较慢。同时,通过综合IDC的调查优势,以及自身在全球的商业资源,EMC所看到的是一个全球,而不仅仅是限于国内的开放市场。无论是发达的还是不发达的,EMC所看到的就像是一幅进化图谱,从稚嫩的初生婴儿,到快速成长的青少年以及强壮的鼎盛中年,从时间和空间上,都获得了许多关于用户的经验教训。
因此,马隽先生很骄傲的提到了EMC关于信息资产管理核心的“PPT”三要素,他表示,用PPT分析法,很容易抓住信息资产管理的问题所在。而此前,信息价值和存储设备的精力投入是差异量很大的,管设备的人很多,但基本没人去管理信息。
具体解释下来,马隽先生为与会者勾画了一幅企业信息资源开发利用的渐进式蓝图:用EMC的观点,首先要有大批的信息家;其次要设定新的流程,要深化以信息为中心、以信息服务为出发点的观念,实现从管理数据到管理信息的转变;第三是构建以信息为中心、以信息服务为出发点的信息基础架构。具体来说,EMC认为大概分为四个步骤。首先是存储,把纸质化的信息数字化。存储下来的信息要保护,备份是一种保护。信息保护之后还要优化,与信息利用结合在一起。信息管理之后是要为我们提供服务的,整个信息系统建设的过程首先要考虑的就是信息对外服务,因此企业需要构建以信息为核心,以服务为导向的IT系统架构。
我们发现,EMC此次对于研讨会的最大贡献,除了来自于以上对于如何具体实施,进行信息资源利用和开发操作的详细阐述,另一方面,就来自于EMC丰富的面向用户的经验,马隽先生谈到,虽然目前银行、政府等单位和企业都构建了自己的系统,但是有多少数据量,多少信息量,他们仍不清楚,而且这些信息更不意味着这些信息能够提供公共服务。同时,每一个政府部门做的虽然是自己的项目,但是在构建这个项目的时候其仍然不能以服务为导向,而且政府条块分割,法律法规也都是目前用户在进行信息建设时存在的问题。马隽先生表示,EMC认为,应该以信息为中心,以信息服务为导向,应用建设是以服务的形式构建,完善用户的信息基础架构,提供一系列产品、服务和最佳实践的组合,用以实现信息的存储、保护、优化和利用,使人们充分开发信息价值,创造业务优势;同时,避免在信息管理过程中遇到的潜在风险,大大降低成本。
其实对于此次研讨会,我们尚存一丝遗憾,与会的专家、学者和代表们,实际上都是在信息资源开发利用领域有着多年经验的专家,虽然也有来自一线厂商EMC的代表,帮助与会者了解最终用户,但是,毕竟世界很大,也很复杂,用户的特点不同,缺点和优势也不同。而此次研讨会,“非专家用户”就成为了一种缺失,让大家的眼光并不能放的太长太远。希望下一次能够加入更多的用户,一起进行研讨与交流,这样,无论是专家学者还是IDC或EMC,所获得知识,将会是更加丰富的,当然,信息的质量也会非常高。