周刊特写第176期:文化共享工程再掀存储波澜

  在前一段时间的存储e周刊封面报道《平安工程到底有多大》中,我们介绍了国内迄今为止最大的安防项目“平安工程”对整个国内存储市场产生的巨大影响与推动作用,“平安工程”中的视频监控带带给了国内存储企业一个巨大商机,全国各个省市县级政府的总体招标总额,将超过数十亿元,建设周期将长达数年。如此大的一个项目,让所有的存储厂商都垂涎欲滴,希望能够从中获利,成为“平安工程”竞标中的胜利者。


  今天,有一个比“平安工程”更加庞大,延续时间更长的工程又出现在我们面前,可以说,这个工程比“平安工程”需要的存储容量更大,而且需要的传播网络更加宽广,尤其是其对于整个国家的、民族和社会的重大意义,或许,这个工程将成为我们的极大的文化财富,这个工程就是目前如火如荼展开的“文化共享工程”。


  我们不仅关注存储行业发展与商机,更努力成为厂商、用户和读者之间的桥梁,因此,在看到“文化共享工程”的对存储行业,尤其是国内存储行业的巨大影响之后,我们通过调查与追访,了解了“文化共享工程”的工程概况、系统选型、工程特点、存储需求,特此为大家奉上关于“文化共享工程”的最新信息。


  深入了解“文化共享工程”


  文化共享工程是2002年起文化部、财政部组织实施的一项社会主义文化建设标志性工程,全称是“全国文化信息资源共享工程”。截至2006年底,已建成各级中心和基层服务点6700个,包括1个国家级中心,33个省级分中心,1775个市/县级支中心,2085个乡镇、街道基层服务点,2806个村、社区基层服务点;与农村党员干部现代远程教育工程、农村中小学现代远程教育工程合作共建基层服务点分别达到19.7万和18.1万个,初步形成了覆盖全国的服务网络。除此以外,国家对于“文化共享工程”的关注,更在文化部、财政部近日下发了《关于进一步推进全国文化信息资源共享工程的实施意见》中有所体现,《意见》指出,到2010年,文化共享工程要基本建成资源丰富、技术先进、服务便捷、覆盖城乡的数字文化服务体系。


  实际上,我们看到的“文化共享工程”是一个覆盖全国的,文化传播网络,有赖于现在日益成熟的互联网和大规模的数据存储与输入技术,“文化共享工程”正在一飞速进行着容量上的扩充,从容量上来说,截止2006年年底,资源整合总量达50TB(1TB数据量相当于250,000册电子图书),其中文化共享工程管理中心建设整合资源超过8TB,各级地方中心建设整合资源达五十TB,目前共享工程共有三百部电影可提供基层使用。


  虽然经过四年的发展,现在的“文化共享工程”已经初具规模,但是许多业内的专家学者表示,“文化共享工程”还离“利用科技手段传播,实现优秀文化共享”的目标很远。目前50TB的数据,还远不能覆盖我们国家的文化资源,以图书为例,在前一段的一次研讨会上,中国社科院计算机网络中心主任、社科院信息办主任解延德表示,仅仅社科院就有140万8千种图书,以及3万种期刊,请注意,这里面说的是“种”而不是类或者册,全国的图书总量要比这些数据高的多得多。


  另一方面,大量的新创造的音频、视频、图片资源都需要大量的存储,以电影为例,2005年,中国生产的影片,仅故事片就有260部,而且因为引入民营资本和国外资本每年还成上升趋势,但是在“文化共享工程”中,仅仅有300部影片被存储。同时,与文化最相关的,就是目前国内如火如荼展开的非物质文化遗产保护工作,很多原始的文化遗存,比如说前一段众说分谈的“水书”(我国少数民族水族的一种古老文字),就需要从视频(水族老年人的讲解)、图片(水书文字记录的拍照、扫描图片)、文字(水书文字的结构化保存)等多方面去保存。当然,类似昆曲和古琴作为“人类口头和非物质文化遗产代表作”,而进行的大规模“声音文化保存”也让音乐和录音等音频文件的存储数量在呈上升趋势。


  从以上几个方面看来,整个“文化共享工程”的数据量将会庞大到我们难以想象的地步,而这些数据的开发利用、数据存储都将是一个不可小觑的问题,那么在“文化共享工程”的系统选型中我们又该注意什么呢?


  系统需求与选型特点


  目前来看,对于“文化共享工程”有许多其自身的特点,是在其建设,尤其是存储和数据信息利用的基础设施建设上必须考虑的问题。首先,就是信息的输入的问题,很多人认为,数据的录入与采集,与数据存储毫无关系,只需要有人去录入就是了。但是就像曾经出现过的某地房产证备案项目面临了数十万份房产证无法录入一样,如果不能很好的解决数据的录入问题,那么数据存储将无从谈起,而且为了在录入的时候,就有良好的存储准备,甚至在录入阶段就可以完成整个存储工作,那么分类、分级、备份与归档这些工作,实际上都应该在录入阶段由存储厂商来跟进完成,有存储厂商来完成数据采集工作,自然是更好的一种模式。


  第二点就是数据的利用,其中涉及到两个问题,一是搜索,作为文化内容的这些数据,肯定是要为国家、社会或个人的学习生活服务的,如果只是去存储一个拷贝,那所谓的“文化共享”根本无从谈起,既然是“共享”就必须要能够利用,想要利用,就必须能够找到这些数据,所以在存储的时候,进行合理的标签、索引工作就必不可少,其实对于此中大量非结构化数据,尤其是那些可能很少有人问津的大量老电影,供研究用文化资料,完全可以应用CAS来进行归档,以减少严重的管理压力。第二是分级,分层,即一定要引入分层存储的概念,国家的经费永远是有限的,不可能将所有财政收入都投入进来,建成超豪华的数据存储环境,因此,从成本考虑,必须要能够有良好的数据分层存储,就像我们上面说的,那些少有人问津的数据需要存储在低成本的存储设备中。


  谈起第三个问题,实际上我们又回到了IP存储身上,“共享工程”的网络体系建立在国家现有的骨干通讯网络上,包括由光缆连接的传输网络以及由卫星接发的网络。网络节点由一个国家中心、若干省级分中心以及基层中心组成。不具备地面网络条件的基层网点定期通过移动设备接收国家中心或分中心发送的资源。目前来看,“共享工程”将充分利用我国现有的通讯主干网络,通过在各级中心运行的系统,实现文化信息资源的共享。当涉及到网络存储,我们必须要想明白一个问题:如何才能尽快的接入一个统一的网络中去?实际上,我们很容易回答这个问题,在由光缆连接的骨干网络之外,许许多多的分支网络串联起来整个“文化共享工程”,如果选用FC网络,成本高昂,许多网络还都需要去布设,而如果选用IP网络则很容易的解决这个问题,我们的基层农村至少还会有电话线可以拨号上网吧!


  最后一个问题更加贴近真正意义上的存储概念,即选用什么样的网络存储。我们认为,目前在“文化共享工程”中,选用NAS和SAN结合的形式可能最为合适。首先,“文化共享工程”因为大量的数据需要存储,如果在SAN上进行存储,那么势必导致越来越多的数据降低SAN的速度,虽然现在已经有一些类似线性扩展、虚拟页存储等技术可以解决这个问题,但是毕竟这些技术还不普及。而相对应的,因为在“文化共享工程”中有很多“核心”,即国家级数据中心和各省市的数据中心,势必会有大量的数据吞吐,那么NAS也有所欠缺。因此,目前来说,在大环境上有SAN,在小环境上用NAS可能是最好的选择。既满足了性能的需求,又满足了对大容量文件存储的需求。


  但是,值得注意的是,IP网络在“文化共享工程”中也用应用限制,与“平安工程”不同的是,“平安工程”各省之间的数据传输可能并不频繁,相比北京也不会关心上海的视频监控到了什么不法行为。(当然,跨省作案,流窜不包括在内,不过一般各省都会在这种情况下发布协查通报)但是,“文化共享工程”中不是如此,各个省的数据中心之间的互联以及其与国家级数据中心的互联必须要使用FC存储,因为他们下辖的都是大量的基层数据中心,他们是数据的来源与直接使用用户,省中心实际上扮演了一点对多点(一省对多省共享)和一点对一点共享(一省对国家中心)的角色,大量的数据需要由他们来转发。所以,目前看来最高性能的FC存储是必不可少的??谁也不会希望受到“国际出口带宽”那样的网络影响。


  存储厂商热衷“文化共享工程”


  据近期很多厂商披露的情况来看,经过了一段时间的总体规划与方向指导,“文化共享工程”已经正式进入实施阶段,包括H3C、浪潮在内的国内厂商都参与了进来,他们也都在“文化共享工程”中的一些分支工程中有着出色的表现。在第一期的项目建设中,H3C在山东、天津、河南、青海、海南等地区的项目中均取得成功应用。谈起“文化共享工程”,H3C存储产品部总工廖军显然有着很深入的了解,“对于文化信息资源的存储建设,不仅仅是简单的容量需求和性能,更重要的是如何让,文化信息资源被更好地挖掘和利用。”


  而国内的另一家厂商浪潮也在“文化共享工程”中有所斩获,作为政府推动的重点工程,该项目吸引了众多国内外厂商的极大关注。在四川省,文化共享的重点工程四川省数字图书馆建设,成为了四川省重点的信息化建设项目。而浪潮存储则在众多竞争者中脱颖而出,成功获得了该项目。而从服务器方面,在前一段时间的二期服务器招标项目中,浪潮拿下全部千余台服务器订单,这也是05年之后,浪潮服务器第二次夺得该项目采购大单。


  据了解,之所以两家本土厂商在工程中斩获颇丰,主要有如下几个原因,一是作为本土厂商,在对二、三级甚至四级城市的渠道把握较为出色,建立了全国非常透彻的销售渠道;二是其产品本土化程度更好,在此次工程中,由于涉及众多软件管理操作,因此管理软件是否中文化,简易化非常重要;第三,由于实施区域跨度广,各地区的经济状况及信息化建设基础千差万别,对于建设成本及后期管理维护提出了较高的要求。因此,如何在渠道渗透、产品本地化以及控制成本方面做的更加出色,成为了是否能够获得青睐的重要原因。


  不可忽视的问题


  不过,目前来看,“文化共享工程”中有一些问题我们绝对不能小看,否则未来的问题就会很严重。


  首先就是扩展性,我们这里所谈的扩展性并不只是指某一厂商的产品延续性,而是不同厂商的不同产品的产品扩展性,在目前的招投标体系下,每次投标的中标单位不一定都是一家厂商,因此,就涉及到后续厂商如何整合、延续之前产品的问题,如何构建能够简单扩展,快速延续的存储架构,是在系统实施建设中必须注意的问题。


  除此以外,此次“文化共享工程”必须注意信息的质量的问题,武汉大学信息管理学院院长陈传夫先生一直以来都对信息资源的开发利用非常关注。他认为,信息质量是一个非常大的问题,甚至需要制定“信息资源增值利用法”以实现信息有效的、合法的、高效率的开发利用的一个法宝,统筹信息的公开、利用的标准问题。实际上,信息质量涉及到很多问题,陈传夫先生目前正在从事的研究就涉及到这个领域,一个是信息的权威度,法律文件是不是就是国家政府发布的,还是引用的发言。另一个是实效的问题,有些数据已经更新了,但是网上数字或一些文档中的并没有更新。


  存储业界因为“平安工程”曾掀起了一次兴奋的浪潮,在这个浪潮还没有退去的时候,又一次“文化共享”的浪潮又将来临。走过四年路程的“文化共享工程”,在经历了成功、挫折,积累了经验教训之后,已经开始健康的发展起来,很多厂商也成功的建设了符合“文化共享工程”的系统设施。“文化共享工程”是一个对全民族和整个国家都非常重要而且必要的工作,前路也许艰辛,也许漫长,但一定要坚定不移的走下去。


  昊观存储:


  “文化共享工程”比“平安工程”更加庞大,延续时间更长的工程又出现在我们面前,可以说,这个工程比“平安工程”需要的存储容量更大,而且需要的传播网络更加宽广,尤其是其对于整个国家的、民族和社会的重大意义。但是,“文化共享工程”必须注意信息质量与信息资源的开发利用问题,这样才能真正达到“文化共享工程”的初衷,才能做到“利用科技手段传播,实现优秀文化共享”。


  点此阅读完整的第176期『存储e周刊』
  点此免费订阅『存储e周刊』,第一时间快速掌握全球领域的最新动态
  点此免费订阅《信息存储》杂志,“信息创造价值”