英国皇家化学学会部署NoSQL数据库

英国皇家学会日前开始部署MarkLogic NoSQL数据库,将其170多年来收藏的资料向公众开放。

英国皇家化学学会(以下简称为RSC)是欧洲最大的化学科研机构。RSC成立已有170多年的历史,其自1840年以来收集的大量资料难以被管理、出版和广泛利用。数字化资产的爆炸式增长导致这一问题更加恶化。

MarkLogic开发的NoSQL数据库解决方案正是RSC所需要的,它使得RSC所收藏的珍贵资料能够向公众开放,让RSC公布的期刊数量增长了3倍,文章数量增长了4倍。RSC还拥有了研发新教育应用的能力,能够让更多的读者更容易地接触到这些化学知识。

由于得到了一家国际出版公司和全球成员的支持,RSC的活动涉及教育、学术会议、科技政策,以及向公众普及化学知识等。1972年,英国四大知名学术组织——化学学会、分析化学学会、皇家化学研究所和法拉第学会开始合并,于1980年正式组建成为RSC。 RSC收集了100多万张图片、数百万的科研数据,以及20多万名作者编写的数以千计的文章。目前又在这基础上又引入了社交媒体、视频和其他形式的数字化内容。

RSC Publishing的MarkLogic数据库搜索界面

RSC确认MarkLogic文档数据库是一个创建综合资源库的理想解决方案,来自全球的企业家、科研人员和教育工作者都可以很容易地进行在线访问。MarkLogic的关键是如何将内容存储为XML文档,例如合同、手册、书籍、电子邮件、推文和元数据。这些无法也不能以行与列这种简单的形式表达的信息,非常适合MarkLogic中基于XML和以文档为中心的模式。

RSC项目办公室主任David Leeming说:“书的章节与期刊文章具有很大的区别,你根本无法使用关系模式,也无法将这两类东西放在一起。我们只需要在MarkLogic中填写我们的XML,就可以将它们作为一个单一的综合传输机制。”

NoSQL系统的一个显著特点就是无模式特征。这意味着数据库的元数据不必为了创建应用而被非常严格地规范起来,而通常基于关系型数据库的应用都需要严格地规范。通过MarkLogic,大量信息能够被加载,尤其是未被明确定义的、变化的和/或未知模式的索引和查询信息能够被高效加载。

内容的每一个部分都会被自动标记。通过将不同的研究、视频、期刊文章或图片间的点连接起来,用户能够快速查找内容并理解相关的背景。借助于MarkLogic,RSC平台还为儿童增加了新的应用、为科研人员增加了学术期刊,以及社交功能和移动功能。

RSC首席执行官Robert Parker说:“从2010年开始,RSC一直在致力于让数据更开放,并拥有社交和移动功能。我们选择的MarkLogic数据库能够将所有的数据都整合在一个数据库中,无论这些数据有多大,采用什么样的结构。这一项目使得50万份学术期刊文章的访问人数增加了30%,教育网站的搜索量增加了70%,同时还提升了RSC的国际影响力。尤其是印度、中国和巴西的科研人员对RSC网站的访问量出现了大幅增长。”