为了进一步加大我国知识产权保护力度,切实提升知识产权保护信息化水平,以便向公众提供更佳优质的专利检索服务,国家知识产权局近年来不断建设完善专利检索平台,让曾经繁琐的专利检索变得“轻而易举”。在专利检索平台的建设中,联想自2008年起向国家知识产权局累计提供了166台R525 G3服务器和33台R630 G7服务器,为本项目构建了坚实可靠的数据检索平台。
国家知识产权局专利检索平台建成后,共收集了世界80个国家和专利组织的英文专利数据,以及自1985年以来的中国专利数据。可以根据不同用户的检索需求,提供快捷检索、表格检索和高级检索等多种检索方式。这是国家知识产权局向社会公众提供优质专利信息检索服务的一项全新举措。
项目背景
国家知识产权局主要负责组织协调全国保护知识产权工作,推动知识产权保护工作体系建设。会同有关部门建立知识产权执法协作机制,开展相关的行政执法工作。承担规范专利管理基本秩序的责任,拟订知识产权涉外工作的政策,统筹协调涉外知识产权事宜,按分工开展对外知识产权谈判。
本项目要求将目前知识产权局的专利信息以互联网服务模式提供给知识产权局内部专业人员及外部收费用户及公众用户查询和利用。
需求分析
专利信息检索服务系统以B/S模式实现,替代先前知识产权局内部以C/S模式服务的专利检索系统的检索服务和数据浏览功能,提供给授权的网络用户包括专利信息分类导航、简单检索、表格检索、高级检索、历史检索等等多种检索机制,提供检索结果的多种表现方式。
目前知识产权局专利数据情况:“550万条专利数据、全文对象大小在0.01M-20M左右(平均每条在22k左右)、图像数据总量在8TB左右”,要求提供设计优良的检索系统架构,能够支撑公众用户同时十万人在线,支持最大200检索并发请求,内部专业用户约2万人左右同时在线,支持最大 300-400并发检索请求。项目需根据知识产权局专利数据的增长情况,充分考虑未来的服务支撑和数据扩容。
根据专利信息检索需求的特殊性,设计实现各特色检索服务功能,如检索结果关键词的分色反显、可视化导航、结果分类统计、检索历史维护等分项服务。
方案设计
专利检索平台依附于底层网络、服务器平台,配合数据库环境及全文检索系统,向前端的检索应用服务系统提供查询功能,最终反馈给公众及内部人员进行审查、咨询,整体架构如下:
图一:专利检索服务系统整体框架
根据本项目建设需求,设计如上图的总体应用系统框架。整个系统将依托相应的软硬件基础设施,部署全文检索系统,整合并索引知识产权局现有的及未来的专利信息数据,利用成熟的检索接口及J2EE技术构建面向大众用户及高级授权用户的两大类检索应用服务,并通过用户管理和认证系统有效管理用户对检索系统的使用。在表现层通过专利检索服务门户向最终用户提供服务入口。
在本架构方案中,内外检索平台共采用33台四路服务器构成全文数据库两套集群,每台服务器采用四颗英特尔至强7400系列CPU,32G内存,8*146G SAS硬盘构成RAID10阵列,均安装TRS全文数据库系统(TRS Database Server)对中文专利数据进行索引、提供检索功能核心支持,550万条专利数据在服务器中分布,共形成4组镜像。将数据相同、镜像关系的服务器组成一个逻辑组,所以形成2大组服务器。
2大组全文数据库集群服务器,均安装TRS Database Cluster系统,分别挂接全文数据库服务器,对全文数据库服务器统一进行检索请求调度。集群服务器之上通过负载均衡设备均衡来自上层应用系统的检索请求。全文数据库集群服务器硬件采用双CPU,32G内存的PC Server服务器。
全文数据库与关系数据库之间,通过运行TRS关系数据库网关系统的服务器用于调度全文数据库与关系数据库间数据的迁移和同步。为避免单机故障造成的潜在损失。
客户收益
国家知识产权局(专利局)通过本次项目对内外检索平台的建设,极大地提升了专利检索的速度,保存了更多的专利数据,更大程度上满足社会对国内外专利信息检索的需求,提升专利检索服务水平,为国家经济发展打下坚实的基础。本项目的成功实践也树立了联想服务器在国家政府行业的又一典型工程。