大数据助力学术道德和学风建设

  又到了万千学子面临毕业的季节,毕业论文是否再次成为惯例问题?

  然而在大学生中,有不少人可能是迫于写作时间紧张,也可能是投机取巧的心里作祟,他们会找人代写论文或者在网上搜索资料、东拼西凑。这就造成了论文千篇一律、质量低下的不良现象。为了遏制高校论文撰写中的不良风气,推进建立良好学风,万方数据日前在以往研究成果的基础上推出了 “大学生论文相似性检测服务”系统,可有效帮助高校检查学位论文是否存在作假行为提供了更便捷、更人性化的参考工具。

  一直以来,教育部高度重视学术道德和学风建设。去年1月1日,教育部颁布的首部处理学术不端行为的部门规章《学位论文作假行为处理办法》正式实施。规章指出,论文作假者将被取消学位申请资格,同时要求学位授予单位建立健全学位论文审查制度,审核学位论文的真实性和原创性。

  目前市面上流行的论文检测系统都基于不同的算法原理和底层数据库。万方数据论文相似性检测服务则是以万方数据收录的海量学术文献资源:中国学术期刊数据库、中国学位论文全文数据库、中国学术会议论文数据库、中国学术网页数据库等为基础,基于自主研发的“基于滑动窗口的低频特征部分匹配算法”,迅速检测出新论文和已发表论文的相似片段。新系统针对高校的论文检测需求开发,用户定位为高校图书馆、教务处、学位办等学位论文管理机构或相关部门。系统检测的文献范围为学位论文,包括博士学位论文、硕士学位论文和本科学生毕业论文。

  很明显,“大学生论文相似性检测系统”可为高校的论文审查、质量评估工作提供工具支持,为发现剽窃、篡改等学术不端行为提供科学依据,并且可发现个人或单位的重要文献是否被他人非法使用或公开,起到一定意义上的文献保护作用。

  当然,论文相似性检测系统只是一种技术手段,对论文造假行为可以起到一定程度的督促和提醒的作用,是重要的辅助措施,但是论文相似度的高低并不一定直接对应论文质量的高低,因为影响检测论文相似性结果的因素有很多,例如不同论文中有些涉及某些概念或事实的客观描述是一致的。因此,论文相似性检测系统仅为用户提供量化的相似性检测客观结果,不做抄袭结论判断。要最终确定论文中是否存在学术不端行为,还需要用户通过人工检查分析等多种方法进一步加以判断。

  “大学生论文相似性检测系统”的推出,其主要目的在于进一步强化高校的诚信意识和学术规范意识,促进学术环境的良性发展。随着该类产品的进一步的完善,监测文献资源的范围逐步扩大,检测技术更高的系统将会出现,必将可以全面满足用户多方面、多层次的论文检测需求,既能避免对相似原创论文的误判,又可让“抄袭”“山寨”无所遁形。