一种文章观点剽窃行为的检测方法技术

技术编号:23085123 阅读:30 留言:0更新日期:2020-01-11 01:10
本发明专利技术提供一种文章观点剽窃行为的检测方法,涉及文本抄袭检测技术领域。该文章观点剽窃行为的检测方法,包括以下步骤:S1.根据不同领域的文章特点定义文章的关键要素;S2.针对关键要素定义抽取规则;S3.从比对库中获取比对文本;S4.在待检测和比对文本中进行关键要素抽取;S5.基于抽取得到的关键要素,可以基于规则的方式计算文章整体相似度;也可以作为基于统计的方法的特征数据,输入到训练好的分类器中进行分类;S6.报告检测结果。通过对现有系统无法有效检测观点剽窃行为的现状进行改进,提高抄袭检测的有效性,可以作为现有系统的有利补充。

A method to detect plagiarism of article views

【技术实现步骤摘要】
一种文章观点剽窃行为的检测方法
本专利技术涉及文本抄袭检测
,具体为一种文章观点剽窃行为的检测方法。
技术介绍
文本抄袭检测已经广泛应用于信息检索、网页去重、图书馆资源版权保护、软件著作权保护等领域,文本抄袭可以分为两种情况:一种是字面抄袭;一种是智能抄袭,字面抄袭是指抄袭者在抄袭时未做隐蔽工作,通常只调整语序,如主动句变被动句,拆分从句,通常不会对词进行替换,而智能抄袭则更加隐蔽,通常作者会有意对原文进行修改,企图蒙蔽读者,常见的方式包括:替换同义词;对文章进行总结;翻译其它语言的文章;通过自动翻译软件将原文翻译至一目标语言然后再翻译回原语言;将别人的思想(包括实验结果、贡献、发现和结论等)通过自己的语言描述出来等,即观点剽窃。现有的系统(例如CNKI)无法有效检测观点剽窃,而这是目前文本抄袭的主要方式,并且具有非常恶劣的影响,例如在医学和医药领域中,未识别出的抄袭文献内容可能会危害病人的安全,另外现有的方法在进行抄袭检测时,没有考虑到文档中不同内容的重要程度,例如在实验分析或者结论部分的抄袭和剽窃行为的重要程度应该大于绪论或相本文档来自技高网...

【技术保护点】
1.一种文章观点剽窃行为的检测方法,其特征在于:包括以下步骤:/nS1.根据不同领域的文章特点定义文章的关键要素;/nS2.针对关键要素定义抽取规则;/nS3.从比对库中获取比对文本;/nS4.在待检测和比对文本中进行关键要素抽取;/nS5.基于抽取得到的关键要素,可以基于规则的方式计算文章整体相似度;也可以作为基于统计的方法的特征数据,输入到训练好的分类器中进行分类;/nS6.报告检测结果。/n

【技术特征摘要】
1.一种文章观点剽窃行为的检测方法,其特征在于:包括以下步骤:
S1.根据不同领域的文章特点定义文章的关键要素;
S2.针对关键要素定义抽取规则;
S3.从比对库中获取比对文本;
S4.在待检测和比对文本中进行关键要素抽取;
S5.基于抽取得到的关键要素,可以基于规则的方式计算文章整体相似度;也可以作为基于统计的方法的特征数据,输入到训练好的分类器中进行分类;
S6.报告检测结果。


2.根据权利要求1所述的一种文章观点剽窃行为的检测方法,其特征在于:所述步骤2中的抽取规则定义,通过刻画概念和概念之间的关系实现。


3.根据权利要求1所述的一种文章观点剽窃行为的检测方法,其特征在于:所述步骤3中的比对库,可以包括但不限于国内主要学术期刊、硕博文章、国内外学术会议文章、国内外重要报纸全文、互联网资源、图书资源,以及自建比对库。


4.根据权利要求1所述的一种文章观点剽窃行为的检测方法,...

【专利技术属性】
技术研发人员:孟涛李佳静
申请(专利权)人:南京网感至察信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1