一种基于藏文句子级别的藏文论文复制检测系统技术方案

技术编号:16103435 阅读:58 留言:0更新日期:2017-08-29 23:14
本实用新型专利技术是一种基于藏文句子级别的藏文论文复制检测系统,包括可访问因特网的客户终端,通过因特网连接所述客户终端的服务器中的藏文论文复制检测装置,以及连接到所述服务器存储的藏文论文的数据库;所述装置包括:从藏文论文的数据库提取待检测藏文论文文本字符做编码转换及去除噪音的通过因特网连接到所述客户终端的服务器中预处理模块;预处理模与基于藏文句子边界识别藏文论文文本并按句子分成文本块,构建文本块分词的分词临时表模块连接;分词临时表模块与在句子‑文档倒排索引表和文本块分词的临时表中得到句子文本特征的特征提取模块连接;特征提取模块与用邻接表获得文本块相似值来检测两篇藏文论文存在复制数据的复制检测模块连接。

【技术实现步骤摘要】
一种基于藏文句子级别的藏文论文复制检测系统
本技术属于藏文信息处理领域,具体涉及一种基于藏文句子级别的藏文论文复制检测系统。
技术介绍
论文复制检测的定义是判断一篇论文的内容是否抄袭、剽窃或者复制于另外一篇或者多篇论文。主要包括完全拷贝、内容的移位变换、同义词替换以及改变说法重述等抄袭方式。复制检测有时称为“抄袭检测”或者“剽窃检测”特指针对学术论文。随着互联网的不断发展和网络数字资源的日益丰富,给人们提供了资源共享和信息交流的便利平台。已经成为人们信息获取的重要来源,同时为广大科研工作者和师生提供了便捷的学术交流机会。一篇论文的文本经过增添删改字词或改变说法重述之后便可以形成新的文本,这种行为称为论文的复制或抄袭。目前,中英文论文复制检测技术较成熟。但由于藏文与中英文语言天然存在差异,诸多对中英文自然语言的复制检测处理技术并不能完全适用于藏文,也无法用它们来检测藏文论文的复制率。这一空白导致了很多民族高校和藏学研究者出现了论文质量低、学术气氛差和学术创新难以提高等现象。依靠人工进行抄袭检测,不仅耗费宝贵的人力资源,而且时效性和准确性也满足不了实际需求。因此,必须建立健全的体制,创作本文档来自技高网...
一种基于藏文句子级别的藏文论文复制检测系统

【技术保护点】
一种基于藏文句子级别的藏文论文复制检测系统,其特征在于,所述系统包括可访问因特网的客户终端,通过因特网连接到所述客户终端服务器的藏文论文复制检测装置,以及连接到所述服务器存储的藏文论文的数据库;所述藏文论文复制检测装置包括:从藏文论文的数据库提取待检测藏文论文文本字符做编码转换及去除噪音的通过因特网连接到所述客户终端的服务器中预处理模块;所述客户终端的服务器中预处理模与基于藏文句子边界识别藏文论文文本并按句子分成文本块,构建文本块分词的分词临时表模块连接;所述分词临时表模块与在句子‑文档倒排索引表和文本块分词的临时表中,得到句子文本特征的特征提取模块连接;所述特征提取模块与利用邻接表获得文本块...

【技术特征摘要】
1.一种基于藏文句子级别的藏文论文复制检测系统,其特征在于,所述系统包括可访问因特网的客户终端,通过因特网连接到所述客户终端服务器的藏文论文复制检测装置,以及连接到所述服务器存储的藏文论文的数据库;所述藏文论文复制检测装置包括:从藏文论文的数据库提取待检测藏文论文文本字符做编码转换及去除噪音的通过因特网连接到所述客户终端的服务器中预处理模块;所述客户终端的服务器中预处理模与基于藏文句子边界识别藏文论文文本并按句子分成文本块,构建文本块分词的分词临时表模块连接;所述分词临时表模块与在句子-文档倒排索引表和文本块分词的临时表中,得到句...

【专利技术属性】
技术研发人员:看不太安见才让孙琦龙昝风彪
申请(专利权)人:青海民族大学
类型:新型
国别省市:青海,63

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1