【技术实现步骤摘要】
一种基于藏文句子级别的藏文论文复制检测系统
本技术属于藏文信息处理领域,具体涉及一种基于藏文句子级别的藏文论文复制检测系统。
技术介绍
论文复制检测的定义是判断一篇论文的内容是否抄袭、剽窃或者复制于另外一篇或者多篇论文。主要包括完全拷贝、内容的移位变换、同义词替换以及改变说法重述等抄袭方式。复制检测有时称为“抄袭检测”或者“剽窃检测”特指针对学术论文。随着互联网的不断发展和网络数字资源的日益丰富,给人们提供了资源共享和信息交流的便利平台。已经成为人们信息获取的重要来源,同时为广大科研工作者和师生提供了便捷的学术交流机会。一篇论文的文本经过增添删改字词或改变说法重述之后便可以形成新的文本,这种行为称为论文的复制或抄袭。目前,中英文论文复制检测技术较成熟。但由于藏文与中英文语言天然存在差异,诸多对中英文自然语言的复制检测处理技术并不能完全适用于藏文,也无法用它们来检测藏文论文的复制率。这一空白导致了很多民族高校和藏学研究者出现了论文质量低、学术气氛差和学术创新难以提高等现象。依靠人工进行抄袭检测,不仅耗费宝贵的人力资源,而且时效性和准确性也满足不了实际需求。因此,必须 ...
【技术保护点】
一种基于藏文句子级别的藏文论文复制检测系统,其特征在于,所述系统包括可访问因特网的客户终端,通过因特网连接到所述客户终端服务器的藏文论文复制检测装置,以及连接到所述服务器存储的藏文论文的数据库;所述藏文论文复制检测装置包括:从藏文论文的数据库提取待检测藏文论文文本字符做编码转换及去除噪音的通过因特网连接到所述客户终端的服务器中预处理模块;所述客户终端的服务器中预处理模与基于藏文句子边界识别藏文论文文本并按句子分成文本块,构建文本块分词的分词临时表模块连接;所述分词临时表模块与在句子‑文档倒排索引表和文本块分词的临时表中,得到句子文本特征的特征提取模块连接;所述特征提取模块与 ...
【技术特征摘要】
1.一种基于藏文句子级别的藏文论文复制检测系统,其特征在于,所述系统包括可访问因特网的客户终端,通过因特网连接到所述客户终端服务器的藏文论文复制检测装置,以及连接到所述服务器存储的藏文论文的数据库;所述藏文论文复制检测装置包括:从藏文论文的数据库提取待检测藏文论文文本字符做编码转换及去除噪音的通过因特网连接到所述客户终端的服务器中预处理模块;所述客户终端的服务器中预处理模与基于藏文句子边界识别藏文论文文本并按句子分成文本块,构建文本块分词的分词临时表模块连接;所述分词临时表模块与在句子-文档倒排索引表和文本块分词的临时表中,得到句...
【专利技术属性】
技术研发人员:看不太,安见才让,孙琦龙,昝风彪,
申请(专利权)人:青海民族大学,
类型:新型
国别省市:青海,63
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。