System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及论文发表诚信评估,尤其涉及一种基于完整期刊库的论文发表诚信评估分析方法及系统。
技术介绍
1、学术诚信是社会发展和创新的根基,但造假、剽窃等学诚信问题长期不能杜绝,假论文大量充斥在学术评价中,人工鉴别难度大,目前国内没有专门的检测软件。
2、以知网、维普、万方、龙源等为代表的期刊数据公司,其产品主要功能是为使用者提供过往的文献阅读,个别具有为期刊编辑部提供来稿的复制比检测功能。学术业绩竞争激烈、非法期刊暗流涌动的环境下,在普通高校学生、中小学教师、全国医院的医务人员、企事业单位的技术人员等庞大的群体里,年发表非法期刊数据数量特别巨大,假刊、假论文的数量远远高于真刊真论文。国内专家学者以及各群体的学术管理部门、人力资源管理部门都知悉现状,但人工认定的难度大,掌握鉴定技能的人员少。基于完整期刊数据总库的条件下,亟需一种基于完整期刊库的论文发表诚信评估逻辑的制定方法,来有效解决由于期刊数据数量巨大,不能有效进行论文发表诚信的评估问题。
技术实现思路
1、本专利技术提供一种基于完整期刊库的论文发表诚信评估分析方法及系统,以克服上述技术问题。
2、一种基于完整期刊库的论文发表诚信评估分析方法,包括以下步骤:
3、s1:根据知网已有的期刊数据建立初始期刊数据库;并从所述初始期刊数据库中获取期刊数据的关键信息;
4、所述期刊数据的关键信息至少包括期刊刊名与期刊论文数据;所述期刊论文数据包括期刊论文篇名、作者姓名以及期刊论文全文;
>5、s2:根据所述期刊数据的关键信息,将所述期刊数据中各已发表论文建立期刊文献数据集;对所述期刊文献数据集中的期刊数据进行全文遍历,并对全文遍历后的期刊数据进行文本分类,获取期刊分类数据集;
6、采用向量化形式对所述期刊分类数据集中的已发表论文进行规范化处理,获取优化期刊文献数据集;
7、并根据所述优化期刊文献数据集构建完整期刊数据总库;
8、s3:对待诚信评估的期刊数据进行全文遍历,并对遍历后的所述待诚信评估的期刊数据进行文本字符编码,获取待诚信评估数据;
9、所述待诚信评估数据包括期刊刊名、期刊论文篇名、期刊论文作者以及对应的期刊论文数据;
10、s4:根据所述完整期刊数据总库,基于诚信评估逻辑策略对所述待诚信评估信息进行诚信评估,确认待诚信评估期刊的作者发表论文行为的诚信度。
11、进一步的,s4中所述诚信评估逻辑策略具体为:
12、s41:将所述待诚信评估数据传输至所述完整期刊数据总库,并基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊刊名;并判断所述完整期刊数据总库中是否存在对应所述待诚信评估数据中的期刊刊名;
13、若确认所述完整期刊数据总库存在对应所述待诚信评估数据中的期刊刊名,则执行s42;
14、若确认所述完整期刊数据总库不存在对应所述待诚信评估数据中的期刊刊名,则执行s43;
15、s42:基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊论文篇名;并判断所述完整期刊数据总库中是否存在对应所述待诚信评估数据中的期刊论文篇名;
16、若确认所述完整期刊数据总库存在对应所述待诚信评估数据中的期刊论文篇名,则执行s44;
17、若确认所述完整期刊数据总库不存在对应所述待诚信评估数据中的期刊论文篇名,则执行s43;
18、s43:基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊论文数据;并判断期刊论文数据与所述完整期刊数据总库的文字复制比率;
19、若所述判断期刊论文数据相对于所述完整期刊数据总库的文字复制比率大于预设文字复制比率阈值,则确认待诚信评估的期刊数据的评估结果为疑似剽窃;
20、若所述判断期刊论文数据相对于所述完整期刊数据总库的文字复制比率小于等于预设文字复制比率阈值,则确认待诚信评估的期刊数据的评估结果为未录入所述完整期刊数据总库的非正常发表的疑似假期刊载文;
21、s44:基于所述完整期刊数据总库检索匹配对应所述待诚信评估数据中的期刊论文篇名;并判断所述完整期刊数据总库中是否存在对应所述待诚信评估数据中的期刊论文作者;
22、若确认所述完整期刊数据总库存在对应所述待诚信评估数据中的期刊论文作者,则确认待诚信评估的期刊数据的评估结果为正常发表;
23、若确认所述完整期刊数据总库不存在对应所述待诚信评估数据中的期刊论文作者,则确认待诚信评估的期刊数据的评估结果为疑似剽窃。
24、进一步的,s2中采用向量化形式对所述期刊文献数据集中的已发表论文进行规范化处理,获取优化期刊文献数据集;具体为
25、根据所述期刊文献数据集中已发表的论文进行各论文字符编码,获取编码数据向量信息;且所述编码数据向量信息至少包括期刊刊名、期刊论文篇名、期刊论文作者以及期刊论文文本;
26、并根据所述编码数据向量信息设置期刊文献字符链接,所述期刊文献字符链接包括对应编码数据向量信息的期刊刊名字符链接、期刊论文篇名字符链接、期刊论文作者字符链接以及期刊论文字符链接;
27、并根据所述编码数据向量信息与期刊文献字符链接获取优化期刊文献数据集。
28、一种基于完整期刊库的论文发表诚信评估分析方法的系统,包括期刊信息输入模块、期刊对比检测模块、期刊索引模块、期刊编录模块以及期刊诚信评估模块;
29、所述期刊索引模块用于对所述待诚信评估的期刊数据全文遍历,并将全文遍历后的所述待诚信评估的期刊数据传输至所述期刊编录模块;
30、所述期刊编录模块用于对全文遍历后的所述待诚信评估的期刊数据进行文本分类提取,获取待诚信评估数据,并将所述待诚信评估数据传输至所述期刊信息输入模块;
31、所述待诚信评估数据包括期刊刊名、期刊论文篇名、期刊论文作者以及对应的期刊论文数据;
32、所述期刊对比检测模块用于将待诚信评估数据与期刊文献总库中的期刊数据的关键信息进行对比,并将比对结果发送至期刊诚信评估模块;
33、所述期刊信息输入模块用于将所述待诚信评估数据传输至所述期刊诚信评估模块;且所述期刊诚信评估模块用于调用所述期刊对比检测模块,并基于诚信评估逻辑策略对所述待诚信评估信息进行诚信评估,确认待诚信评估期刊的作者发表论文行为的诚信度。
34、进一步的,还包括可视化辅助确认模块,所述可视化辅助确认模块用于识别显示所述期刊信息输入模块输入的当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息是否正确;
35、若确认当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息至少有一项信息识别有误,则对识别有误的信息进行人工重新输入正确信息纠错;
36、并将纠错后的当前所述待诚信评估数据的期刊刊名、期刊论文篇名以及期刊论文作者的信息传输至期刊诚信本文档来自技高网...
【技术保护点】
1.一种基于完整期刊库的论文发表诚信评估分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于完整期刊库的论文发表诚信评估分析方法,其特征在于,S4中所述诚信评估逻辑策略具体为:
3.根据权利要求1所述的一种基于完整期刊库的论文发表诚信评估分析方法,其特征在于,S2中采用向量化形式对所述期刊文献数据集中的已发表论文进行规范化处理,获取优化期刊文献数据集;具体为根据所述期刊文献数据集中已发表的论文进行各论文字符编码,获取编码数据向量信息;且所述编码数据向量信息至少包括期刊刊名、期刊论文篇名、期刊论文作者以及期刊论文文本;
4.一种基于权利要求1-3所述的基于完整期刊库的论文发表诚信评估分析方法的系统,其特征在于,包括期刊信息输入模块、期刊对比检测模块、期刊索引模块、期刊编录模块以及期刊诚信评估模块;
5.根据权利要求4所述的一种基于完整期刊库的论文发表诚信评估分析方法的系统,其特征在于,还包括可视化辅助确认模块,所述可视化辅助确认模块用于识别显示所述期刊信息输入模块输入的当前所述待诚信评估数据的期刊刊名、期刊论文篇名以
...【技术特征摘要】
1.一种基于完整期刊库的论文发表诚信评估分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于完整期刊库的论文发表诚信评估分析方法,其特征在于,s4中所述诚信评估逻辑策略具体为:
3.根据权利要求1所述的一种基于完整期刊库的论文发表诚信评估分析方法,其特征在于,s2中采用向量化形式对所述期刊文献数据集中的已发表论文进行规范化处理,获取优化期刊文献数据集;具体为根据所述期刊文献数据集中已发表的论文进行各论文字符编码,获取编码数据向量信息;且所述编码数据向量信息至少包括期...
【专利技术属性】
技术研发人员:李勘,
申请(专利权)人:中国人民解放军海军大连舰艇学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。