【技术实现步骤摘要】
一种科技计划项目申报书相似性检测的方法
[0001]本专利技术涉及计算机软件数据处理领域,尤其涉及一种科技计划项目申报书相似性检测的方法
。
技术介绍
[0002]传统的科技计划管理信息系统中项目申报书的审核一般由人工进行,项目申报书可以作为文本比对的对象,将项目申报书文本信息汇总用于申报书相似性检测,可以辅助申报书的审核工作,比如判断申报书是否存在抄袭
。
由于项目申报书相似性检测环节需要耗费较多的人工比对精力
。
技术实现思路
[0003]为了解决以上技术问题,本专利技术提供了一种科技计划项目申报书相似性检测的方法
。
提供申报书库的管理和维护功能,提供申报书文本相似度检测功能,提供检测报告,辅助科技计划项目申报书审核工作
。
[0004]本专利技术的技术方案是:
[0005]一种科技计划项目申报书相似性检测的方法,通过将已有的申报书导入到申报书库,并对申报书文本进行提取,得到新申报书库;将待检测的申报书内容分成若干个文本后与新申报书库中的文字信息相比对,得到各个文本中与新申报书库中文字信息之间的相似度;将比对结果进行高亮标识
、
分值计算之后,生成申报书检测报告
。
[0006]进一步的,
[0007]包含如下几个部分:
[0008]查重比对库,用以支撑科技计划项目申报书的查重,用户可以根据业务需求自建比对库,将待查重检测的项目申报书与比对库文本进行比对查重;
[000 ...
【技术保护点】
【技术特征摘要】
1.
一种科技计划项目申报书相似性检测的方法,其特征在于,通过将已有的申报书导入到申报书库,并对申报书文本进行提取,得到新申报书库;将待检测的申报书内容分成若干个文本后与新申报书库中的文字信息相比对,得到各个文本中与新申报书库中文字信息之间的相似度;将比对结果进行高亮标识
、
分值计算之后,生成申报书检测报告
。2.
根据权利要求1所述的方法,其特征在于,包含如下几个部分:查重比对库,用以支撑科技计划项目申报书的查重,用户可以根据业务需求自建比对库,将待查重检测的项目申报书与比对库文本进行比对查重;查重比对任务,支持多种形式的查重比对任务构建;支持多种查重算法;并支持查重算法拓展,通过定义通用接口
Checker
,接口内约束方法
、
参数,拓展查重算法时,只需完成接口
Checker
中对应方法的实现即可;查重对比报告,基于以上两部分,完成查重比对任务后,将产出综合比对报告
、
详细比对报告
。3.
根据权利要求2所述的方法,其特征在于,查重比对库,用于新建比对库
、
删除比对库
、
查询比对库
。4.
根据权利要求3所述的方法,其特征在于,在新建比对库时,比对库文件类型可兼容一种以上类型文本格式,并支持其他类型文本格式拓展
。5.
根据权利要求4所述的方法,其特征在于,拓展方式如下:
(1)
定义文本解析工厂
com.inspur.similarity.core.convert.ConverterFactor...
【专利技术属性】
技术研发人员:徐浩,李灿,张悦,
申请(专利权)人:浪潮软件科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。