一种多维度科技项目立项查重的方法、装置和电子设备制造方法及图纸

技术编号:35814898 阅读:10 留言:0更新日期:2022-12-03 13:38
本公开的实施例公开了一种多维度科技项目立项查重的方法、装置和电子设备。该方法的一具体实施方式包括:获取目标文本;对目标文本进行预处理,得到预处理文本;根据预处理文本从目标文本库中确定相似文本;根据相似文本和目标文本生成文本报告。该实施方式能够更加准确的找到目标文本的相似文本,也就使最后的结果更为准确,同时减少人力资源的浪费。同时减少人力资源的浪费。同时减少人力资源的浪费。

【技术实现步骤摘要】
一种多维度科技项目立项查重的方法、装置和电子设备


[0001]本公开的实施例涉及计算机
,具体涉及一种多维度科技项目立项查重的方法、装置和电子设备。

技术介绍

[0002]根据实际业务需求,科技项目立项查重的目的在于避免对同一研究内容的重复立项进而造成对科技经费的浪费。因此,查重的核心内容在于通过系统自动判别待立项科技项目/项目的研究内容与历史上一定时间期已经立项支持过的项目/项目的研究内容相同或接近。
[0003]由于中文语言处理存在单词边界界定、词义消歧、句法模糊性等的复杂性,加上项目申请者因自身书写表达习惯的多样性以及科技项目跨领域的特点,使得在自然语言处理方面中需要损耗更多的人力资源,耗时费力,并且较难达到理想的效果。

技术实现思路

[0004]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]本公开的一些实施例提出了用于多维度科技项目立项查重的方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题。
[0006]第一方面,本公开的一些实施例提供了一种用于多维度科技项目立项查重的方法,该方法包括:获取目标文本;对上述目标文本进行预处理,得到预处理文本;根据上述预处理文本从目标文本库中确定相似文本;根据上述相似文本和上述目标文本生成文本报告。
[0007]第二方面,本公开的一些实施例提供了一种多维度科技项目立项查重装置,装置包括:获取单元,被配置成获取目标文本;预处理单元,被配置成对上述目标文本进行预处理,得到预处理文本;确定单元,被配置成根据上述预处理文本从目标文本库中确定相似文本;生成单元,被配置成根据上述相似文本和上述目标文本生成文本报告。
[0008]第三方面,本申请实施例提供了一种电子设备,该网络设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
[0009]第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
[0010]本公开的上述各个实施例中的一个实施例具有如下有益效果:首先,获取目标文本,之后对上述目标文本进行预处理,得到预处理文本,再根据上述预处理文本从目标文本库中确定相似文本,最后,根据上述相似文本和上述目标文本生成文本报告。从而能够更加准确的找到目标文本的相似文本,也就使最后的结果更为准确,同时减少人力资源的浪费。
附图说明
[0011]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0012]图1是根据本公开一些实施例的多维度科技项目立项查重方法的一个应用场景的示意图;
[0013]图2是根据本公开的多维度科技项目立项查重方法的一些实施例的流程图;
[0014]图3是根据本公开的多维度科技项目立项查重装置的一些实施例的结构示意图;
[0015]图4是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
[0016]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0017]另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0018]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0019]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0020]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0021]下面将参考附图并结合实施例来详细说明本公开。
[0022]图1是根据本公开一些实施例的多维度科技项目立项查重方法的一个应用场景的示意图。
[0023]如图1所示,首先,上述执行主体服务器101可以获取目标文本102,之后对上述目标文本102进行预处理,得到预处理文本103,再根据上述预处理文本103从目标文本库104中确定相似文本105,最后,根据上述相似文本105和上述目标文本102生成文本报告106。
[0024]可以理解的是,多维度科技项目立项查重方法可以是由终端设备来执行,或者也可以是由服务器101来执行,上述方法的执行主体还可以包括上述终端设备与上述服务器101通过网络相集成所构成的设备,或者还可以是各种软件程序来执行。其中,终端设备可以是具有信息处理能力的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。执行主体也可以体现为服务器101、软件等。当执行主体为软件时,可以安装在上述所列举的电子设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
[0025]应该理解,图1中的服务器数目仅仅是示意性的。根据实现需要,可以具有任意数目的服务器。
[0026]继续参考图2,示出了根据本公开的多维度科技项目立项查重方法的一些实施例
的流程200。该多维度科技项目立项查重方法,包括以下步骤:
[0027]步骤201,获取目标文本。
[0028]在一些实施例中,多维度科技项目立项查重方法的执行主体(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式获取目标文本。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。具体的,上述目标文本通常是指由用户预先选定的文本,或需要检索查询是否具有相似文献的文本。
[0029]步骤202,对目标文本进行预处理,得到预处理文本。
[0030]在一些实施例中,基于步骤201中得到的目标文本,上述执行主体(例如图1所示的服务器)可以对上述目标文本进行预处理。具体的,上述预处理通常是指对上述目标文本进行文本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于多维度科技项目立项查重的方法,包括:获取目标文本;对所述目标文本进行预处理,得到预处理文本;根据所述预处理文本从目标文本库中确定相似文本;根据所述相似文本和所述目标文本生成文本报告。2.根据权利要求1所述的方法,其中,所述根据所述预处理文本从目标文本库中确定相似文本,包括:从所述目标文本库中选取查询文本;对所述查询文本进行预处理,得到预处理查询文本;将所述预处理查询文本和所述预处理文本输入至预先训练的语义模型,得到所述预处理查询文本和所述预处理文本的相似度;响应于所述相似度满足预设条件,将所述查询文本确定为相似文本。3.根据权利要求2所述的方法,其中,所述语义模型是双塔结构的。4.根据权利要求2

3之一所述的方法,其中,所述语义模型是以所述目标文本库中的文本作为训练样本,对深度语言表示模型进行自监督训练得到的。5.根据权利要求1所述的方法,其中,所述对所述目标文本进行预处理,包括:对所述目标文本进行分句处理,删除所述目标文本中的非中文字符、停用词以及语气词,对所述目标文本进行分词处理。6.根据权利要求1所述的方法,其中,所述文本报告包括:所述目标文本库的信息,所述相似文本和所述目标文本的...

【专利技术属性】
技术研发人员:周玉培
申请(专利权)人:北京美髯公科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1