文本检索方法、装置、设备及存储介质制造方法及图纸

技术编号:43603232 阅读:22 留言:0更新日期:2024-12-11 14:50
本申请公开了一种文本检索方法、装置、设备及存储介质,其包括:获取待查重文本;将待查重文本输入文本结构识别模型,得到待查重文本中的多个结构框架;对于每个结构框架分别执行以下操作:通过对结构框架所对应的文本内容进行分词操作,确定结构框架中M个特征词,以及每个特征词所对应的权重值;根据每个特征词的权重值,从待查重文本中选取得到N个关键词;利用N个关键词对应的目标权重向量,在文本库中检索得到待查重文本的相似文本。基于此,在检索过程中,通过提取待查中文本中每个结构框架对应的文本内容中的关键词,根据关键词的目标权重向量去检索得到相似文本,从而提高了相似文本的检索准确率以及检索效率。

【技术实现步骤摘要】

本申请属于检索查重,尤其涉及一种文本检索方法、装置、设备及存储介质


技术介绍

1、随着各个企业对知识产权的重视程度越来越高,对为了不断提升企业专利质量,让专利更好的发挥其本体、业务以及资产价值,在企业内部,对于专利提案的查重问题需要更加重视,以避免产生重复提交相同技术方案的专利的问题,为了进行专利申报查重,传统的企业对专利进行申报前,通常通过该领域的工作人员简单判断,只要本领域的工作人员觉得技术先进,不会存在现有技术,便撰写专利进行申报,致使专利申报后失败,不仅浪费了公司的财产,还达不到专利保护的效果,增加了工作人员的工作量,浪费人力物力。

2、但是,工作人员自行判断的方案工作量大,且查重效率以及查询准确率极低,由此,专利查重结果准确率低。


技术实现思路

1、本申请实施例提供一种文本检索方法、装置、设备及存储介质,提高了文本查重检索的准确性。

2、根据本申请的第一个方面,本申请实施例提供一种文本检索方法,该方法包括:

3、获取待查重文本;

4、将待查重文本输入本文档来自技高网...

【技术保护点】

1.一种文本检索方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,在将所述待查重文本输入文本结构识别模型,得到所述待查重文本中的多个结构框架之前,所述方法还包括:

3.如权利要求2所述的方法,其特征在于,所述以所述预设查重文本为输入,以所述结构框架类型标签为输出,训练神经网络模型,直至满足训练停止条件,得到所述文本结构识别模型,包括:

4.如权利要求3所述的方法,其特征在于,所述神经网络模型包括相互对应的解码器和编码器;

5.如权利要求1所述的方法,其特征在于,所述利用所述N个关键词对应的目标权重向量,在文本库中检索...

【技术特征摘要】

1.一种文本检索方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,在将所述待查重文本输入文本结构识别模型,得到所述待查重文本中的多个结构框架之前,所述方法还包括:

3.如权利要求2所述的方法,其特征在于,所述以所述预设查重文本为输入,以所述结构框架类型标签为输出,训练神经网络模型,直至满足训练停止条件,得到所述文本结构识别模型,包括:

4.如权利要求3所述的方法,其特征在于,所述神经网络模型包括相互对应的解码器和编码器;

5.如权利要求1所述的方法,其特征在于,所述利用所述n个关键词对应的目标权重向量,在文本库中检索得到所述待查重文本的相似文本,包括:

6.如权利要求5所述的方法,其特征在于,所述对所述关键词的权重值进行向量特征化,得到所述关键词的所述目标权重向量,包括:

7.如权利要求5所述的方...

【专利技术属性】
技术研发人员:金凡博李佳佳张燮阳
申请(专利权)人:中移动信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1