数据检索方法、深度学习模型的训练方法、以及装置制造方法及图纸

技术编号:42004657 阅读:16 留言:0更新日期:2024-07-12 12:26
本公开提供了一种数据检索方法,涉及人工智能技术领域,尤其涉及自然语言处理、深度学习技术领域。具体实现方案为:基于待处理查询项中的语义信息,从文本库中确定M个候选文本,其中,M为大于或等于1的整数;基于待处理查询项中的关键词信息,从文本库中确定N个候选文本,其中,N为大于或等于1的整数;以及基于M个候选文本和N个候选文本,确定至少一个目标文本。本公开还提供了一种深度学习模型的训练方法、装置、电子设备和存储介质。

【技术实现步骤摘要】

本公开涉及人工智能,尤其涉及自然语言处理、深度学习。更具体地,本公开提供了一种数据检索方法、深度学习模型的训练方法、装置、电子设备、存储介质以及计算机程序产品。


技术介绍

1、目前的检索系统,例如法律条文、文档等文本的检索。需要用户根据文本中的部分内容来进行精确或模糊检索。这种检索方式需要用户熟知文本中包含有哪些内容,再使用这些内容的关键字作为检索式来进行检索。

2、然而,在用户不熟悉文本内容的情况下,可能会由于使用的关键字不够准确,导致检索不到相关内容。


技术实现思路

1、本公开提供了一种数据检索方法、深度学习模型的训练方法、装置、电子设备、存储介质以及计算机程序产品。

2、根据第一方面,提供了一种数据检索方法,该方法包括:基于待处理查询项中的语义信息,从文本库中确定m个候选文本,其中,m为大于或等于1的整数;基于待处理查询项中的关键词信息,从文本库中确定n个候选文本,其中,n为大于或等于1的整数;以及基于m个候选文本和n个候选文本,确定至少一个目标文本。

3、根据第二方本文档来自技高网...

【技术保护点】

1.一种数据检索方法,包括:

2.根据权利要求1所述的方法,其中,所述基于待处理查询项中的语义信息,从文本库中确定M个候选文本包括:

3.根据权利要求2所述的方法,其中,所述确定所述待处理查询项的语义特征包括:

4.根据权利要求2所述的方法,还包括:

5.根据权利要求1所述的方法,其中,所述基于所述待处理查询项中的关键词信息,从所述文本库中确定N个候选文本包括:

6.根据权利要求5所述的方法,其中,所述文本库中的文本包括标题和内容;所述方法还包括:

7.根据权利要求1至6中任一项所述的方法,其中,所述基于所述M个候选...

【技术特征摘要】

1.一种数据检索方法,包括:

2.根据权利要求1所述的方法,其中,所述基于待处理查询项中的语义信息,从文本库中确定m个候选文本包括:

3.根据权利要求2所述的方法,其中,所述确定所述待处理查询项的语义特征包括:

4.根据权利要求2所述的方法,还包括:

5.根据权利要求1所述的方法,其中,所述基于所述待处理查询项中的关键词信息,从所述文本库中确定n个候选文本包括:

6.根据权利要求5所述的方法,其中,所述文本库中的文本包括标题和内容;所述方法还包括:

7.根据权利要求1至6中任一项所述的方法,其中,所述基于所述m个候选文本和所述n个候选文本,确定至少一个目标文本包括:

8.一种深度学习模型的训练方法,其中,所述深度学习模型包括查询处理子模型和文本处理子模型;所述方法包括:

9.根据权利要求8所述的方法,其中,所述查询处理子模型包括编码模块、注意力模块和全连接模块;所述使用所述查询处理子模型对所述样本查询项进行处理,得到所述样本查询项的语义特征包括:

10.根据权利要求8所述的方法,其中,所述样本查询项包括多个样本查询项;所述方法还包括:

11.根据权利要求10所述的方法,其中,

12.一种数据检索装置,包括:

13.根据权利要求12所述的装置,其中,所述第一候选...

【专利技术属性】
技术研发人员:张晶郑磊于晟邢国亮
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1