【技术实现步骤摘要】
本公开涉及人工智能,尤其涉及自然语言处理、深度学习。更具体地,本公开提供了一种数据检索方法、深度学习模型的训练方法、装置、电子设备、存储介质以及计算机程序产品。
技术介绍
1、目前的检索系统,例如法律条文、文档等文本的检索。需要用户根据文本中的部分内容来进行精确或模糊检索。这种检索方式需要用户熟知文本中包含有哪些内容,再使用这些内容的关键字作为检索式来进行检索。
2、然而,在用户不熟悉文本内容的情况下,可能会由于使用的关键字不够准确,导致检索不到相关内容。
技术实现思路
1、本公开提供了一种数据检索方法、深度学习模型的训练方法、装置、电子设备、存储介质以及计算机程序产品。
2、根据第一方面,提供了一种数据检索方法,该方法包括:基于待处理查询项中的语义信息,从文本库中确定m个候选文本,其中,m为大于或等于1的整数;基于待处理查询项中的关键词信息,从文本库中确定n个候选文本,其中,n为大于或等于1的整数;以及基于m个候选文本和n个候选文本,确定至少一个目标文本。
...【技术保护点】
1.一种数据检索方法,包括:
2.根据权利要求1所述的方法,其中,所述基于待处理查询项中的语义信息,从文本库中确定M个候选文本包括:
3.根据权利要求2所述的方法,其中,所述确定所述待处理查询项的语义特征包括:
4.根据权利要求2所述的方法,还包括:
5.根据权利要求1所述的方法,其中,所述基于所述待处理查询项中的关键词信息,从所述文本库中确定N个候选文本包括:
6.根据权利要求5所述的方法,其中,所述文本库中的文本包括标题和内容;所述方法还包括:
7.根据权利要求1至6中任一项所述的方法,其中,
...【技术特征摘要】
1.一种数据检索方法,包括:
2.根据权利要求1所述的方法,其中,所述基于待处理查询项中的语义信息,从文本库中确定m个候选文本包括:
3.根据权利要求2所述的方法,其中,所述确定所述待处理查询项的语义特征包括:
4.根据权利要求2所述的方法,还包括:
5.根据权利要求1所述的方法,其中,所述基于所述待处理查询项中的关键词信息,从所述文本库中确定n个候选文本包括:
6.根据权利要求5所述的方法,其中,所述文本库中的文本包括标题和内容;所述方法还包括:
7.根据权利要求1至6中任一项所述的方法,其中,所述基于所述m个候选文本和所述n个候选文本,确定至少一个目标文本包括:
8.一种深度学习模型的训练方法,其中,所述深度学习模型包括查询处理子模型和文本处理子模型;所述方法包括:
9.根据权利要求8所述的方法,其中,所述查询处理子模型包括编码模块、注意力模块和全连接模块;所述使用所述查询处理子模型对所述样本查询项进行处理,得到所述样本查询项的语义特征包括:
10.根据权利要求8所述的方法,其中,所述样本查询项包括多个样本查询项;所述方法还包括:
11.根据权利要求10所述的方法,其中,
12.一种数据检索装置,包括:
13.根据权利要求12所述的装置,其中,所述第一候选...
【专利技术属性】
技术研发人员:张晶,郑磊,于晟,邢国亮,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。