内容搜索方法、相关装置和介质制造方法及图纸

技术编号:41528305 阅读:21 留言:0更新日期:2024-06-03 23:03
本公开提供了一种内容搜索方法、相关装置和介质。方法包括:获取输入查询向量;将输入查询向量输入文本向量模型的自注意力模块中的第一通道、第二通道和第三通道,分别得到第一通道向量、第二通道向量和第三通道向量;对第一通道向量和第二通道向量进行注意力计算,得到第一注意力矩阵;获取位置偏置矩阵,位置偏置矩阵用于指示第一通道向量中的各个第一元素与第二通道向量中的各个第二元素的距离大小;基于第一注意力矩阵和位置偏置矩阵,确定第二注意力矩阵,并基于第三通道向量和第二注意力矩阵,确定目标查询特征向量;基于目标查询特征向量,搜索目标内容。本公开能提高文本内容的搜索准确性。本公开可应用于大数据、云技术等各种场景。

【技术实现步骤摘要】

本公开涉及大数据,特别是涉及一种内容搜索方法、相关装置和介质


技术介绍

1、目前,在信息搜索、智能问答等多种业务场景中,往往需要根据对象提供的查询信息在语料库中搜索出与查询信息相匹配的结果,并将搜索结果进行反馈。为了提高内容搜索效率,相关技术的内容搜索大多数都是依赖于神经网络模型实现,但是,相关技术的内容搜索所依赖的神经网络模型对篇幅较长的内容文本的处理能力有限,往往存在着无法有效地捕捉到长文本的语义信息的缺陷,会导致内容搜索的准确性低下。


技术实现思路

1、本公开实施例提供了一种内容搜索方法、相关装置和介质,它能够提高文本内容的搜索准确性。

2、根据本公开的一方面,提供了一种内容搜索方法,所述方法包括:

3、获取输入查询向量;

4、将所述输入查询向量输入文本向量模型的自注意力模块中的第一通道、第二通道和第三通道,分别得到第一通道向量、第二通道向量和第三通道向量;

5、对所述第一通道向量和所述第二通道向量进行注意力计算,得到第一注意力矩阵;其中,所述第一注意力本文档来自技高网...

【技术保护点】

1.一种内容搜索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的内容搜索方法,其特征在于,所述基于所述第三通道向量和所述第二注意力矩阵,确定目标查询特征向量,包括:

3.根据权利要求2所述的内容搜索方法,其特征在于,所述基于所述第三通道向量和所述第二注意力矩阵,确定注意力修正向量,包括:

4.根据权利要求1所述的内容搜索方法,其特征在于,所述基于所述目标查询特征向量,搜索目标内容,包括:

5.根据权利要求1所述的内容搜索方法,其特征在于,对于所述输入查询向量中的任一个词,所述词在所述第一通道向量中所对应的第一元素的元素序号、与所述...

【技术特征摘要】

1.一种内容搜索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的内容搜索方法,其特征在于,所述基于所述第三通道向量和所述第二注意力矩阵,确定目标查询特征向量,包括:

3.根据权利要求2所述的内容搜索方法,其特征在于,所述基于所述第三通道向量和所述第二注意力矩阵,确定注意力修正向量,包括:

4.根据权利要求1所述的内容搜索方法,其特征在于,所述基于所述目标查询特征向量,搜索目标内容,包括:

5.根据权利要求1所述的内容搜索方法,其特征在于,对于所述输入查询向量中的任一个词,所述词在所述第一通道向量中所对应的第一元素的元素序号、与所述词在所述第二通道向量中所对应的第二元素的元素序号相同,其中,所述元素序号用于指示所述词在所述输入查询向量的排列顺序;

6.根据权利要求1所述的内容搜索方法,其特征在于,所述文本向量模型通过以下方式对预训练语言模型进行调整得到:

7.根据权利要求6所述的内容搜索方法,其特征在于,所述针对每个指定参考查询,构造正样本和负样本,包括:

8.根据权利要求6所述的内容搜索方法,其特征在于,所述基于多个所述指定参考查询的所述第一相关性分数、和所述第二相关性分数对所述预训练语言模型的模型参数进行调整,包括:

9.根据权利要求8所述的内容搜索方法,其特征在于,所述针对每个所述指定参考查询,基于所述第一相关性分数、以及多个所述第二相关性分数的第一和,确定第一损失子函数,包括:

10.根据权利要求6所述的内容搜索方...

【专利技术属性】
技术研发人员:陈春全
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1