【技术实现步骤摘要】
查询结果向量化方法、查询结果确定方法及相关装置
[0001]本公开涉及数据处理
,具体涉及自然语言处理、深度学习、知识图谱等人工智能
,尤其涉及一种查询结果向量化方法和查询结果确定方法,以及配套的装置、电子设备、计算机可读存储介质、计算机程序产品。
技术介绍
[0002]随着机器学习、深度学习技术的不断提升,人工智能技术逐渐被应用在各个领域,以借助人工智能服务获取查询词或查询语句对应的查询结果的场景为例,人工智能服务往往都是通过计算查询内容与查询内容或查询内容与查询结果之间的关联性来给出反馈,同时考虑到自然语言不便于被计算机识别,所以在实际的数据分析过程中往往需要将自然语言转换为便于被计算机识别的向量、矩阵等形式。
[0003]考虑到大多数场景下为了使查询结果更便于被用户理解,其除了常规的文本内容外还包含有图像内容,因此如何将同时包含有图文内容的查询结果进行准确的向量化,以使最终转换得到的查询结果向量可用于进行关联性计算,是本领域技术人员亟待解决的问题。
技术实现思路
[0004]本公开实 ...
【技术保护点】
【技术特征摘要】
1.一种查询结果向量化方法,包括:获取包含文本内容和图像内容的原始查询结果;在保持所述文本内容与所述图像内容排布顺序不变的情况下,将所述图像内容替换为图像占位符,得到替换后查询结果;将所述替换后查询结果转换为文本内容向量、并将所述图像内容转换为与所述文本内容向量尺寸一致的图像内容向量;根据所述图像占位符在所述替换后查询结果中的位置,将所述图像内容向量拼接至所述文本内容向量中的相应位置,得到拼接向量;根据所述拼接向量确定所述原始查询结果的向量化表示。2.根据权利要求1所述的方法,其中,所述根据所述拼接向量确定所述原始查询结果的向量化表示,包括:响应于所述拼接向量的尺寸大于预设尺寸,对所述拼接向量进行降维处理,得到降维至所述预设尺寸的降维后向量;将所述降维后向量作为所述原始查询结果的向量化表示。3.根据权利要求1或2所述的方法,其中,所述根据所述图像占位符在所述替换后查询结果中的位置,将所述图像内容向量拼接至所述文本内容向量中的相应位置,得到拼接向量,包括:根据所述图像占位符在所述替换后查询结果中的位置,确定与所述图像占位符对应的向量在所述文本内容向量中的目标位置;将所述图像内容向量拼接至所述文本内容向量中的目标位置,得到所述拼接向量。4.一种查询结果确定方法,包括:将获取到的查询语句转换为实际查询向量;基于所述实际查询向量分别与知识问答库中不同的候选查询向量之间的向量相似度,筛选出包含预设数量目标候选查询语句的目标候选查询语句序列,所述候选查询向量为相应候选查询语句的向量化表示,所述候选查询语句与相应的候选查询结果之间组成了查询结果对;基于所述实际查询向量分别与不同的目标候选查询语句所对应的候选查询结果向量之间的向量相似度,调整不同的目标候选查询语句在所述目标候选查询语句序列中的排序,得到调整后候选查询语句序列,所述候选查询结果向量为相应的候选查询结果按权利要求1
‑
3任一项所提供的查询结果向量化方法表示为向量;基于所述调整后候选查询语句序列中不同目标候选查询语句的排序,顺序返回相应的候选查询结果。5.根据权利要求4所述的方法,其中,所述将获取到的查询语句转换为实际查询向量,包括:利用知识库或知识图谱,确定所述查询语句所属的类别信息;将所述类别信息与所述查询语句的文本组合,转换为所述实际查询向量。6.根据权利要求5所述的方法,其中,所述将所述类别信息与所述查询语句的文本组合,转换为所述实际查询向量,包括:将所述类别信息补充至所述查询语句的起始位置,得到类别信息补完语句;
将所述类别信息补完语句转换为所述实际查询向量。7.根据权利要求4所述的方法,其中,所述将获取到的查询语句转换为实际查询向量,包括:将所述查询语句作为输入数据输入预设的自然语言向量化模型;控制所述自然语言向量化模型的不同功能层均输出的与输入本功能层的数据对应的语义句向量,所述自然语言向量化模型包含串接的多个功能层;控制所述自然语言向量化模型分别确定不同功能层的加权权重,不同功能层对应的加权权重预先经有标注的训练样本在训练阶段学习得到;控制所述自然语言向量化模型基于相应功能层的加权权重对相应功能层的语义句向量进行加权计算,并将不同功能层的加权计算结果聚合为目标语义句向量;将所述自然语言向量化模型输出的目标语义句向量作为与所述查询语句对应的实际查询向量。8.根据权利要求4
‑
7任一项所述的方法,其中,所述基于所述实际查询向量分别与知识问答库中不同的候选查询向量之间的向量相似度,包括:利用基于聚类算法的索引式向量计算引擎,计算所述实际查询向量分别与所述知识问答库中不同的候选查询向量之间的向量相似度。9.一种查询结果向量化装置,包括:原始查询结果获取单元,被配置成获取包含文本内容和图像内容的原始查询结果;图像内容替换单元,被配置成在保持所述文本内容与所述图像内容排布顺序不变的情况下,将所述图像内容替换为图像占位符,得到替换后查询结果;向量转换单元,被配置成将所述替换后查询结果转换为文本内容向量、并将所述图像内容转换为与所述文本内容向量尺寸一致的图像内容向量;向量拼接单元,被配置成根据所述图像占位符在所述替换后查询结果中的位置,将所述图像内容向量拼接至所述文本内容向量中的相应位置,得到拼接向量;查询结果向量化单元,被配置成根据所述拼接向量确定所述原...
【专利技术属性】
技术研发人员:苏磊,韩光耀,陈禹燊,李治平,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。