【技术实现步骤摘要】
信息召回方法、装置、计算机设备和存储介质
[0001]本申请涉及自然语义处理
,特别是涉及一种信息召回方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]随着自然语义处理技术的发展,出现了信息召回技术,目前,信息召回技术通常应用在搜索场景下,在搜索场景中,搜索者使用搜索语句进行信息搜索,搜索平台使用搜索语句进行信息召回,将召回的信息进行排序后展示给搜索者。目前,在使用搜索语句进行信息召回时,通常是从搜索语句中提取出关键词,使用关键词进行信息召回。然而,使用关键词进行信息召回会存在遗漏高质量信息的问题,导致信息召回质量低。
技术实现思路
[0003]基于此,有必要针对上述技术问题,提供一种能够提高信息召回质量的信息召回方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0004]第一方面,本申请提供了一种信息召回方法。所述方法包括:
[0005]获取搜索语句,将搜索语句中的各个搜索词进行组合,得到各个候选搜索项;
[0006]基于搜索语句分别与各个 ...
【技术保护点】
【技术特征摘要】
1.一种信息召回方法,其特征在于,所述方法包括:获取搜索语句,将所述搜索语句中的各个搜索词进行组合,得到各个候选搜索项;基于所述搜索语句分别与所述各个候选搜索项进行全局语义特征提取,得到所述各个候选搜索项分别对应的全局语义特征;获取所述各个候选搜索项分别对应的召回信息统计数据,将所述召回信息统计数据进行特征转换,得到所述各个候选搜索项分别对应的召回特征;获取所述各个候选搜索项分别对应的重要性表征信息,将所述重要性表征信息进行特征转换,得到所述各个候选搜索项分别对应的重要性特征,所述重要性表征信息是指表征候选搜索项中搜索词重要性的信息;基于所述全局语义特征、所述召回信息特征和所述重要性特征对所述各个候选搜索项进行重要程度计算,得到所述各个候选搜索项分别对应的重要程度;基于所述重要程度从所述各个候选搜索项中确定目标搜索项,并使用所述目标搜索项进行信息召回,得到目标召回信息。2.根据权利要求1所述的方法,其特征在于,所述将所述搜索语句中的各个搜索词进行组合,得到各个候选搜索项,包括:当所述搜索语句存在所述重要性表征信息时,将所述搜索语句进行分词,得到各个搜索词;将所述各个搜索词进行排列组合,得到各个初始搜索项;从所述各个初始搜索项中筛选符合预设重要性表征条件的搜索项,得到各个候选搜索项。3.根据权利要求1所述的方法,其特征在于,所述基于所述搜索语句分别与所述各个候选搜索项进行全局语义特征提取,得到所述各个候选搜索项分别对应的全局语义特征,包括:从所述候选搜索项中确定当前搜索项,将所述当前搜索项和所述搜索语句进行拼接,得到拼接语句,将所述拼接语句中的各个字符进行向量化,得到拼接字符嵌入向量;基于所述当前搜索项和所述搜索语句确定所述拼接语句中各个字符的所属信息,将所述各个字符的所属信息进行向量化,得到拼接字符区别向量;将所述拼接语句中各个字符在语句序列中的位置进行向量化,得到拼接字符位置向量;将所述拼接字符嵌入向量、拼接字符区别向量和所述拼接字符位置向量进行融合,得到目标融合向量;基于所述目标融合向量进行上下文语义提取,得到所述当前搜索项对应的当前全局语义特征;遍历所述各个候选搜索项,得到所述各个候选搜索项分别对应的全局语义特征。4.根据权利要求1所述的方法,其特征在于,所述候选搜索项中包括至少一个搜索词;所述获取所述各个候选搜索项分别对应的召回信息统计数据,将所述召回信息统计数据进行特征转换,得到所述各个候选搜索项分别对应的召回特征,包括:从所述各个候选搜索项中确定当前搜索项,并从所述当前搜索项中确定当前搜索词,从所述各个候选搜索项中获取包含所述当前搜索词的各个目标候选搜索项;
获取所述各个目标候选搜索项分别对应的召回信息索引序列长度,将所述各个目标候选搜索项分别对应的召回信息索引序列长度进行拼接,得到所述当前搜索词对应的词召回信息统计数据;遍历所述当前搜索项中各个搜索词,得到所述当前搜索项中各个搜索词分别对应的词召回信息统计数据,并将所述当前搜索项中各个搜索词分别对应的词召回信息统计数据进行拼接,得到所述当前搜索项对应的当前召回信息统计数据;将所述当前召回信息统计数据进行向量化,得到所述当前搜索项对应的召回特征,并遍历所述各个候选搜索项,得到所述各个候选搜索项分别对应的召回特征。5.根据权利要求4所述的方法,其特征在于,将所述当前召回信息统计数据进行向量化,得到所述当前搜索项对应的召回特征,包括:将所述当前召回信息统计数据进行全连接运算,得到全连接统计特征,并将所述全连接统计特征进行归一化,得到归一化统计特征;获取统计数据向量化参数,使用所述统计数据向量化参数对所述归一化统计特征进行加权,得到所述当前搜索项对应的召回特征。6.根据权利要求1所述的方法,其特征在于,所述候选搜索项中包括至少一个搜索词;所述获取所述各个候选搜索项分别对应的重要性表征信息,将所述重要性表征信息进行特征转换,得到所述各个候选搜索项分别对应的重要性特征,包括:从所述各个候选搜索项中确定当前搜索项,并获取所述当前搜索项中至少一个搜索词分别对应的重要性表征信息;将所述至少一个搜索词分别对应的重要性表征信息进行拼接,得到所述当前搜索项对应的当前重要性表征信息;将所述当前重要性表征信息进行向量化,得到所述当前搜索项对应的重要性特征,并遍历所述各个候选搜索项,得到所述各个候选搜索项分别对应的重要性特征。7.根据权利要求6所述的方法,其特征在于,所述将所述当前重要性表征信息进行向量化,得到所述当前搜索项对应的重要性特征,包括:将所述当前重要性表征信息进行全连接运算,得到目标全连接特征,并将所述目标全连接特征进行归一化,得到目标归一化特征;获取重要性向量化参数,使用所述重要性向量化参数对所述目标归一化特征进行加权,得到所述当前搜索项对应的重要性特征。8.根据权利要求1所述的方法,其特征在于,所述基于所述全局语义特征、所述召回信息特征和所述重要性特征对所述各个候选搜索项进行重要程度计算,得到所述各个候选搜索项分别对应的重要程度,包括:基于所述召回信息特征和所述重要性表征特征进行语义特征提取,得到所述各个候选搜索项分别对应的组合语义特征;使用所述全局语义特征和所述组合语义特征对所述各个候选搜索项进行重要程度计算,得到所述各个候选搜索项分别对应的重要程度。9.根据权利要求8所述的方法,其特征在于,所述基于所述召回信息特征和所述重要性表征特征进行语义特征提取,得到所述各个候选搜索项分别对应的组合语义特征,包括:将各个候选搜索项分别对应的所述召回信息特征和所述重要性表征特征进行拼接,得
到各个项拼接特征;对所述各个项拼接特征分别进行语义特征提取,得到所述各个候选搜索项分别对应的组合语义特征。10.根据权利要求8所述的方法,其特征在于,所述使用所述全局语义特征和所述组合语义特征对所述各个候选搜索项进行重要程度计算,得到所述各个候选搜索项分别对应的重要程度,包括:将所述各个候选搜索项对应的全局语义特征和组合语义特征进行拼接,得到所述各个候选搜索项分别对应的目标拼接特征;基于所述目标拼接特征进行的召回信息分布预测,得到所述各个候选搜索项分别对应的召回信息分布信息,并使用所述召回信息分布信息进行召回质量计算,得到所述各个候选搜索项分别对应的召回质量值,基于所述目标拼接特征进行重要性量化值计算,得到所述各个候选搜索项分别对应的重要性量化值;基于所述召回质量值和所述重要性量化值进行综合计算,得到所述各...
【专利技术属性】
技术研发人员:朱秀红,黄泽谦,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。