【技术实现步骤摘要】
召回模型的训练方法、召回方法及相关设备
[0001]本申请涉及人工智能
,更具体地,涉及一种召回模型的训练方法、召回方法及相关设备。
技术介绍
[0002]随着多媒体技术的发展,音频、视频等多媒体的数量也在急剧增长,从海量的多媒体中准确召回多媒体,能够有效缩短用户查询多媒体的时间,如果召回的多媒体与用户实际想要的多媒体相关性不高,即多媒体召回的准确度不高,需要用户进行多次查询和搜索,造成用户所在终端与多媒体服务器之间进行多次交互。因此,如何提升多媒体的召回准确度是相关技术中亟待解决的技术问题。
技术实现思路
[0003]鉴于上述问题,本申请实施例提出了召回模型的训练方法、召回方法及相关设备,以提升多媒体的召回准确度。
[0004]根据本申请实施例的一个方面,提供了一种召回模型的训练方法,包括:获取多个第一文本对,所述第一文本对包括第一提问文本和第一回答文本,所述第一提问文本是根据多媒体的描述信息生成的,且以多媒体的资源标识为提问目标的文本,所述第一回答文本是所述第一提问文本提问所针对的资源标识; ...
【技术保护点】
【技术特征摘要】
1.一种召回模型的训练方法,其特征在于,包括:获取多个第一文本对,所述第一文本对包括第一提问文本和第一回答文本,所述第一提问文本是根据多媒体的描述信息生成的,且以多媒体的资源标识为提问目标的文本,所述第一回答文本是所述第一提问文本提问所针对的资源标识;根据多个第一文本对中的第一提问文本和第一回答文本对召回模型进行预训练;获取多个第二文本对,所述第二文本对包括第二提问文本和第二回答文本,所述第二提问文本是以多媒体对应的相关多媒体的资源标识为提问目标的文本,所述第二回答文本是所述第二提问文本提问针对的相关多媒体的资源标识;根据多个第二文本对中的第二提问文本和第二回答文本对预训练后的召回模型进行微调训练。2.根据权利要求1所述的方法,其特征在于,所述召回模型包括编码器网络和解码器网络;所述根据多个第一文本对中的第一提问文本和第一回答文本对召回模型进行预训练,包括:由所述编码器网络对所述第一提问文本进行语义编码处理,得到所述第一提问文本对应的第一语义编码序列;由所述解码器网络对所述第一语义编码序列进行解码处理,得到所述第一提问文本对应的预测回答文本;根据所述第一提问文本对应的预测回答文本和对应的第一回答文本,计算第一损失;根据所述第一损失反向调整所述编码器网络和所述解码器网络的权重参数。3.根据权利要求2所述的方法,其特征在于,所述根据多个第二文本对中的第二提问文本和第二回答文本对预训练后的召回模型进行微调训练,包括:由预训练后的编码器网络对所述第二提问文本进行语义编码处理,得到所述第二提问文本对应的第二语义编码序列;由预训练后的解码器网络对所述第二语义编码序列进行解码处理,得到所述第二提问文本对应的预测回答文本;根据所述第二提问文本对应的预测回答文本和对应的第二回答文本,计算第二损失;根据所述第二损失反向调整预训练后所述召回模型中部分网络层的权重参数。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述获取多个第一文本对之前,所述方法还包括:获取多媒体的描述信息和所述多媒体对应的资源标识;根据所述描述信息中至少一个描述字段的值,生成以所述多媒体的资源标识为提问目标的所述第一提问文本;将所述多媒体的资源标识作为所述第一提问文本对应的第一回答文本。5.根据权利要求4所述的方法,其特征在于,所述根据所述描述信息中至少一个描述字段的值,生成以所述多媒体的资源标识为提问目标的所述第一提问文本,包括:获取第一提问模板,所述第一提问模板以资源标识为提问目标,所述第一提问模板指示了至少一个描述字段;从多媒体的描述信息中获取所述第一提问模板所指示的各描述字段的值;
将所获取的描述字段的值与所述第一提问模板进行组合,获得所述第一提问文本。6.根据权利要求1至3中任一项所述的方法,其特征在于,所述获取多个第二文本对之前,所述方法还包括:获取多媒体反馈数据,所述多媒体反馈数据指示了在设定时长内被触发反馈操作的至少两个多媒体;根据所述至少两个多媒体中的第一多媒体对应的资源标识,生成以所述第一多媒体对应的相关多媒体的资源标识为提问目标的第二提问文本;所述第一多媒体对应的相关多媒体包括所述至少两个多媒体中除所述第一多媒体外的至少一个多媒体;将所述第一多媒体对应的相关多媒体的资源标识作为所述第二提问文本对应的第二回答文本。7.根据权利要求6所述的方法,其特征在于,所述根据所述至少两个多媒体中的第一多媒体对应的资源标识,生成以所述第一多媒体对应的相关多媒体的资源标识为提问目标的第二提问文本,包括:获取第二提问模板,所述第二提问模板以相关多媒体的资源标识为提问目标;将所述至少两个多媒体中的第一多媒体对...
【专利技术属性】
技术研发人员:马晋,常亚宁,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。