System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 召回模型的训练方法、装置、计算机设备及存储介质制造方法及图纸_技高网

召回模型的训练方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40699961 阅读:4 留言:0更新日期:2024-03-22 10:57
本申请实施例公开了一种召回模型的训练方法、装置、计算机设备及存储介质。本方案通过获取目标平台中的用户信息以及用户发布的笔记信息,进而提取用户信息的用户特征向量,以及提取笔记信息的笔记特征向量;获取笔记信息中的多模态信息对应的多模态向量,并根据用户特征向量、笔记特征向量以及多模态向量计算损失参数,然后,基于损失参数调整预设召回模型的参数,得到目标召回模型。以此,可以提高召回模型的内容召回精度。

【技术实现步骤摘要】

本申请涉及计算机,具体涉及一种召回模型的训练方法、装置、计算机设备及存储介质


技术介绍

1、推荐系统是一种用于向用户推荐感兴趣内容的系统,被广泛应用于笔记推荐、音视频推荐、购物推荐等推荐场景。内容推荐的过程通常包括召回和排序,其中,召回是指从内容数据库中筛选出符合用户兴趣的候选内容,而排序则是对候选内容的精筛排序过程。

2、相关技术中,通常利用深度学习训练得到内容召回模型实现内容召回。但是,相关技术中内容召回模型所使用的内容相关特征为类目、话题等粗粒度的特征,在一定程度上损失了笔记内容中的其他模态信息,影响召回模型的召回精度。


技术实现思路

1、本申请实施例提供一种召回模型的训练方法、装置、计算机设备及存储介质,可以提高召回模型的内容召回精度。

2、本申请实施例提供了一种召回模型的训练方法,包括:

3、获取目标平台的用户信息以及媒体信息;

4、对所述用户信息进行向量化处理,得到所述用户信息对应的第一向量;

5、对所述媒体信息进行向量化处理,得到所述媒体信息对应的第二向量;

6、获取所述媒体信息中的多模态信息对应的多模态向量,并根据所述第一向量、所述第二向量以及所述多模态向量计算预设召回模型的损失参数;

7、基于所述损失参数调整预设召回模型的参数,得到目标召回模型。

8、相应的,本申请实施例还提供了一种召回模型的训练装置,包括:

9、第一获取单元,用于获取目标平台的用户信息以及媒体信息;

10、第一处理单元,用于对所述用户信息进行向量化处理,得到所述用户信息对应的第一向量;

11、第二处理单元,用于对所述媒体信息进行向量化处理,得到所述媒体信息对应的第二向量;

12、计算单元,用于获取所述媒体信息中的多模态信息对应的多模态向量,并根据所述第一向量、所述第二向量以及所述多模态向量计算预设召回模型的损失参数;

13、调整单元,用于基于所述损失参数调整预设召回模型的参数,得到目标召回模型。

14、在一些实施例中,第一处理单元包括:

15、第一提取子单元,用于对所述用户信息进行特征提取,得到用户特征向量;

16、第一处理子单元,用于对所述用户特征向量进行降维处理,得到所述第一向量。

17、在一些实施例中,第二处理单元包括:

18、第二提取子单元,用于对所述媒体信息进行特征提取,得到媒体特征向量;

19、第二处理子单元,用于对所述媒体特征向量进行降维处理,得到所述第二向量。

20、在一些实施例中,计算单元包括:

21、获取子单元,用于获取所述媒体信息中的文本模态信息和图像模态信息;

22、第三提取子单元,用于提取所述文本模态信息的特征,得到文本特征向量,以及提取所述图像模态信息的特征,得到图像特征向量;

23、第三处理子单元,用于分别对所述文本特征向量与所述图像特征向量进行降维处理,得到所述文本模态信息对应的第一模态向量,以及所述图像模态信息对应的第二模态向量。

24、在一些实施例中,计算单元包括:

25、第一计算子单元,用于根据所述第一向量和所述第二向量计算第一损失函数;

26、第二计算子单元,用于根据所述第二向量、所述第一模态向量和所述第二模态向量计算第二损失函数;

27、第三计算子单元,用于根据所述第一模态向量和所述第二模态向量计算第三损失函数;

28、第四计算子单元,用于基于所述第一损失函数、第二损失函数以及所述第三损失函数计算所述损失参数。

29、在一些实施例中,第一计算子单元具体用于:

30、对所述第一向量进行线性变换处理,得到所述第一向量对应的预估向量和随机失活向量;

31、对所述第二向量进行线性变换处理,得到所述第二向量对应的预估向量和随机失活向量;

32、基于所述第一向量对应的预估向量拟合所述第二向量对应的随机失活向量,以及基于所述第二向量对应的预估向量拟合所述第一向量对应的随机失活向量,得到所述第一损失函数。

33、在一些实施例中,第二计算子单元具体用于:

34、对所述第一模态向量进行线性变换处理,得到所述第一模态向量对应的预估向量和随机失活向量;

35、对所述第二模态向量进行线性变换处理,得到所述第二模态向量对应的预估向量和随机失活向量;

36、基于所述第二向量对应的预估向量拟合所述第一模态向量对应的随机失活向量和所述第二模态向量对应的随机失活向量,得到所述第二损失函数。

37、在一些实施例中,第三计算子单元具体用于:

38、基于所述第一模态向量对应的预估向量拟合所述第二模态向量对应的随机失活向量,以及基于所述第二模态向量对应的预估向量拟合所述第一模态向量对应的随机失活向量,得到所述第三损失函数。

39、在一些实施例中,该装置还包括:

40、第三获取单元,用于获取目标用户信息,并对所述目标用户信息进行特征提取,得到目标用户特征;

41、召回单元,用于将所述目标用户特征输入所述目标召回模型,基于所述目标召回模型从所述目标平台的媒体信息中召回与所述目标用户特征匹配的目标媒体信息。

42、相应的,本申请实施例还提供了一种计算机设备,包括存储器,处理器及存储在储存器上并可在处理器上运行的计算机程序,其中,处理器执行本申请实施例任一提供的召回模型的训练方法。

43、相应的,本申请实施例还提供了一种存储介质,存储介质存储有多条指令,指令适于处理器进行加载,以执行如上的召回模型的训练方法。

44、本申请实施例通过获取目标平台中的用户信息以及用户发布的笔记信息,进而提取用户信息的用户特征向量,以及提取笔记信息的笔记特征向量;获取笔记信息中的多模态信息对应的多模态向量,并根据用户特征向量、笔记特征向量以及多模态向量计算损失参数,然后,基于损失参数调整预设召回模型的参数,得到目标召回模型。以此,可以提高召回模型的内容召回精度。

本文档来自技高网...

【技术保护点】

1.一种召回模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述用户信息进行向量化处理,得到所述用户信息对应的第一向量,包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述媒体信息进行向量化处理,得到所述媒体信息对应的第二向量,包括:

4.根据权利要求1所述的方法,其特征在于,所述获取所述媒体信息中的多模态信息对应的多模态向量,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述第一向量、所述第二向量以及所述多模态向量计算预设召回模型的损失参数,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述第一向量和所述第二向量计算第一损失函数,包括:

7.根据权利要求6所述的方法,其特征在于,所述根据所述第二向量、所述第一模态向量和所述第二模态向量计算第二损失函数,包括:

8.根据权利要求7所述的方法,其特征在于,所述根据所述第一模态向量和所述第二模态向量计算第三损失函数,包括:

9.根据权利要求1所述的方法,其特征在于,还包括:

10.一种召回模型的训练装置,其特征在于,所述装置包括:

11.一种计算机设备,包括存储器,处理器及存储在存储器上并在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1至9任一项所述的召回模型的训练方法。

12.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至9任一项所述的召回模型的训练方法。

...

【技术特征摘要】

1.一种召回模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述用户信息进行向量化处理,得到所述用户信息对应的第一向量,包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述媒体信息进行向量化处理,得到所述媒体信息对应的第二向量,包括:

4.根据权利要求1所述的方法,其特征在于,所述获取所述媒体信息中的多模态信息对应的多模态向量,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述第一向量、所述第二向量以及所述多模态向量计算预设召回模型的损失参数,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述第一向量和所述第二向量计算第一损失函数,包括:

7.根据权...

【专利技术属性】
技术研发人员:曹鑫磊苏睿龙秦英杰
申请(专利权)人:小红书科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1