System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种模型推理方法及装置制造方法及图纸_技高网

一种模型推理方法及装置制造方法及图纸

技术编号:41090552 阅读:2 留言:0更新日期:2024-04-25 13:51
本发明专利技术实施例提供了一种模型推理方法及装置,涉及数据处理技术领域,具体方法为:周期性获取候选资源的与目标用户相关的用户侧特征,并将所述用户侧特征输入资源推荐模型;获得所述候选资源的与用户无关的资源特征,并将所述资源特征输入所述资源推荐模型;响应于接收到所述目标用户的资源推荐请求,获取所述候选资源的特征中针对所述目标用户的实时特征;将所述实时特征输入所述资源推荐模型;获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息。应用本发明专利技术实施例提供的模型推理方案,能够提高模型推理效率。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别是涉及一种模型推理方法及装置


技术介绍

1、在资源推荐过程中,服务器响应于资源推荐请求,获取候选资源的信息,并将候选资源的信息输入至资源推荐模型中,资源推荐模型基于候选资源的信息进行模型推理,输出是否推荐候选资源的参考信息,从而服务器基于各个候选资源对应的参考信息,确定待向用户推荐的资源,并向用户所使用客户端反馈所确定资源的信息。

2、为了保证向用户推荐资源的准确性,资源推荐模型所处理的信息通常为高维度、数据量大的信息,这样导致了资源推荐过程中模型推理的计算量较大,效率较低。


技术实现思路

1、本专利技术实施例的目的在于提供一种模型推理方法及装置,以提高模型推理的效率。具体技术方案如下:

2、第一方面,本专利技术实施例提供了一种模型推理方法,所述方法包括:

3、周期性获取候选资源的与目标用户相关的用户侧特征,并将所述用户侧特征输入资源推荐模型,以使得所述资源推荐模型基于所述用户侧特征进行模型推理,得到表征所述候选资源的推荐优先级的第一推理结果,缓存所述第一推理结果;

4、获得所述候选资源的与用户无关的资源特征,并将所述资源特征输入所述资源推荐模型,以使得所述资源推荐模型基于所述资源特征进行模型推理,得到表征所述候选资源的推荐优先级的第二推理结果,缓存所述第二推理结果;

5、响应于接收到所述目标用户的资源推荐请求,获取所述候选资源的特征中针对所述目标用户的实时特征;

6、将所述实时特征输入所述资源推荐模型,以使得所述资源推荐模型基于所述实时特征进行模型推理,得到表征所述候选资源的推荐优先级的第三推理结果;

7、获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息,其中,所述成功获得的推理结果包括:所述第一推理结果和第三推理结果中已成功获得的推理结果以及所述第二推理结果。

8、本专利技术的一个实施例中,所述获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息,包括:

9、获得所述资源推荐模型基于已成功获得的各个推理结果进行加和处理得到的、是否推荐所述候选资源的参考信息。

10、本专利技术的一个实施例中,所述资源推荐模型按照以下方式进行模型推理:

11、根据模型的输入特征对应的权重系数,对输入特征中各特征维度的特征值进行加权求和,得到推理结果。

12、本专利技术的一个实施例中,所述根据模型的输入特征对应的权重系数,对输入特征中各特征维度的特征值进行加权求和,得到推理结果,包括:

13、在输入特征为所述用户侧特征的情况下,对所述用户侧特征进行时效性划分,得到属于预设的各个时效类型的子特征;

14、针对每一时效类型,根据该时效类型对应的子权重系数,对该时效类型的子特征的特征值进行加权求和,得到子推理结果;

15、将各个时效类型对应的子推理结果进行加和处理,得到所述第一推理结果。

16、本专利技术的一个实施例中,所述时效类型包括历史特征类型、近线特征类型以及实时特征类型,所述历史特征类型对应的特征时效性低于所述近线特征类型对应的特征时效性,所述近线特征类型对应的特征时效性低于所述实时特征类型对应的特征时效性。

17、本专利技术的一个实施例中,所述周期性获取候选资源的与目标用户相关的用户侧特征,包括:

18、在所述目标用户为活跃用户的情况下,周期性获取候选资源的与所述目标用户相关的用户侧特征。

19、本专利技术的一个实施例中,所述资源推荐模型包括数据计算层、数据缓存层以及在线推理层;

20、所述将所述用户侧特征输入资源推荐模型,包括:

21、将所述用户侧特征输入所述数据计算层;

22、所述资源推荐模型基于所述用户侧特征进行模型推理,得到表征所述候选资源的推荐优先级的第一推理结果,缓存所述第一推理结果,包括:

23、所述数据计算层基于所述用户侧特征进行模型推理,得到表征所述候选资源的推荐优先级的第一推理结果,并将所述第一推理结果存储至所述数据缓存层;

24、所述将所述资源特征输入所述资源推荐模型,包括:

25、将所述资源特征输入所述数据计算层;

26、所述资源推荐模型基于所述资源特征进行模型推理,得到表征所述候选资源的推荐优先级的第二推理结果,缓存所述第二推理结果,包括:

27、所述数据计算层基于所述资源特征进行模型推理,得到表征所述候选资源的推荐优先级的第二推理结果,并将所述第二推理结果存储至所述数据缓存层;

28、所述将所述实时特征输入所述资源推荐模型,包括:

29、将所述实时特征存储至所述数据缓存层;

30、所述资源推荐模型基于所述实时特征进行模型推理,得到表征所述候选资源的推荐优先级的第三推理结果,包括:

31、所述在线推理层从所述数据缓存层中获取所述实时特征,基于所述实时特征进行模型推理,得到表征所述候选资源的推荐优先级的第三推理结果;

32、所述获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息,包括:

33、获得所述在线推理层基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息。

34、第二方面,本专利技术实施例提供了一种模型推理装置,所述装置包括:

35、第一获取模块,用于周期性获取候选资源的与目标用户相关的用户侧特征,并将所述用户侧特征输入资源推荐模型,以使得所述资源推荐模型基于所述用户侧特征进行模型推理,得到表征所述候选资源的推荐优先级的第一推理结果,缓存所述第一推理结果;

36、第二获取模块,用于获得所述候选资源的与用户无关的资源特征,并将所述资源特征输入所述资源推荐模型,以使得所述资源推荐模型基于所述资源特征进行模型推理,得到表征所述候选资源的推荐优先级的第二推理结果,缓存所述第二推理结果;

37、第三获取模块,用于响应于接收到所述目标用户的资源推荐请求,获取所述候选资源的特征中针对所述目标用户的实时特征;

38、特征输入模块,用于将所述实时特征输入所述资源推荐模型,以使得所述资源推荐模型基于所述实时特征进行模型推理,得到表征所述候选资源的推荐优先级的第三推理结果;

39、信息获得模块,用于获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息,其中,所述成功获得的推理结果包括:所述第一推理结果和第三推理结果中已成功获得的推理结果以及所述第二推理结果。

40、本专利技术的一个实施例中,所述信息获得模块,具体用于:

41、获得所述资源推荐模型基于已成功获得的各个推理结果进行加和处理得到的、是否推荐所述候选资源的参考信息。

42、本专利技术的一个实施例中,所述资源推荐模型按照以下方式进行模型推理:

本文档来自技高网...

【技术保护点】

1.一种模型推理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述资源推荐模型按照以下方式进行模型推理:

4.根据权利要求3所述的方法,其特征在于,所述根据模型的输入特征对应的权重系数,对输入特征中各特征维度的特征值进行加权求和,得到推理结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述时效类型包括历史特征类型、近线特征类型以及实时特征类型,所述历史特征类型对应的特征时效性低于所述近线特征类型对应的特征时效性,所述近线特征类型对应的特征时效性低于所述实时特征类型对应的特征时效性。

6.根据权利要求1或2所述的方法,其特征在于,所述周期性获取候选资源的与目标用户相关的用户侧特征,包括:

7.根据权利要求1所述的方法,其特征在于,所述资源推荐模型包括数据计算层、数据缓存层以及在线推理层;

8.一种模型推理装置,其特征在于,所述装置包括:

9.根据权利要求8所述的装置,其特征在于,所述信息获得模块,具体用于:

10.根据权利要求8或9所述的装置,其特征在于,所述资源推荐模型按照以下方式进行模型推理:

11.根据权利要求10所述的装置,其特征在于,所述根据模型的输入特征对应的权重系数,对输入特征中各特征维度的特征值进行加权求和,得到推理结果,包括:

12.根据权利要求11所述的装置,其特征在于,所述时效类型包括历史特征类型、近线特征类型以及实时特征类型,所述历史特征类型对应的特征时效性低于所述近线特征类型对应的特征时效性,所述近线特征类型对应的特征时效性低于所述实时特征类型对应的特征时效性。

13.根据权利要求8或9所述的装置,其特征在于,所述第一获取模块,具体用于:

14.根据权利要求8所述的装置,其特征在于,所述资源推荐模型包括数据计算层、数据缓存层以及在线推理层;

15.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。

...

【技术特征摘要】

1.一种模型推理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获得所述资源推荐模型基于成功获得的推理结果输出的、是否推荐所述候选资源的参考信息,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述资源推荐模型按照以下方式进行模型推理:

4.根据权利要求3所述的方法,其特征在于,所述根据模型的输入特征对应的权重系数,对输入特征中各特征维度的特征值进行加权求和,得到推理结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述时效类型包括历史特征类型、近线特征类型以及实时特征类型,所述历史特征类型对应的特征时效性低于所述近线特征类型对应的特征时效性,所述近线特征类型对应的特征时效性低于所述实时特征类型对应的特征时效性。

6.根据权利要求1或2所述的方法,其特征在于,所述周期性获取候选资源的与目标用户相关的用户侧特征,包括:

7.根据权利要求1所述的方法,其特征在于,所述资源推荐模型包括数据计算层、数据缓存层以及在线推理层;

8.一种模型推理装置,其特征在于,所述装置包括:

9.根据权利要求8所述的装置,其特征在于,所述...

【专利技术属性】
技术研发人员:魏菱延李剑戈吴华普刘菲
申请(专利权)人:中信建投证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1