针对推荐系统的算力优化的方法和装置制造方法及图纸

技术编号:38136470 阅读:9 留言:0更新日期:2023-07-08 09:48
本说明书实施例提供一种针对推荐系统的算力优化的方法和装置,方法包括:获取目标推荐请求;响应于目标推荐请求,确定多个节点中的全部或部分节点构成的若干候选链路;基于若干候选链路包括的各节点,对各节点的候选算力档位进行组合得到多个全局算力档位;预估分别采用多个全局算力档位执行目标推荐请求的各算力消耗;预估目标推荐请求分别在多个全局算力档位对应的各价值预估分;根据各算力消耗和各价值预估分,从多个全局算力档位中选择出目标全局算力档位,作为执行目标推荐请求的算力档位。能够在业务效果不变的情况下,降低算力消耗,且具备很高的准确性和时效性。且具备很高的准确性和时效性。且具备很高的准确性和时效性。

【技术实现步骤摘要】
针对推荐系统的算力优化的方法和装置


[0001]本说明书一个或多个实施例涉及计算机领域,尤其涉及针对推荐系统的算力优化的方法和装置。

技术介绍

[0002]推荐系统常常被用于从待推荐对象的候选集中筛选出预定数目的待推荐对象。上述待推荐对象可以是商品、门店或服务等。随着候选集的规模的逐渐增大,例如,候选集的规模达到数千个或数万个,以及推荐系统所采用的算法模型的规模的逐渐增大,例如,算法模型的规模达到100GB以上,对推荐系统的算力的要求成数量级式上涨,仅凭不断增加机器预算和硬件的升级演化已经不能满足场景的诉求。算法模型的输入数据可以为数据拥有方的隐私数据,需要保护隐私数据不被泄露。
[0003]通常的算力分配方案中,推荐系统在不同的时间段,以及对于不同的推荐请求采用固定的算力。一方面,机器资源均以高峰流量评估,导致非高峰时段,系统流量较低,整体资源利用率偏低,形成了大量的冗余算力;另一方面,由于每一个推荐请求对于推荐的需求是不同的,当前对每一条推荐请求同等分配算力,造成在高需求流量上算力分配不足,低需求流量上存在浪费大量算力的现象。
[0004]算力的分配会影响能源的消耗,算力的分配已经成为国力发展、智能化、数字化发展水平的集中体现,是数字化应用建设与发展的底层基础。因此需要针对推荐系统进行算力优化,在业务效果不变的情况下,降低算力消耗,且具备很高的准确性和时效性。

技术实现思路

[0005]本说明书一个或多个实施例描述了一种针对推荐系统的算力优化的方法和装置,能够在业务效果不变的情况下,降低算力消耗,且具备很高的准确性和时效性。
[0006]第一方面,提供了一种针对推荐系统的算力优化的方法,所述推荐系统包括对应于多个推荐决策步骤的多个节点,任一所述节点具有其对应的多个候选算力档位,该方法包括:获取目标推荐请求;响应于所述目标推荐请求,确定所述多个节点中的全部或部分节点构成的若干候选链路;基于所述若干候选链路包括的各节点,对各节点的候选算力档位进行组合得到多个全局算力档位;预估分别采用所述多个全局算力档位执行所述目标推荐请求的各算力消耗;预估所述目标推荐请求分别在所述多个全局算力档位对应的各价值预估分;根据各算力消耗和各价值预估分,从所述多个全局算力档位中选择出目标全局算力档位,作为执行所述目标推荐请求的算力档位。
[0007]在一种可能的实施方式中,所述确定所述多个节点中的全部或部分节点构成的若
干候选链路,包括:确定所述目标推荐请求对应的请求场景;读取预先配置的所述请求场景对应的所述若干候选链路。
[0008]在一种可能的实施方式中,所述预估分别采用所述多个全局算力档位执行所述目标推荐请求的各算力消耗之前,所述方法还包括:获取各节点所依赖硬件设备当前的算力指标值;确定所述算力指标值属于预先设定的正常取值区间。
[0009]在一种可能的实施方式中,所述多个全局算力档位包括第一全局档位,所述第一全局档位包括,针对第一节点的第一档位指标值;所述预估分别采用所述多个全局算力档位执行所述目标推荐请求的各算力消耗,包括:根据当前的并发请求数和所述第一档位指标值,利用第一算力量化模型,计算针对所述目标推荐请求执行第一节点的子算力消耗;根据所述第一全局档位中涉及的各个节点的子算力消耗,计算采用所述第一全局档位执行所述目标推荐请求的算力消耗。
[0010]进一步地,所述第一节点用于对待推荐对象进行排序;所述第一档位指标值为待推荐对象的数目。
[0011]进一步地,所述第一算力量化模型采用如下方式训练:通过定时异步触发批量推荐请求获得训练数据,所述训练数据包括,批量推荐请求对应的并发请求数,针对所述批量推荐请求执行第一节点时的样本档位指标值和样本算力消耗;利用所述训练数据,进行线性拟合得到所述第一算力量化模型的模型参数。
[0012]在一种可能的实施方式中,所述预估所述目标推荐请求分别在所述多个全局算力档位对应的各价值预估分,包括:利用所述目标推荐请求对应的用户在业务平台的行为数据,预估用户当前对所述业务平台中的目标业务对象的点击率;利用所述点击率、用户针对所述目标业务对象的行为数据,以及所述目标业务对象对应于各节点的使用效率和所述多个全局算力档位,确定所述目标推荐请求分别在所述多个全局算力档位对应的各价值预估分。
[0013]在一种可能的实施方式中,所述根据各算力消耗和各价值预估分,从所述多个全局算力档位中选择出目标全局算力档位,包括:确定所述多个全局算力档位对应的多个档位分数,其中任意全局算力档位对应的档位分数正相关于其价值预估分,负相关于其算力消耗与干预系数的乘积;将档位分数最高的全局算力档位确定为所述目标算力档位。
[0014]在一种可能的实施方式中,所述推荐系统用于从第一数目的待推荐对象中确定出第二数目的待推荐对象,所述第一数目大于第二数目。
[0015]在一种可能的实施方式中,所述多个节点包括:召回节点、粗排节点、精排节点、重排节点。
[0016]在一种可能的实施方式中,所述各节点的候选算力档位,包括:对应不同候选队列长度的算力档位;和/或,
对应不同模型的算力档位。
[0017]第二方面,提供了一种针对推荐系统的算力优化的装置,所述推荐系统包括对应于多个推荐决策步骤的多个节点,任一所述节点具有其对应的多个候选算力档位,该装置包括:获取单元,用于获取目标推荐请求;确定单元,用于响应于所述获取单元获取的目标推荐请求,确定所述多个节点中的全部或部分节点构成的若干候选链路;组合单元,用于基于所述确定单元确定的若干候选链路包括的各节点,对各节点的候选算力档位进行组合得到多个全局算力档位;第一预估单元,用于预估分别采用所述组合单元得到的多个全局算力档位执行所述目标推荐请求的各算力消耗;第二预估单元,用于预估所述目标推荐请求分别在所述组合单元得到的多个全局算力档位对应的各价值预估分;选择单元,用于根据所述第一预估单元得到的各算力消耗和所述第二预估单元得到的各价值预估分,从所述组合单元得到的多个全局算力档位中选择出目标全局算力档位,作为执行所述目标推荐请求的算力档位。
[0018]第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
[0019]第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
[0020]通过本说明书实施例提供的方法和装置,推荐系统包括对应于多个推荐决策步骤的多个节点,任一所述节点具有其对应的多个候选算力档位。首先获取目标推荐请求;然后响应于所述目标推荐请求,确定所述多个节点中的全部或部分节点构成的若干候选链路;接着基于所述若干候选链路包括的各节点,对各节点的候选算力档位进行组合得到多个全局算力档位;再预估分别采用所述多个全局算力档位执行所述目标推荐请求的各算力消耗;预估所述目标推荐请求分别在所述多个全局算力档位对应的各价值预估分;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对推荐系统的算力优化的方法,所述推荐系统包括对应于多个推荐决策步骤的多个节点,任一所述节点具有其对应的多个候选算力档位,所述方法包括:获取目标推荐请求;响应于所述目标推荐请求,确定所述多个节点中的全部或部分节点构成的若干候选链路;基于所述若干候选链路包括的各节点,对各节点的候选算力档位进行组合得到多个全局算力档位;预估分别采用所述多个全局算力档位执行所述目标推荐请求的各算力消耗;预估所述目标推荐请求分别在所述多个全局算力档位对应的各价值预估分;根据各算力消耗和各价值预估分,从所述多个全局算力档位中选择出目标全局算力档位,作为执行所述目标推荐请求的算力档位。2.根据权利要求1所述的方法,其中,所述确定所述多个节点中的全部或部分节点构成的若干候选链路,包括:确定所述目标推荐请求对应的请求场景;读取预先配置的所述请求场景对应的所述若干候选链路。3.根据权利要求1所述的方法,其中,所述预估分别采用所述多个全局算力档位执行所述目标推荐请求的各算力消耗之前,所述方法还包括:获取各节点所依赖硬件设备当前的算力指标值;确定所述算力指标值属于预先设定的正常取值区间。4.根据权利要求1所述的方法,其中,所述多个全局算力档位包括第一全局档位,所述第一全局档位包括,针对第一节点的第一档位指标值;所述预估分别采用所述多个全局算力档位执行所述目标推荐请求的各算力消耗,包括:根据当前的并发请求数和所述第一档位指标值,利用第一算力量化模型,计算针对所述目标推荐请求执行第一节点的子算力消耗;根据所述第一全局档位中涉及的各个节点的子算力消耗,计算采用所述第一全局档位执行所述目标推荐请求的算力消耗。5.根据权利要求4所述的方法,其中,所述第一节点用于对待推荐对象进行排序;所述第一档位指标值为待推荐对象的数目。6.根据权利要求4所述的方法,其中,所述第一算力量化模型采用如下方式训练:通过定时异步触发批量推荐请求获得训练数据,所述训练数据包括,批量推荐请求对应的并发请求数,针对所述批量推荐请求执行第一节点时的样本档位指标值和样本算力消耗;利用所述训练数据,进行线性拟合得到所述第一算力量化模型的模型参数。7.根据权利要求1所述的方法,其中,所述预估所述目标推荐请求分别在所述多个全局算力档位对应的各价值预估分,包括:利用所述目标推荐请求对应的用户在业务平台的行为数据,预估用户当前对所述业务平台中的目标业务对象...

【专利技术属性】
技术研发人员:唐欣
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1