针对推荐系统的算力优化的方法和装置制造方法及图纸

技术编号：38136470 阅读：9 留言：0更新日期：2023-07-08 09:48

本说明书实施例提供一种针对推荐系统的算力优化的方法和装置，方法包括：获取目标推荐请求；响应于目标推荐请求，确定多个节点中的全部或部分节点构成的若干候选链路；基于若干候选链路包括的各节点，对各节点的候选算力档位进行组合得到多个全局算力档位；预估分别采用多个全局算力档位执行目标推荐请求的各算力消耗；预估目标推荐请求分别在多个全局算力档位对应的各价值预估分；根据各算力消耗和各价值预估分，从多个全局算力档位中选择出目标全局算力档位，作为执行目标推荐请求的算力档位。能够在业务效果不变的情况下，降低算力消耗，且具备很高的准确性和时效性。且具备很高的准确性和时效性。且具备很高的准确性和时效性。

全部详细技术资料下载

【技术实现步骤摘要】
针对推荐系统的算力优化的方法和装置

[0001]本说明书一个或多个实施例涉及计算机领域，尤其涉及针对推荐系统的算力优化的方法和装置。

技术介绍

[0002]推荐系统常常被用于从待推荐对象的候选集中筛选出预定数目的待推荐对象。上述待推荐对象可以是商品、门店或服务等。随着候选集的规模的逐渐增大，例如，候选集的规模达到数千个或数万个，以及推荐系统所采用的算法模型的规模的逐渐增大，例如，算法模型的规模达到100GB以上，对推荐系统的算力的要求成数量级式上涨，仅凭不断增加机器预算和硬件的升级演化已经不能满足场景的诉求。算法模型的输入数据可以为数据拥有方的隐私数据，需要保护隐私数据不被泄露。
[0003]通常的算力分配方案中，推荐系统在不同的时间段，以及对于不同的推荐请求采用固定的算力。一方面，机器资源均以高峰流量评估，导致非高峰时段，系统流量较低，整体资源利用率偏低，形成了大量的冗余算力；另一方面，由于每一个推荐请求对于推荐的需求是不同的，当前对每一条推荐请求同等分配算力，造成在高需求流量上算力分配不足，低需求流量上存在浪费大量算力的现象。
[0004]算力的分配会影响能源的消耗，算力的分配已经成为国力发展、智能化、数字化发展水平的集中体现，是数字化应用建设与发展的底层基础。因此需要针对推荐系统进行算力优化，在业务效果不变的情况下，降低算力消耗，且具备很高的准确性和时效性。

技术实现思路

[0005]本说明书一个或多个实施例描述了一种针对推荐系统的算力优化的方法和装置，能够在业务效果不变的情况下...

【技术保护点】

【技术特征摘要】
1.一种针对推荐系统的算力优化的方法，所述推荐系统包括对应于多个推荐决策步骤的多个节点，任一所述节点具有其对应的多个候选算力档位，所述方法包括：获取目标推荐请求；响应于所述目标推荐请求，确定所述多个节点中的全部或部分节点构成的若干候选链路；基于所述若干候选链路包括的各节点，对各节点的候选算力档位进行组合得到多个全局算力档位；预估分别采用所述多个全局算力档位执行所述目标推荐请求的各算力消耗；预估所述目标推荐请求分别在所述多个全局算力档位对应的各价值预估分；根据各算力消耗和各价值预估分，从所述多个全局算力档位中选择出目标全局算力档位，作为执行所述目标推荐请求的算力档位。2.根据权利要求1所述的方法，其中，所述确定所述多个节点中的全部或部分节点构成的若干候选链路，包括：确定所述目标推荐请求对应的请求场景；读取预先配置的所述请求场景对应的所述若干候选链路。3.根据权利要求1所述的方法，其中，所述预估分别采用所述多个全局算力档位执行所述目标推荐请求的各算力消耗之前，所述方法还包括：获取各节点所依赖硬件设备当前的算力指标值；确定所述算力指标值属于预先设定的正常取值区间。4.根据权利要求1所述的方法，其中，所述多个全局算力档位包括第一全局档位，所述第一全局档位包括，针对第一节点的第一档位指标值；所述预估分别采用所述多个全局算力档位执行所述目标推荐请求的各算力消耗，包括：根据当前的并发请求数和所述第一档位指标值，利用第一算力量化模型，计算针对所述目标推荐请求执行第一节点的子算力消耗；根据所述第一全局档位中涉及的各个节点的子算力消耗，计算采用所述第一全局档位执行所述目标推荐请求的算力消耗。5.根据权利要求4所述的方法，其中，所述第一节点用于对待推荐对象进行排序；所述第一档位指标值为待推荐对象的数目。6.根据权利要求4所述的方法，其中，所述第一算力量化模型采用如下方式训练：通过定时异步触发批量推荐请求获得训练数据，所述训练数据包括，批量推荐请求对应的并发请求数，针对所述批量推荐请求执行第一节点时的样本档位指标值和样本算力消耗；利用所述训练数据，进行线性拟合得到所述第一算力量化模型的模型参数。7.根据权利要求1所述的方法，其中，所述预估所述目标推荐请求分别在所述多个全局算力档位对应的各价值预估分，包括：利用所述目标推荐请求对应的用户在业务平台的行为数据，预估用户当前对所述业务平台中的目标业务对象...

【专利技术属性】
技术研发人员：唐欣，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人