【技术实现步骤摘要】
【国外来华专利技术】智能激励分配注意版权所有,DiDiResearchAmerica,LLC2018。此专利文件的部分公开内容包含受版权保护的材料。版权所有者不反对任何人以专利商标局专利文件或记录中出现的方式对专利文件或专利公开进行传真复制,但在其他方面保留所有版权。相关申请本公开要求2018年4月4日提交的,题为“智能激励分配”的美国非临时申请No.15/944,905的优先权,其全部内容通过引用合并于此。
本公开大体上涉及确定激励分配。
技术介绍
人可以有动机地基于激励采取特定的行动。基于静态因素确定激励分配的计算技术可能会导致激励分配不佳。期望一种智能且自适应的工具,以从技术上改善激励分配的确定。
技术实现思路
本公开的一个方面针对确定激励分配的方法。该方法可以包括:获取实体的特征信息,所述特征信息表征单独实体的特征;基于所述特征信息,确定向所述单独实体提供与不同成本相关联的单独激励的预期收益;基于所述预期收益和所述单独激励的成本,确定向所述单独实体提供单独激励的收益率;以及基于所述收益 ...
【技术保护点】
1.一种确定激励分配的系统,所述系统包括:/n一个或多个处理器;以及/n存储指令的存储器,当指令由一个或多个处理器执行时,使所述系统执行:/n获取实体的特征信息,所述特征信息表征单独实体的特征;/n基于所述特征信息和deep-Q网络,确定向所述单独实体提供与不同成本相关联的单独激励的预期收益;/n基于所述预期收益和所述单独激励的成本,确定向所述单独实体提供所述单独激励的收益率;以及/n基于所述收益率和一段时间内的预算,确定向所述实体中的一个或多个提供的一组激励,其中确定所述一组激励包括:/n为所述单独实体确定具有最高收益率的激励;以及/n按收益率从高到低的顺序选择具有最高收 ...
【技术特征摘要】
【国外来华专利技术】20180404 US 15/944,9051.一种确定激励分配的系统,所述系统包括:
一个或多个处理器;以及
存储指令的存储器,当指令由一个或多个处理器执行时,使所述系统执行:
获取实体的特征信息,所述特征信息表征单独实体的特征;
基于所述特征信息和deep-Q网络,确定向所述单独实体提供与不同成本相关联的单独激励的预期收益;
基于所述预期收益和所述单独激励的成本,确定向所述单独实体提供所述单独激励的收益率;以及
基于所述收益率和一段时间内的预算,确定向所述实体中的一个或多个提供的一组激励,其中确定所述一组激励包括:
为所述单独实体确定具有最高收益率的激励;以及
按收益率从高到低的顺序选择具有最高收益率的激励,直到所选激励的成本总和达到所述预算。
2.一种确定激励分配的系统,所述系统包括:
一个或多个处理器;以及
存储指令的存储器,当指令由一个或多个处理器执行时,使所述系统执行:
获取实体的特征信息,所述特征信息表征单独实体的特征;
基于所述特征信息,确定向所述单独实体提供与不同成本相关联的单独激励的预期收益;
基于所述预期收益和所述单独激励的成本,确定向所述单独实体提供所述单独激励的收益率;以及
基于所述收益率确定向所述实体中的一个或多个提供的一组激励。
3.根据权利要求2所述的系统,所述一组激励还基于一段时间内的预算确定。
4.根据权利要求3所述的系统,其中,基于一段时间内的预算确定所述一组激励,包括:
为所述单独实体确定最高收益率的激励;以及
按收益率从高到低的顺序选择具有最高收益率的激励,直到所选激励的成本总和达到所述预算。
5.根据权利要求2所述的系统,其中,所述预期收益基于deep-Q网络确定。
6.根据权利要求5所述的系统,其中,所述deep-Q网络利用所述实体的历史信息进行训练,所述历史信息表征一段时间内所述实体的活动。
7.根据权利要求6所述的系统,其中,所述deep-Q网络基于所述实体的历史信息进行训练基于:
在重放存储器中存储至少一部分历史信息;
对存储在所述重放存储器中的信息的第一数据集进行采样;以及
利用经过采样的第一数据集训练所述deep-Q网络。
8.根据权利要求7所述的系统,其中,所述deep-Q网络利用所述实体的变迁信息进行更新,所述变迁信息表征向所述实体中的一个或多个提供所述一组激励后,所述实体的活动。
9.根据权利要求8所述的系统,其中,所述deep-Q网络利用所述实体的变迁信息进行更新基于:
在重放存储器中存储至少部分变迁信息,其使得存储在所述重放存储器中的至少部分历...
【专利技术属性】
技术研发人员:李卿阳,秦志伟,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。