任务推荐方法及装置制造方法及图纸

技术编号：35821155 阅读：17 留言：0更新日期：2022-12-03 13:46

本说明书实施例提供任务推荐方法及装置，其中所述任务推荐方法包括：基于目标用户的用户特征数据和任务推荐数据，确定初始任务推荐策略；基于所述用户特征数据以及所述初始任务推荐策略，确定所述初始任务推荐策略的策略增益参数；基于所述策略增益参数以及所述初始任务推荐策略，获得所述初始任务推荐策略的评估结果；基于所述评估结果以及所述初始任务推荐策略，确定目标任务推荐策略，并基于所述目标任务推荐策略对所述目标用户进行任务推荐。使得在确定目标任务推荐策略的过程中，充分考虑到任务推荐策略的实际增益效率，从而准确的确定营销敏感人群，降低了营销推广的成本。降低了营销推广的成本。降低了营销推广的成本。

全部详细技术资料下载

【技术实现步骤摘要】
任务推荐方法及装置

[0001]本说明书实施例涉及计算机
，特别涉及一种任务推荐方法。

技术介绍

[0002]随着互联网技术的不断发展，许多互联网机构会通过各种营销策略对用户进行服务推广，而在现有技术中，许多机构会通过算法模型来确定营销策略，并基于该营销策略向用户进行营销活动推广。
[0003]但是，现有技术中的算法模型在确定营销策略的过程中，仅仅关注于单次营销推广的效益最大化，并没有考虑每次营销对最终结果的实际增益效果，因此，导致无法精准的确定营销敏感人群，从而增加了营销推广的成本，基于此，需要提供一种能够考虑到营销的实际增益，从而精准找到营销敏感人群的方法。

技术实现思路

[0004]有鉴于此，本说明书实施例提供了一种任务推荐方法。本说明书一个或者多个实施例同时涉及一种任务推荐装置，一种计算设备，一种计算机可读存储介质，一种计算机程序，以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面，提供了一种任务推荐方法，包括：
[0006]基于目标用户的用户特征数据和任务推荐数据，确定初始任务推荐策略；
[0007]基于所述用户特征数据以及所述初始任务推荐策略，确定所述初始任务推荐策略的策略增益参数；
[0008]基于所述策略增益参数以及所述初始任务推荐策略，获得所述初始任务推荐策略的评估结果；
[0009]基于所述评估结果以及所述初始任务推荐策略，确定目标任务推荐策略，并基于所述目标任务推荐策略对所述目标用户进行任务推荐。/>[0010]根据本说明书实施例的第二方面，提供了一种任务推荐装置，包括：
[0011]第一确定模块，被配置为基于目标用户的用户特征数据和任务推荐数据，确定初始任务推荐策略；
[0012]第二确定模块，被配置为基于所述用户特征数据以及所述初始任务推荐策略，确定所述初始任务推荐策略的策略增益参数；
[0013]获取模块，被配置为基于所述策略增益参数以及所述初始任务推荐策略，获得所述初始任务推荐策略的评估结果；
[0014]推荐模块，被配置为基于所述评估结果以及所述初始任务推荐策略，确定目标任务推荐策略，并基于所述目标任务推荐策略对所述目标用户进行任务推荐。
[0015]根据本说明书实施例的第三方面，提供了一种计算设备，包括：
[0016]存储器和处理器；
[0017]所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行
指令，该计算机可执行指令被处理器执行时实现上述任务推荐方法的步骤。
[0018]根据本说明书实施例的第四方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现所述任务推荐方法的步骤。
[0019]根据本说明书实施例的第五方面，提供了一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行权利要求所述任务推荐方法的步骤。
[0020]本说明书提供的任务推荐方法，包括：基于目标用户的用户特征数据和任务推荐数据，确定初始任务推荐策略；基于所述用户特征数据以及所述初始任务推荐策略，确定所述初始任务推荐策略的策略增益参数；基于所述策略增益参数以及所述初始任务推荐策略，获得所述初始任务推荐策略的评估结果；基于所述评估结果以及所述初始任务推荐策略，确定目标任务推荐策略，并基于所述目标任务推荐策略对所述目标用户进行任务推荐。
[0021]具体的，该方法通过目标用户的用户特征数据和任务推荐数据，确定初始任务推荐策略，并基于该初始任务推荐策略的策略增益参数和评估结果，确定目标任务推荐策略，使得在确定目标任务推荐策略的过程中，充分考虑到任务推荐策略的实际增益效率，从而准确的确定营销敏感人群，降低了营销推广的成本。
附图说明
[0022]图1是本说明书一个实施例提供的一种任务推荐方法的应用示意图；
[0023]图2是本说明书一个实施例提供的一种任务推荐方法的流程图；
[0024]图3是本说明书一个实施例提供的一种任务推荐方法中uplift模型的结构示意图；
[0025]图4是本说明书一个实施例提供的一种任务推荐方法中强化学习模型的结构示意图；
[0026]图5是本说明书一个实施例提供的一种任务推荐方法中序列营销模型的结构示意图；
[0027]图6是本说明书一个实施例提供的一种任务推荐方法的处理过程流程图；
[0028]图7是本说明书一个实施例提供的一种任务推荐装置的结构示意图；
[0029]图8是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0030]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。
[0031]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0032]应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分
开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0033]首先，对本说明书一个或多个实施例涉及的名词术语进行解释。
[0034]因果推断(Causal Inserefence)：因果推断(Causal Inference)研究如何更加科学识别变量间的因果关系，是Uplift Modeling(智能营销增益模型)的理论基础。
[0035]马尔可夫决策过程(MDP)：马尔可夫决策过程(MDP)是强化学习的基础，它对连续决策进行建模，当前的动作不仅对当前产生影响，而且还会对将来的情况产生影响，如果从奖励的角度，即MDP不仅影响即时的奖励，而且还会影响将来的长期奖励，因此，MDP需要对即时奖励与长期奖励的获得进行权衡。
[0036]约束马尔可夫决策过程(CMDP)：约束马尔可夫决策过程(Constrained MDP,CMDP)是对智能体施加了额外限制的MDP，在CMDP中，智能体不仅要实施策略和获得回报，还要确保环境状态的一些指标不超出限制。
[0037]强化学习(Reinforcement Learning，简称RL)，强化学习就是一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种任务推荐方法，包括：基于目标用户的用户特征数据和任务推荐数据，确定初始任务推荐策略；基于所述用户特征数据以及所述初始任务推荐策略，确定所述初始任务推荐策略的策略增益参数；基于所述策略增益参数以及所述初始任务推荐策略，获得所述初始任务推荐策略的评估结果；基于所述评估结果以及所述初始任务推荐策略，确定目标任务推荐策略，并基于所述目标任务推荐策略对所述目标用户进行任务推荐。2.根据权利要求1所述的任务推荐方法，所述基于目标用户的用户特征数据和任务推荐数据，确定初始任务推荐策略，包括：获取目标用户的用户特征数据，以及所述目标用户的任务推荐数据；将所述用户特征数据以及所述任务推荐数据，输入策略生成模型，获得初始任务推荐策略。3.根据权利要求2所述的任务推荐方法，所述基于所述评估结果以及所述初始任务推荐策略，确定目标任务推荐策略，包括：在所述评估结果不满足评估条件的情况下，基于所述评估结果以及所述初始任务推荐策略，对所述策略生成模型进行更新；直至所述策略生成模型输出的初始任务推荐策略的评估结果，满足所述评估条件，将所述初始任务推荐策略作为目标任务推荐策略。4.根据权利要求1所述的任务推荐方法，所述基于所述用户特征数据以及所述初始任务推荐策略，确定所述初始任务推荐策略的策略增益参数，包括：将所述用户特征数据以及所述初始任务推荐策略输入增益预测模型，获得所述初始任务推荐策略的策略增益参数。5.根据权利要求4所述的任务推荐方法，所述将所述用户特征数据以及所述初始任务推荐策略输入增益预测模型，获得所述初始任务推荐策略的策略增益参数，包括：将所述用户特征数据以及所述初始任务推荐策略输入增益预测模型，获得第一增益参数以及第二增益参数；基于所述第一增益参数以及所述第二增益参数，获得所述初始任务推荐策略的策略增益参数。6.根据权利要求5所述的任务推荐方法，所述将所述用户特征数据以及所述初始任务推荐策略输入增益预测模型，获得第一增益参数以及第二增益参数，包括：将所述用户特征数据以及所述初始任务推荐策略，输入增益预测模型中的增益特征提取模块，获得所述用户特征数据对应的第一增益特征，以及所述初始任务推荐策略对应的第二增益特征；利用所述增益预测模型中的第一参数预测模块对所述第一增益特征进行分析，获得第一增益参数；利用所述增益预测模型中的第二参数预测模块对所述第一增益特征以及所述第二增益特征进行分析，获得第二增益参数。7.根据权利要求1所述的任务推荐方法，所述基于所述策略增益参数以及所述初始任
务推荐策略，获得所述初始任务推荐策略的评估结果，包括：将所述初始任务推荐策略输入策略评估模型，获得所述初始任务推荐策略的评估参数；基...

【专利技术属性】
技术研发人员：方亮亮，赵云安，郭晓波，韩冰，黄若木，
申请(专利权)人：浙江网商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人