【技术实现步骤摘要】
对用户进行人群划分、训练多任务模型的方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及对用户进行人群划分、训练多任务模型的方法和装置。
技术介绍
当前,为了提升业务目标,常常涉及到针对用户的业务目标的预测,例如,在向用户推荐物品时,针对用户对于推荐物品的点击率的预测。现有技术中,在进行上述预测时,未对用户进行人群划分,预测中不能体现不同人群的不同偏好,从而预测结果不够准确。因此,需要提供一种对用户进行人群划分的方法,以实现不同人群的良好的区分效果;以及,提供一种基于划分的人群进行模型训练的方法,以提升模型的预测准确率。
技术实现思路
本说明书一个或多个实施例描述了一种对用户进行人群划分、训练多任务模型的方法和装置,能够实现不同人群的良好的区分效果,以及,提升模型的预测准确率。第一方面,提供了一种对用户进行人群划分的方法,方法包括:获取用户总集,其中用户的多个特征变量各自的可能取值构成特征值集合;构建关系网络图,其中的单个节点对应于所述特征值集合中的一个特征值;连接 ...
【技术保护点】
1.一种对用户进行人群划分的方法,所述方法包括:/n获取用户总集,其中用户的多个特征变量各自的可能取值构成特征值集合;/n构建关系网络图,其中的单个节点对应于所述特征值集合中的一个特征值;连接两个节点的连接边具有边属性值,所述边属性值根据所述用户总集中,同时具有所述两个节点分别表示的两个特征值的用户数量而确定;/n通过图嵌入的方式,得到所述关系网络图中各节点分别对应的节点嵌入向量;/n根据各节点嵌入向量之间的相似性,从所述特征值集合中选择出若干特征值子集;/n将所述若干特征值子集分别作为对所述用户总集的筛选条件,从所述用户总集中选择出多个用户子集。/n
【技术特征摘要】
1.一种对用户进行人群划分的方法,所述方法包括:
获取用户总集,其中用户的多个特征变量各自的可能取值构成特征值集合;
构建关系网络图,其中的单个节点对应于所述特征值集合中的一个特征值;连接两个节点的连接边具有边属性值,所述边属性值根据所述用户总集中,同时具有所述两个节点分别表示的两个特征值的用户数量而确定;
通过图嵌入的方式,得到所述关系网络图中各节点分别对应的节点嵌入向量;
根据各节点嵌入向量之间的相似性,从所述特征值集合中选择出若干特征值子集;
将所述若干特征值子集分别作为对所述用户总集的筛选条件,从所述用户总集中选择出多个用户子集。
2.如权利要求1所述的方法,其中,所述边属性值根据所述用户总集中,同时具有所述两个节点分别表示的两个特征值的用户数量而确定,包括:
确定所述用户总集中,同时具有所述两个节点分别表示的两个特征值的用户数量;
确定所述用户数量和所述用户总集所包含的用户总数量的比值;
对所述比值进行归一化后作为所述边属性值。
3.如权利要求1所述的方法,其中,所述根据各节点嵌入向量之间的相似性,从所述特征值集合中选择出若干特征值子集,包括:
计算任意两个节点嵌入向量间的余弦相似度;
将各余弦相似度构造成核矩阵,针对该核矩阵,采用行列式点过程确定所述特征值集合的各备选子集的选择概率;
基于各备选子集的选择概率,从所述各备选子集中选择出所述若干特征值子集。
4.如权利要求1所述的方法,其中,所述多个特征变量包括如下至少一项:
性别、学历、收入、居住地。
5.一种训练多任务模型的方法,所述方法基于权利要求1所述的方法选择出的多个用户子集进行模型训练,所述方法包括:
根据多个样本用户分别对应于所述多个用户子集中的第一用户子集,差异化训练多任务模型;其中,所述多任务模型中的每个任务针对所述多个用户子集中的一个用户子集,各任务用于针对相同的业务目标进行预测。
6.如权利要求5所述的方法,其中,所述业务目标包括用户对于推荐物品的点击率。
7.如权利要求5所述的方法,其中,所述多个用户子集的数目为n个;所述多任务模型为多门混合专家模型,所述多门混合专家模型包括与各用户子集一一对应的n个门控网络、各用户子集共用的m个专家网络和与各用户子集一一对应的n个预测网络;
所述根据多个样本用户分别对应于所述多个用户子集中的第一用户子集,差异化训练多任务模型,包括:
将第一样本用户输入第一用户子集对应的门控网络,通过该门控网络输出分别对应于所述m个专家网络的各第一权重;所述第一样本用户为所述多个样本用户中的任一样本用户;
将所述第一样本用户输入所述m个专家网络,通过所述m个专家网络分别输出各第一预测打分;
通过所述第一用户子集对应的预测网络,利用所述各第一权重对所述各第一预测打分进行加权处理后,得到第二预测打分;
利用所述第二预测打分与所述第一样本用户对应的标准打分的差异,调整所述m个专家网络、所述第一用户子集对应的门控网络、所述第一用户子集对应的预测网络的参数。
8.一种利用多任务模型针对目标用户进行预测的方法,所述方法基于权利要求5所述的方法训练后的多任务模型进行预测,所述方法包括:
根据所述筛选条件,确定所述目标用户对应于所述多个用户子集中的第二用户子集;
将所述目标用户作为所述多任务模型中的目标任务的输入,通过所述目标任务输出针对所述目标用户的预测结果;所述目标任务为所述第二用户子集对应的任务。
9.如权利要求8所述的方法,其中,所述多个用户子集的数目为n个;所述多任务模型为多门混合专家模型,所述多门混合专家模型包括与各用户子集一一对应的n个门控网络、各用户子集共用的m个专家网络和与各用户子集一一对应的n个预测网络;
所述将所述目标用户作为所述多任务模型中的目标任务的输入,通过所述目标任务输出针对所述目标用户的预测结果,包括:
将所述目标用户输入所述第二用户子集对应的门控网络,通过该门控网络输出分别对应于所述m个专家网络的各第二权重;
将所述目标用户输入所述m个专家网络,通过所述m个专家网络分别输出各第三预测打分;
通过所述第二用户子集对应的预测网络,利用所述各第二权重对所述各第三预测打分进行加权处理后,得到第四预测打分,所述第四预测打分作为针对所述目标用户的预测结果。
10.一种将样本总集划分为多个样本子集的方法,所述方法包括:
获取样本总集,其中样本的多个特征变量各自的可能取值构成特征值集合;
构建关系网络图,其中的单个节点对应于所述特征值集合中的一个特征值;连接两个节点的连接边具有边属性值,所述边属性值根据所述样本总集中,同时具有所述两个节点分别表示的两个特征值的样本数量而确定;
通过图嵌入的方式,得到所述关系网络图中各节点分别对应的节点嵌入向量;
根据各节点嵌入向量之间的相似性,从所述特征值集合中选择出若干特征值子集;
将所述若干特征值子集分别作为对所述样本总集的筛选条件,从所述样本总集中选择出多个样本子集。
11.一种对用户进行人群划分的装置,所述装置包括:
获取单元,用于获取用户总集,其中用户的多个特征变量各自的可能取值构成特征值集合;
构建单元,用于构建关系网络图,其中的单个节点对应于所述特征值集合中的一个特征值;连接两个节点的连接边具有边属性值,所述边属性值根据所述用户总集中,同时具有所述两个节点分别表示的两个特征值的用户数量而确定;
嵌入单元,用于通过图嵌入的方式,得到所述构建单元构建...
【专利技术属性】
技术研发人员:李有儒,陈少虎,沈开明,钟文亮,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。