用户画像生成方法、装置、设备及介质制造方法及图纸

技术编号:27125777 阅读:14 留言:0更新日期:2021-01-25 19:45
本申请涉及人工智能技术领域,揭示了一种用户画像生成方法、装置、设备及介质,其中方法包括:获取目标用户的状态特征时间序列及购买行为时间序列,购买行为时间序列携带有目标用户购买产品的产品标识;从预设的模型库中查找与产品标识对应的行为预测模型,其中,行为预测模型是基于马尔科夫决策过程及最大似然逆强化学习得到的模型;将状态特征时间序列及购买行为时间序列输入到与产品标识对应的行为预测模型进行概率预测得到目标用户的行为预测数据;根据行为预测数据,确定目标用户的画像。在人生阶段、人生状态、消费场景发生变化时充分挖掘用户行为,提高用户画像的准确性,提高用户画像颗粒度的精细度。高用户画像颗粒度的精细度。高用户画像颗粒度的精细度。

【技术实现步骤摘要】
用户画像生成方法、装置、设备及介质


[0001]本申请涉及到人工智能
,特别是涉及到一种用户画像生成方法、装置、设备及介质。

技术介绍

[0002]用户画像是用户角色的数字化抽象,是分析挖掘用户行为的模型,构建精准的用户画像,可以帮助企业拓展新兴产品的销售,通过了解用户所处环境、所需产品进行针对性的销售。传统用户画像模型采用羊群模型或人像模型,只能对用户在单一场景下进行分析,不能跟随用户的人生阶段、人生状态、消费场景等改变;现有用户画像描述内容缺乏个性化,用户画像颗粒度较粗,难以满足多个营销场景的需要,难以满足多种角色化要求,难以追踪用户行为培养长期客户。在上述诸多困难的情况下,用户画像帮助业务进行精准营销所得到的提升有局限,既不能实时满足营销端业务人员的需要,也不能高颗粒度地区分不同类型用户的特征差异及需求差异。

技术实现思路

[0003]本申请的主要目的为提供一种用户画像生成方法、装置、设备及介质,旨在解决现有技术用户画像帮助业务进行精准营销所得到的提升有局限、不能实时满足营销端业务人员的需要、不能高颗粒度地区分不同类型用户的特征差异及需求差异的技术问题。
[0004]为了实现上述专利技术目的,本申请提出一种用户画像生成方法,所述方法包括:
[0005]获取目标用户的状态特征时间序列及购买行为时间序列,所述购买行为时间序列携带有所述目标用户购买产品的产品标识;
[0006]从预设的模型库中查找与所述产品标识对应的行为预测模型,其中,所述行为预测模型是基于马尔科夫决策过程及最大似然逆强化学习得到的模型;
[0007]将所述状态特征时间序列及所述购买行为时间序列输入到所述与所述产品标识对应的行为预测模型进行概率预测得到所述目标用户的行为预测数据;根据所述行为预测数据,确定所述目标用户的画像。
[0008]进一步的,所述从预设的模型库中查找与所述产品标识对应的行为预测模型的步骤之前,还包括:
[0009]获取多个典型用户的样本数据,其中,所述样本数据携带有所述典型用户购买产品的产品标识;
[0010]基于马尔可夫决策过程确定所述样本数据的效用函数集合;
[0011]对所述效用函数集合进行最大似然逆强化学习得到所述行为预测模型,所述行为预测模型携带有所述产品标识。
[0012]进一步的,所述获取多个典型用户的样本数据,包括:
[0013]获取多个典型用户的历史数据,所述历史数据包括:典型用户的状态特征数据、典型用户的购买行为数据,所述典型用户的购买行为数据携带有所述典型用户购买产品的产
品标识;
[0014]对所述典型用户的状态特征数据进行时间序列构建得到所述典型用户状态特征时间序列的样本数据;
[0015]按所述产品标识对所述典型用户购买行为数据进行时间序列构建,得到所述典型用户购买行为时间序列的样本数据。
[0016]进一步的,所述样本数据包括:典型用户的状态特征时间序列和购买行为时间序列,所述典型用户的购买行为时间序列携带有所述典型用户购买产品的产品标识;所述基于马尔可夫决策过程确定所述样本数据的效用函数集合的步骤,包括:
[0017]获取由所述典型用户的状态特征时间序列和购买行为时间序列确定得到的最大价值行为计算公式;
[0018]采用动态规划方法迭代对所述最大价值行为计算公式进行优化求解,得到目标最大价值行为计算公式;
[0019]从所述目标最大价值行为计算公式中提取效用函数并将提取的多个效用函数组合为所述效用函数集合。
[0020]进一步的,所述对所述效用函数集合进行最大似然逆强化学习得到所述行为预测模型的步骤,包括:
[0021]对所述效用函数集合中的效用函数进行线性叠加,得到待估计个人效用函数;
[0022]采用softmax函数对所述待估计个人效用函数进行归一化处理,得到归一化个人效用函数;
[0023]采用最大熵逆强化学习方法对所述归一化个人效用函数进行参数估计,得到所述行为预测模型。
[0024]进一步的,所述采用最大熵逆强化学习方法对所述归一化个人效用函数进行参数估计,得到所述行为预测模型的步骤,包括:
[0025]假设存在一个潜在概率分布,在该概率分布下,产生专家轨迹,已知条件为:
[0026][0027]其中,f表示特征期望(在这里指每一种产品给客户带来的期望效用值,也就是所述待估计个人效用函数U
agent
),是专家特征期望(多种产品给客户带来的加权效用值),为每种产品被选中的概率(也就是所述待估计个人效用函数U
agent
中的w1,w2,w3,
……
w
n
),将问题转化为标准型,成为求解熵最大时的最优问题:
[0028][0029][0030]s.t.∑w=1
[0031]其中,plogp表示一个随机变量的熵;是求最大值;S.t.后面是计算
的限制条件;
[0032]通过拉格朗日乘子法:
[0033][0034]求解后,对概率w进行微分计算,得到最大熵概率为:
[0035][0036]其中,exp()高等数学里以自然常数e为底的指数函数;参数λ
j
对应着拉格朗日乘子,该参数可以利用最大似然法求解;f
j
指每j种产品给客户带来的期望效用值。
[0037]进一步的,所述根据所述行为预测数据,确定所述目标用户的画像的步骤,包括:
[0038]将所述行为预测数据与预设阈值进行对比,并将对比的结果作为预测结果;
[0039]将与产品标识对应的预测结果组合成向量作为所述目标用户的画像。
[0040]本申请还提出了一种用户画像生成装置,所述装置包括:
[0041]数据获取模块,用于获取目标用户的状态特征时间序列及购买行为时间序列,所述购买行为时间序列携带有所述目标用户购买产品的产品标识;
[0042]模型获取模块,用于从预设的模型库中查找与所述产品标识对应的行为预测模型,其中,所述行为预测模型是基于马尔科夫决策过程及最大似然逆强化学习得到的模型;
[0043]预测模块,用于将所述状态特征时间序列及所述购买行为时间序列输入到所述与所述产品标识对应的行为预测模型进行概率预测得到所述目标用户的行为预测数据;
[0044]画像模块,用于根据所述行为预测数据,确定所述目标用户的画像。
[0045]本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
[0046]本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
[0047]本申请的用户画像生成方法、装置、设备及介质,通过获取目标用户的状态特征时间序列及购买行为时间序列,实现了对用户的人生阶段、人本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户画像生成方法,其特征在于,所述方法包括:获取目标用户的状态特征时间序列及购买行为时间序列,所述购买行为时间序列携带有所述目标用户购买产品的产品标识;从预设的模型库中查找与所述产品标识对应的行为预测模型,其中,所述行为预测模型是基于马尔科夫决策过程及最大似然逆强化学习得到的模型;将所述状态特征时间序列及所述购买行为时间序列输入到所述与所述产品标识对应的行为预测模型进行概率预测得到所述目标用户的行为预测数据;根据所述行为预测数据,确定所述目标用户的画像。2.根据权利要求1所述的用户画像生成方法,其特征在于,所述从预设的模型库中查找与所述产品标识对应的行为预测模型的步骤之前,还包括:获取多个典型用户的样本数据,其中,所述样本数据携带有所述典型用户购买产品的产品标识;基于马尔可夫决策过程确定所述样本数据的效用函数集合;对所述效用函数集合进行最大似然逆强化学习得到所述行为预测模型,所述行为预测模型携带有所述产品标识。3.根据权利要求2所述的用户画像生成方法,其特征在于,所述获取多个典型用户的样本数据,包括:获取多个典型用户的历史数据,所述历史数据包括:典型用户的状态特征数据、典型用户的购买行为数据,所述典型用户的购买行为数据携带有所述典型用户购买产品的产品标识;对所述典型用户的状态特征数据进行时间序列构建得到所述典型用户状态特征时间序列的样本数据;按所述产品标识对所述典型用户购买行为数据进行时间序列构建,得到所述典型用户购买行为时间序列的样本数据。4.根据权利要求2所述的用户画像生成方法,其特征在于,所述样本数据包括:典型用户的状态特征时间序列和购买行为时间序列,所述典型用户的购买行为时间序列携带有所述典型用户购买产品的产品标识;所述基于马尔可夫决策过程确定所述样本数据的效用函数集合的步骤,包括:获取由所述典型用户的状态特征时间序列和购买行为时间序列确定得到的最大价值行为计算公式;采用动态规划方法迭代对所述最大价值行为计算公式进行优化求解,得到目标最大价值行为计算公式;从所述目标最大价值行为计算公式中提取效用函数并将提取的多个效用函数组合为所述效用函数集合。5.根据权利要求2所述的用户画像生成方法,其特征在于,所述对所述效用函数集合进行最大似然逆强化学习得到所述行为预测模型的步骤,包括:对所述效用函数集合中的效用函数进行线性叠加,得到待估计个人效用函数;采用softmax函数对所述待估计个人效用函数进行归一化处理,得到归一化个人效用函数;
采用最大熵逆强化学习方法对所述归一化个人效用函数进行参数估计,得到...

【专利技术属性】
技术研发人员:夏婧吴振宇王建明
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1