用户行为画像的构建方法、装置、设备及存储介质制造方法及图纸

技术编号:26173796 阅读:29 留言:0更新日期:2020-10-31 13:58
本申请涉及一种用户行为画像的构建方法、装置、设备及存储介质,所述方法包括:构建用户行为画像模型;生成用户行为特征向量和生成行为对象特征向量;计算分组判别结果与设定分组的分组误差,和,将用户行为特征向量和行为对象特征向量重构生成行为矩阵,并计算重构生成的行为矩阵为用户行为矩阵的生成概率;根据最小化模型方法,优化用户行为画像模型,更新用户行为画像模型参数;用户行为画像模型构建成功,向构建成功的用户行为画像模型输入用户行为数据,获得与用户行为数据对应的用户行为画像。用以解决现有的用户行为画像模型构建时更专注于用户的共性,难以获取具有个性化且可区分性的用户行为画像的问题。

【技术实现步骤摘要】
用户行为画像的构建方法、装置、设备及存储介质
本申请涉及计算机
,尤其涉及一种用户行为画像的构建方法、装置、设备及存储介质。
技术介绍
用户行为画像作为建立于一系列真实的用户行为数据之上的目标用户模型,已经成功应用于互联网企业与各大公司的商品推荐、好友发现等传统的商业应用。目前,在异常用户发现、商品精准推广、用户个性化服务等新背景中,用户画像的个性化特征发挥着重大的作用。目前构建用户行为画像进行用户行为描述的方式主要有两类方法:基于数据统计的方法和基于智能学习模型的方法。基于数据统计的方法主要是依赖于常用的统计方法获取原始数据的统计特征,并直接用其构建用户的行为画像;基于智能学习模型的方法主要是根据行为数据的特性和用户行为之间的共性构建对应的端到端的学习算法,直接通过用户数据学习用户的行为画像。当前的基于统计的用户行为画像仅能表示用户行为的统计信息,如果用户的用户行为画像存在其他关联时难以有效的判别该用户的差异特征和该用户准确的分组。此外,目前基于智能学习模型的方法构建的用户行为画像更专注于用户行为的表征和用户行为之间的共性,无法有效的量化用户之间的差异性。
技术实现思路
本申请提供了一种用户行为画像的构建方法、装置、设备及存储介质,用以解决现有的用户行为画像模型构建时更专注于用户的共性,难以获取具有个性化且可区分性的用户行为画像的问题。第一方面,本申请提供了一种用户行为画像的构建方法,包括:构建用户行为画像模型,其中,所述用户行为画像模型包括:用户行为特征生成模块和行为对象特征生成模块,所述用户行为特征生成模块包括用户行为分组变量参数和用户行为分布变量参数,所述行为对象特征生成模块包括行为对象分组变量参数和行为对象分布变量参数;对所述用户行为分组变量参数和所述用户行为分布变量参数初始化处理,获得用户行为分组分布参数,对所述行为对象分组变量参数和所述行为对象分布变量参数初始化处理,获得行为对象分组分布参数;由所述用户行为特征生成模块根据所述用户行为分组分布参数生成用户行为特征向量,由所述行为对象特征生成模块根据所述行为对象分组分布参数生成行为对象特征向量;对生成的所述用户行为特征向量进行分组设定,获得设定分组,并计算分组判别结果与所述设定分组的分组误差,和,将所述用户行为特征向量和所述行为对象特征向量重构生成行为矩阵,并计算所述重构生成的所述行为矩阵为用户行为矩阵的生成概率,其中,所述分组判别结果为:给所述用户行为画像模型添加分组权重变量后获得的分组,所述用户行为矩阵通过用户行为数据构建得到;根据最小化模型方法,优化所述用户行为画像模型,更新所述用户行为画像模型的所述用户行为分组变量参数、所述用户行为分布变量参、所述行为对象分组变量参数和所述行为对象分布变量参数;当更新后的所述用户行为画像模型的所述分组误差和所述生成概率之和小于预设阈值时,所述用户行为画像模型构建成功,向构建成功的所述用户行为画像模型输入所述用户行为数据,获得与所述用户行为数据对应的用户行为画像。可选地构建用户行为画像模型之前,还包括:获取所述用户的用户行为数据;提取所述用户行为数据的关键字段,构建用户行为记录,其中,所述关键字段包括:唯一标识、行为对象和发生时间;遍历所述用户行为记录,滤除所述关键字段缺失的所述用户行为记录,并根据滤除后的所述用户行为记录的所述关键字段构建所述用户行为矩阵;根据所述关键字段,统计用户行为的发生频次,并采用所述发生频次更新所述用户行为矩阵中对应的频度值。可选地,对所述用户行为分组变量参数和所述用户行为分布变量参数初始化处理,获得用户行为分组分布参数之后,还包括:给所述用户行为画像模型添加所述分组权重变量,所述分组权重变量用于减小所述分组判别结果与所述设定分组的所述分组误差;对添加所述分组权重变量后的用户行为画像模型进行初始化处理,通过所述用户行为特征生成模块获得所述用户行为特征向量;根据所述获得的用户行为特征向量,获得所述用户行为特征向量对应的分组判别结果。可选地,由所述用户行为特征生成模块根据所述用户行为分组分布参数生成用户行为特征向量,包括:由所述用户行为特征生成模块根据所述用户行为分组变量参数生成所述用户行为特征向量的分组划分概率;选择所述分组划分概率大于预设概率值的分组划分概率所对应的组别;根据所述组别,生成所述组别对应的用户行为特征向量。可选地,计算分组判别结果与所述设定分组的分组误差,包括:通过基于概率的分类算法,对所述分组判别结果对应的第二标签和所述设定分组对应的第一标签进行比较计算;根据比较结果,确定所述分组判别结果与所述设定分组的分组误差;其中,所述第一标签为所述设定分组中的用户行为特征,所述第二标签为所述分组判别结果中的用户行为特征。可选地,计算所述分组判别结果与所述设定分组的分组误差之后,还包括:获得分组误差计算结果;当所述分组误差计算结果小于预设误差值时,不调整所述分组权重变量;当所述分组误差计算结果不小于预设误差值时,调整所述分组权重变量,并在调整所述分组权重变量后,获得调整后的所述用户行为特征向量。可选地,向构建成功的所述用户行为画像模型输入所述用户行为数据,获得与所述用户行为数据对应的用户行为画像之后,还包括:通过构建成功的所述用户行为画像模型获得待识别用户的用户行为画像;将所述获得的待识别用户的用户行为画像在画像库中进行距离判别;当距离判别结果小于预设距离值时,判定所述待识别用户认证成功。第二方面,本申请提供了一种用户行为画像的构建装置,包括:构建单元,用于构建用户行为画像模型,其中,所述用户行为画像模型包括:用户行为特征生成模块和行为对象特征生成模块,所述用户行为特征生成模块包括用户行为分组变量参数和用户行为分布变量参数,所述行为对象特征生成模块包括行为对象分组变量参数和行为对象分布变量参数;获得单元,用于对所述用户行为分组变量参数和所述用户行为分布变量参数初始化处理,获得用户行为分组分布参数,对所述行为对象分组变量参数和所述行为对象分布变量参数初始化处理,获得行为对象分组分布参数;生成单元,用于由所述用户行为特征生成模块根据所述用户行为分组分布参数生成用户行为特征向量,由所述行为对象特征生成模块根据所述行为对象分组分布参数生成行为对象特征向量;判别单元,用于对生成的所述用户行为特征向量进行分组设定,获得设定分组,并计算分组判别结果与所述设定分组的分组误差,和,将所述用户行为特征向量和所述行为对象特征向量重构生成行为矩阵,并计算所述重构生成的行为矩阵为用户行为矩阵的生成概率,其中,所述分组判别结果为:给所述用户行为画像模型添加分组权重变量后获得的分组,所述用户行为矩阵通过用户行为数据构建得到;更新单元,用于根据最小化模型方法,优化所述用户行为画像模型,更新所述用户行为画像模型的所述用户本文档来自技高网...

【技术保护点】
1.一种用户行为画像的构建方法,其特征在于,所述方法包括:/n构建用户行为画像模型,其中,所述用户行为画像模型包括:用户行为特征生成模块和行为对象特征生成模块,所述用户行为特征生成模块包括用户行为分组变量参数和用户行为分布变量参数,所述行为对象特征生成模块包括行为对象分组变量参数和行为对象分布变量参数;/n对所述用户行为分组变量参数和所述用户行为分布变量参数初始化处理,获得用户行为分组分布参数,对所述行为对象分组变量参数和所述行为对象分布变量参数初始化处理,获得行为对象分组分布参数;/n由所述用户行为特征生成模块根据所述用户行为分组分布参数生成用户行为特征向量,由所述行为对象特征生成模块根据所述行为对象分组分布参数生成行为对象特征向量;/n对生成的所述用户行为特征向量进行分组设定,获得设定分组,并计算分组判别结果与所述设定分组的分组误差,和,将所述用户行为特征向量和所述行为对象特征向量重构生成行为矩阵,并计算所述重构生成的所述行为矩阵为用户行为矩阵的生成概率,其中,所述分组判别结果为:给所述用户行为画像模型添加分组权重变量后获得的分组,所述用户行为矩阵通过用户行为数据构建得到;/n根据最小化模型方法,优化所述用户行为画像模型,更新所述用户行为画像模型的所述用户行为分组变量参数、所述用户行为分布变量参、所述行为对象分组变量参数和所述行为对象分布变量参数;/n当更新后的所述用户行为画像模型的所述分组误差和所述生成概率之和小于预设阈值时,所述用户行为画像模型构建成功,向构建成功的所述用户行为画像模型输入所述用户行为数据,获得与所述用户行为数据对应的用户行为画像。/n...

【技术特征摘要】
1.一种用户行为画像的构建方法,其特征在于,所述方法包括:
构建用户行为画像模型,其中,所述用户行为画像模型包括:用户行为特征生成模块和行为对象特征生成模块,所述用户行为特征生成模块包括用户行为分组变量参数和用户行为分布变量参数,所述行为对象特征生成模块包括行为对象分组变量参数和行为对象分布变量参数;
对所述用户行为分组变量参数和所述用户行为分布变量参数初始化处理,获得用户行为分组分布参数,对所述行为对象分组变量参数和所述行为对象分布变量参数初始化处理,获得行为对象分组分布参数;
由所述用户行为特征生成模块根据所述用户行为分组分布参数生成用户行为特征向量,由所述行为对象特征生成模块根据所述行为对象分组分布参数生成行为对象特征向量;
对生成的所述用户行为特征向量进行分组设定,获得设定分组,并计算分组判别结果与所述设定分组的分组误差,和,将所述用户行为特征向量和所述行为对象特征向量重构生成行为矩阵,并计算所述重构生成的所述行为矩阵为用户行为矩阵的生成概率,其中,所述分组判别结果为:给所述用户行为画像模型添加分组权重变量后获得的分组,所述用户行为矩阵通过用户行为数据构建得到;
根据最小化模型方法,优化所述用户行为画像模型,更新所述用户行为画像模型的所述用户行为分组变量参数、所述用户行为分布变量参、所述行为对象分组变量参数和所述行为对象分布变量参数;
当更新后的所述用户行为画像模型的所述分组误差和所述生成概率之和小于预设阈值时,所述用户行为画像模型构建成功,向构建成功的所述用户行为画像模型输入所述用户行为数据,获得与所述用户行为数据对应的用户行为画像。


2.根据权利要求1所述的用户行为画像的构建方法,其特征在于,构建用户行为画像模型之前,还包括:
获取所述用户的用户行为数据;
提取所述用户行为数据的关键字段,构建用户行为记录,其中,所述关键字段包括:唯一标识、行为对象和发生时间;
遍历所述用户行为记录,滤除所述关键字段缺失的所述用户行为记录,并根据滤除后的所述用户行为记录的所述关键字段构建所述用户行为矩阵;
根据所述关键字段,统计用户行为的发生频次,并采用所述发生频次更新所述用户行为矩阵中对应的频度值。


3.根据权利要求2所述的用户行为画像的构建方法,其特征在于,对所述用户行为分组变量参数和所述用户行为分布变量参数初始化处理,获得用户行为分组分布参数之后,还包括:
给所述用户行为画像模型添加所述分组权重变量,所述分组权重变量用于减小所述分组判别结果与所述设定分组的所述分组误差;
对添加所述分组权重变量后的用户行为画像模型进行初始化处理,通过所述用户行为特征生成模块获得所述用户行为特征向量;
根据所述获得的用户行为特征向量,获得所述用户行为特征向量对应的分组判别结果。


4.根据权利要求1所述的用户行为画像的构建方法,其特征在于,由所述用户行为特征生成模块根据所述用户行为分组分布参数生成用户行为特征向量,包括:
由所述用户行为特征生成模块根据所述用户行为分组变量参数生成所述用户行为特征向量的分组划分概率;
选择所述分组划分概率大于预设概率值的分组划分概率所对应的组别;
根据所述组别,生成所述组别对应的用户行为特征向量。


5.根据权利要求4所述的用户行为画像的构建方法,其特征在于,计算分组判别结果与所述设定分组的分组误差,包括:
通过基于概率的分类算法,对所述分组判...

【专利技术属性】
技术研发人员:刘婧钟盛海肖崇蕙王丽宏闫昊马莉雅郭舒黄洪仁王士承黑一鸣
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1