用户属性预测方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26305420 阅读:22 留言:0更新日期:2020-11-10 20:03
本发明专利技术公开了用户属性预测方法、装置、计算机设备及存储介质,方法包括:收集包含用户app安装列表以及用户属性的用户日志,并过滤异常日志;对用户app安装列表中基于不同用户属性的各app安装频次进行统计,计算基于不同用户属性的app安装频次的差值,获取差值超过预设阈值的app并作为分类app,依据所述分类app构建稀疏矩阵,得到特征数据;利用所述特征数据对分类模型进行训练,得到训练好的分类模型;获取目标用户的app安装列表,从中筛选出分类app,并将所述分类app送入所述分类模型进行预测,得到目标用户的属性。通过本发明专利技术,可以实现基于用户所安装的app,对用户属性进行高效率的预测,并且预测准确率高。

【技术实现步骤摘要】
用户属性预测方法、装置、计算机设备及存储介质
本专利技术涉及预测
,特别涉及用户属性预测方法、装置、计算机设备及存储介质。
技术介绍
传统移动应用程序(mobileapplication,简称mobileapp、apps),或手机应用程序、移动应用程序、手机app等,是指设计给智能手机、平板电脑和其他移动设备上运行的应用程序。随着移动互联网的发展以及智能电子设备的普及,人们随身携带的电子设备上几乎都安装上了app,这些app为人们日常的工作生活提供了极大的便利。对于不同特点的人群而言,其所偏好的app也各不相同,例如男性可能偏好新闻类、军事类、运动类的app,女性可能偏好购物类、亲子类、美妆类的app,青少年可能偏好游戏类、学习类的app,所以基于用户所安装的app实际上是可以预测用户的属性的,但现有技术还不具有这一功能,或者准确性还不够高。
技术实现思路
本专利技术的目的是提供用户属性预测方法、装置、计算机设备及存储介质,旨在解决现有用户属性预测方法准确性不足的问题。第一方面,本专利技术实施例提供一种基于app的用户属性预测方法,其中,包括:收集包含用户app安装列表以及用户属性的用户日志,并过滤异常日志;对用户app安装列表中基于不同用户属性的各app安装频次进行统计,计算基于不同用户属性的app安装频次的差值,获取差值超过预设阈值的app并作为分类app,依据所述分类app构建稀疏矩阵,得到特征数据;利用所述特征数据对分类模型进行训练,得到训练好的分类模型;获取目标用户的app安装列表,从中筛选出分类app,并将所述分类app送入所述分类模型进行预测,得到目标用户的属性。第二方面,本专利技术实施例提供一种基于app的用户属性预测装置,其中,包括:收集单元,用于收集包含用户app安装列表以及用户属性的用户日志,并过滤异常日志;特征提取单元,用于对用户app安装列表中基于不同用户属性的各app安装频次进行统计,计算基于不同用户属性的app安装频次的差值,获取差值超过预设阈值的app并作为分类app,依据所述分类app构建稀疏矩阵,得到特征数据;模型训练单元,用于利用所述特征数据对分类模型进行训练,得到训练好的分类模型;用户属性预测单元,用于获取目标用户的app安装列表,从中筛选出分类app,并将所述分类app送入所述分类模型进行预测,得到目标用户的属性。第三方面,本专利技术实施例提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述的基于app的用户属性预测方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如上所述的基于app的用户属性预测方法。本专利技术实施例提供了用户属性预测方法、装置、计算机设备及存储介质,方法包括:收集包含用户app安装列表以及用户属性的用户日志,并过滤异常日志;对用户app安装列表中基于不同用户属性的各app安装频次进行统计,计算基于不同用户属性的app安装频次的差值,获取差值超过预设阈值的app并作为分类app,依据所述分类app构建稀疏矩阵,得到特征数据;利用所述特征数据对分类模型进行训练,得到训练好的分类模型;获取目标用户的app安装列表,从中筛选出分类app,并将所述分类app送入所述分类模型进行预测,得到目标用户的属性。通过本专利技术实施例,可以实现基于用户所安装的app,对用户属性进行高效率的预测,并且预测准确率高。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种基于app的用户属性预测方法的流程示意图;图2为本专利技术实施例提供的一种基于app的用户属性预测装置的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。请参阅图1,图1为本专利技术实施例提供的一种基于app的用户属性预测方法的流程示意图,该方法包括步骤S101~S104:S101、收集包含用户app安装列表以及用户属性的用户日志,并过滤异常日志;S102、对用户app安装列表中基于不同用户属性的各app安装频次进行统计,计算基于不同用户属性的app安装频次的差值,获取差值超过预设阈值的app并作为分类app,依据所述分类app构建稀疏矩阵,得到特征数据;S103、利用所述特征数据对分类模型进行训练,得到训练好的分类模型;S104、获取目标用户的app安装列表,从中筛选出分类app,并将所述分类app送入所述分类模型进行预测,得到目标用户的属性。在所述步骤S101中,首先收集训练数据。具体的,可以收集多个用户的app安装列表信息,同时为了达到训练效果,还需要收集已确定的用户属性信息。本专利技术实施例中,所述属性可以是性别、年龄或爱好。所以本专利技术实施例可以用来根据用户所安装的app来预测用户的性别、年龄或者爱好等等,当然,还可以根据需要来预测其他属性。在一实施例中,所述步骤S101包括:收集包含用户app安装列表以及用户属性的用户日志;按区域对所述用户日志进行划分,得到不同区域的用户日志;对不同区域的用户日志进行过滤。本专利技术实施例可以通过Flume(日志收集系统)收集用户日志,然后将用户日志发送到Kafka(一种高吞吐量的分布式发布订阅消息系统),经Spark-streaming(大规模流式数据处理)落地到S3文件夹。本专利技术实施例中,还可以通过Spark计算框架,将收集到的用户日志分成不同区域,并且过滤掉不同区域的收集异常的用户日志。这样做的好处是,本专利技术实施例可以对分区进行预测本文档来自技高网...

【技术保护点】
1.一种基于app的用户属性预测方法,其特征在于,包括:/n收集包含用户app安装列表以及用户属性的用户日志,并过滤异常日志;/n对用户app安装列表中基于不同用户属性的各app安装频次进行统计,计算基于不同用户属性的app安装频次的差值,获取差值超过预设阈值的app并作为分类app,依据所述分类app构建稀疏矩阵,得到特征数据;/n利用所述特征数据对分类模型进行训练,得到训练好的分类模型;/n获取目标用户的app安装列表,从中筛选出分类app,并将所述分类app送入所述分类模型进行预测,得到目标用户的属性。/n

【技术特征摘要】
1.一种基于app的用户属性预测方法,其特征在于,包括:
收集包含用户app安装列表以及用户属性的用户日志,并过滤异常日志;
对用户app安装列表中基于不同用户属性的各app安装频次进行统计,计算基于不同用户属性的app安装频次的差值,获取差值超过预设阈值的app并作为分类app,依据所述分类app构建稀疏矩阵,得到特征数据;
利用所述特征数据对分类模型进行训练,得到训练好的分类模型;
获取目标用户的app安装列表,从中筛选出分类app,并将所述分类app送入所述分类模型进行预测,得到目标用户的属性。


2.根据权利要求1所述的基于app的用户属性预测方法,其特征在于,所述属性为性别、年龄或爱好。


3.根据权利要求1所述的基于app的用户属性预测方法,其特征在于,所述对用户app安装列表中基于不同用户属性的各app安装频率进行统计,计算基于不同用户属性的app安装频率的差值,获取差值超过预设阈值的app并作为分类app,包括:
对所有用户的app安装列表中的app进行分类统计,获取基于每一用户属性的各app安装频次;
计算基于不同用户属性的各app安装频次的差值;
获取所述差值超过预设阈值的app并作为分类app。


4.根据权利要求3所述的基于app的用户属性预测方法,其特征在于,所述获取所述差值超过预设阈值的app并作为分类app,包括:
将基于不同用户属性的各app安装频次的差值进行归一化,得到相差比例;
将所述相差比例超过预设阈值的app作为分类app。


5.根据权利要求4所述的基于app的用户属性预测方法,其特征在于,所述依据所述分类app构建稀疏矩阵,得到特征数据,包括:
根据分类app对应的相差比例计算分类app的权重,其中相差比例越高,权重越大,相差比例越低,权重越小;
依据所述分类app的权重构建稀疏矩阵,得到特征数据。

【专利技术属性】
技术研发人员:赵星林肯
申请(专利权)人:深圳墨世科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1