当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于手机App安装列表的用户画像方法技术

技术编号:23191072 阅读:76 留言:0更新日期:2020-01-24 16:19
本发明专利技术公开了一种基于手机App安装列表的用户画像方法,包括以下步骤:(1)获取欲画像用户的手机App安装列表并进行预处理;(2)对预处理后的所述手机用户的App安装列表提取关键特征,得到所述用户的特征,建立特征空间;(3)基于所述的特征空间,对用户进行表征;(4)针对所述的用户表征向量,分别进行有监督和无监督的方法,完成所述的用户画像。由此可见,本发明专利技术方法利用布尔矩阵分解方法从手机App安装列表中提取关键特征,有效地刻画用户的特性,从而完成对用户的画像。

A user portrait method based on mobile app installation list

【技术实现步骤摘要】
一种基于手机App安装列表的用户画像方法
本专利技术属于数据分析
,具体涉及一种基于手机App安装列表的用户画像方法。
技术介绍
用户画像是指对用户相关的真实数据进行统计分析,提炼代表性的信息,进而挖掘出该用户的一系列属性与特征信息(如兴趣爱好、生活习惯、社会属性、性格、价值观等)。目前,用户画像在精准广告投放、精准营销、个性化推荐、产品优化、业务经营等方面有巨大的商业价值,是面向个人用户市场的各大企业必争的战略核心技术,理解用户的属性与特征可大幅度提升广告转化率。国内外很多互联网巨头公司都是以广告为主要盈利模式,例如Facebook、Google、百度等,据统计2017年Facebook全年收益98%来自于广告。根据对用户的理解,企业可分析潜在用户,针对特定用户进行营销,服务提供商可根据用户的需求与偏好,对用户推荐和定制个性化产品与服务;企业还可根据对用户个性化信息的理解,对产品进行针对性地优化,以提升用户体验;同时,还可以制定针对性的企业发展战略,以扩大用户数目,增加企业的竞争能力。随着移动互联网的发展和数据挖掘等技术的不断进步,对用户的理解会更加深入与全面,例如心理、人格层面等,深层次的个性化信息将会被越来越重视,用户画像在未来会进一步提升服务精准度,为企业带来更多的利益。随着智能手机的迅速普及,智能手机感知数据为用户进行画像开启了一扇新的大门;作为移动互联网的主要载体,智能手机逐渐成为人们日常生活中不可或缺的一部分。现在全球约有20亿的用户使用智能手机,用户在使用手机的过程中产生了大量的跟用户相关的信息;由于智能手机通常被同一个用户使用,这些数据往往隐含了丰富的一个用户的个性化信息,智能手机为推测用户属性与特征进行用户画像提供了新的信息渠道。手机应用(App)在众多的智能手机感知数据类型中,与用户的个性化信息密切相关联。随着智能手机的迅猛发展,手机App市场爆炸式增长;其中,苹果手机的AppStore大约有200万个App,安卓手机的GooglePlay约有220万个App;应用几乎覆盖了用户日常生活中方方面面的需求,例如餐饮、外出旅游、办公、天气、日历、生活助手等。用户根据自己的需求、偏好、习惯等从应用市场上下载安装和使用应用,手机App成为用户使用手机各种服务的主要入口;手机上安装了什么应用,即手机App安装列表可在很大程度上反映用户的个人信息,如各种基本属性(例如,性别、年龄、职业等)、兴趣偏好、性格、生活方式等。因此,手机App安装列表给我们提供了一个对用户画像的便捷途径。
技术实现思路
鉴于上述,本专利技术提供了一种基于手机App安装列表的用户画像方法,能够有效地刻画用户的特性,从而完成对用户的画像。一种基于手机App安装列表的用户画像方法,包括如下步骤:(1)收集大量用户的手机App安装列表并进行预处理,以确定用户数量m以及APP数量n;(2)构建用户与APP的关联矩阵U,并对其进行布尔矩阵分解U=CB,C为用户系数矩阵且维度为m×k,B为特征矩阵且维度为k×n,k为自定义的特征数量;(3)对于待画像的用户,根据其手机App安装列表确定这些用户的App安装向量;(4)使待画像用户的App安装向量乘以B的伪逆矩阵,得到这些用户的特征向量;(5)根据特征向量通过有监督和无监督的方式分别对待画像用户进行分类和聚类,同时根据所具备的特征为每一待画像用户打上标签。进一步地,所述步骤(1)中对手机App安装列表进行预处理的方法为:首先设定相关阈值,若某一App,其安装人数小于一定阈值的话,则剔除该App及其相关信息;若某一用户,其手机App安装列表上的App数量小于一定阈值的话,则剔除该用户及其相关信息。进一步地,所述关联矩阵U的维度为m×n且每一元素值为0或1,若其中第i行第j列元素值uij=1,则表示第i个用户的手机App安装列表中存在有第j个APP,否则uij=0;i和j均为自然数且1≤i≤m,1≤j≤n。进一步地,所述步骤(2)中对关联矩阵U进行布尔矩阵分解的具体过程为:首先计算关联矩阵U中任意两列之间的相关性,形成一个m×m大小的实数矩阵R,其中每一元素值代表两个App的关联性;然后将实数矩阵R转换为布尔矩阵A,布尔矩阵A中每一个行向量作为形成特征矩阵B的候选向量;最后设计目标函数,以贪心的方式从布尔矩阵A中选择行向量来补全特征矩阵B,同时生成用户系数矩阵C的列向量,重复k次,最终得到两个矩阵B和C。进一步地,所述特征矩阵B用于描述每个特征对应有哪些APP,矩阵B中每一元素值为0或1,若其中第p行第j列元素值bpj=1,则表示第j个APP具备第p个特征,否则bpj=0;p和j均为自然数且1≤p≤k,1≤j≤n。进一步地,所述用户系数矩阵C用于描述每个用户具备哪些特征,矩阵C中每一元素值为0或1,若其中第i行第p列元素值cip=1,则表示第i个用户具备第p个特征,否则cip=0;i和p均为自然数且1≤i≤m,1≤p≤k。进一步地,所述步骤(3)中用户App安装向量的维度为1×n且每一元素值为0或1,若其中第j列元素值=1,则表示该用户的手机App安装列表中存在有第j个APP,否则第j列元素值=0,j为自然数且1≤j≤n。进一步地,所述步骤(5)中采用众包的方式获得每个特征的语义,所述特征向量的维度为k×1且每一元素值为0或1,若其中第p行元素值=1,则表示用户具备第p个特征,否则第p行元素值=0;对于待画像用户,根据其特征向量中对应元素值为1的所有特征语义为用户打上标签。由此可见,本专利技术利用布尔矩阵分解等方法从用户的手机App安装列表中提取关键特征,并有效刻画用户的特性,从而完成对用户的画像。附图说明图1为本专利技术用户画像方法的整体流程示意图。图2为本专利技术用户画像方法中布尔矩阵分解的流程示意图。图3为本专利技术基于手机用户画像的结构示意图。具体实施方式为了更为具体地描述本专利技术,下面结合附图及具体实施方式对本专利技术的技术方案进行详细说明。如图1所示,本专利技术基于手机App安装列表的用户画像方法,包括如下步骤:(1)收集大量用户的手机App安装列表并进行预处理,以确定用户数量m以及APP数量n;(2)构建用户与APP的关联矩阵U,并对其进行布尔矩阵分解U=CB,C为用户系数矩阵且维度为m×k,B为特征矩阵且维度为k×n,k为自定义的特征数量;(3)对于待画像的用户,根据其手机App安装列表确定这些用户的App安装向量;(4)使待画像用户的App安装向量乘以B的伪逆矩阵,得到这些用户的特征向量;(5)根据特征向量通过有监督和无监督的方式分别对待画像用户进行分类和聚类,同时根据所具备的特征为每一待画像用户打上标签。由此可见,本专利技术方法利用布尔矩阵分解方法从手机App安装列表中提取关键特征,有效地刻画用户的特性,从而完成对用户的画像。在具体实施过程中,本实施例针对手机用户的A本文档来自技高网
...

【技术保护点】
1.一种基于手机App安装列表的用户画像方法,包括如下步骤:/n(1)收集大量用户的手机App安装列表并进行预处理,以确定用户数量m以及APP数量n;/n(2)构建用户与APP的关联矩阵U,并对其进行布尔矩阵分解U=CB,C为用户系数矩阵且维度为m×k,B为特征矩阵且维度为k×n,k为自定义的特征数量;/n(3)对于待画像的用户,根据其手机App安装列表确定这些用户的App安装向量;/n(4)使待画像用户的App安装向量乘以B的伪逆矩阵,得到这些用户的特征向量;/n(5)根据特征向量通过有监督和无监督的方式分别对待画像用户进行分类和聚类,同时根据所具备的特征为每一待画像用户打上标签。/n

【技术特征摘要】
1.一种基于手机App安装列表的用户画像方法,包括如下步骤:
(1)收集大量用户的手机App安装列表并进行预处理,以确定用户数量m以及APP数量n;
(2)构建用户与APP的关联矩阵U,并对其进行布尔矩阵分解U=CB,C为用户系数矩阵且维度为m×k,B为特征矩阵且维度为k×n,k为自定义的特征数量;
(3)对于待画像的用户,根据其手机App安装列表确定这些用户的App安装向量;
(4)使待画像用户的App安装向量乘以B的伪逆矩阵,得到这些用户的特征向量;
(5)根据特征向量通过有监督和无监督的方式分别对待画像用户进行分类和聚类,同时根据所具备的特征为每一待画像用户打上标签。


2.根据权利要求1所述的用户画像方法,其特征在于:所述步骤(1)中对手机App安装列表进行预处理的方法为:首先设定相关阈值,若某一App,其安装人数小于一定阈值的话,则剔除该App及其相关信息;若某一用户,其手机App安装列表上的App数量小于一定阈值的话,则剔除该用户及其相关信息。


3.根据权利要求1所述的用户画像方法,其特征在于:所述关联矩阵U的维度为m×n且每一元素值为0或1,若其中第i行第j列元素值uij=1,则表示第i个用户的手机App安装列表中存在有第j个APP,否则uij=0;i和j均为自然数且1≤i≤m,1≤j≤n。


4.根据权利要求1所述的用户画像方法,其特征在于:所述步骤(2)中对关联矩阵U进行布尔矩阵分解的具体过程为:首先计算关联矩阵U中任意两列之间的相关性,形成一个m×m大小的实数矩阵R,其...

【专利技术属性】
技术研发人员:潘纲赵莎陶建容李石坚
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1