一种用户画像的生成方法及移动终端技术

技术编号:22166838 阅读:28 留言:0更新日期:2019-09-21 10:33
本发明专利技术实施例提出一种用户画像的生成方法及移动终端。所述方法包括:基于目标用户输入的数据,生成所述目标用户的输入习惯数据;基于所述目标用户的输入习惯数据与候选用户的输入习惯数据的比较结果,从所述候选用户中确定所述目标用户的相似用户;基于所述相似用户的用户画像,生成所述目标用户的用户画像。本发明专利技术实施例降低生成目标用户的用户画像的计算量,并且不依赖于目标用户的全景数据即可生成目标用户的用户画像。

A User Portrait Generation Method and Mobile Terminal

【技术实现步骤摘要】
一种用户画像的生成方法及移动终端
本专利技术实施例涉及数据分析
,尤其涉及一种用户画像(UserProfile)的生成方法及移动终端。
技术介绍
用户画像在各领域得到了广泛的应用。作为实际用户的虚拟代表,用户画像最初在电商领域得到应用。在大数据时代背景下,用户信息充斥在网络中。将用户的具体信息抽象成标签,利用这些标签将用户形象具体化为用户画像,可以为用户提供针对性的服务。在中国专利公开号CN106874266A中,公开了一种生成用户画像的方法和装置。在该公开披露中,获取欲画像用户的全景数据,根据欲画像用户的全景数据和构建的标签库对欲画像用户进行多维度描述,从而使用户画像结果更为精准。然而,这种基于用户全景数据直接生成用户画像的方式导致显著的计算量。而且,很多时候难以获取用户的全景数据(比如,用户没有登录终端帐号),导致无法生成用户画像。
技术实现思路
有鉴于此,本专利技术实施方式提出一种用户画像的生成方法及移动终端,从而降低生成用户画像的计算量。本专利技术实施方式的技术方案如下:根据本专利技术实施例的一方面,提出一种用户画像的生成方法,应用于移动终端,包括:基于目标用户输入的数据,生成所述目标用户的输入习惯数据;基于所述目标用户的输入习惯数据与候选用户的输入习惯数据的比较结果,从所述候选用户中确定所述目标用户的相似用户;基于所述相似用户的用户画像,生成所述目标用户的用户画像。根据本专利技术实施例的另一方面,提出一种移动终端,包括:输入习惯生成模块,用于基于目标用户输入的数据,生成所述目标用户的输入习惯数据;相似用户确定模块,用于基于所述目标用户的输入习惯数据与候选用户的输入习惯数据的比较结果,从所述候选用户中确定所述目标用户的相似用户;用户画像生成模块,用于基于所述相似用户的用户画像,生成所述目标用户的用户画像。根据本专利技术实施例的另一方面,提出一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上任一项所述的用户画像的生成方法的步骤。根据本专利技术实施例的另一方面,提出一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的用户画像的生成方法的步骤。在本专利技术实施方式中,考虑到输入习惯能够反映用户的年龄、地域、爱好等重要个人特征,确定出与目标用户具有类似输入习惯的相似用户,再借鉴相似用户的用户画像生成目标用户的用户画像,无需基于目标用户的全景数据直接生成目标用户的用户画像,从而显著降低了生成目标用户的用户画像的计算量,并且不依赖于目标用户的全景数据即可生成用户画像。附图说明图1为根据本专利技术实施例用户画像的生成方法的流程图。图2为根据本专利技术实施例为未登录终端帐号的用户生成用户画像的第一示范性流程图。图3为根据本专利技术实施例为未登录终端帐号的用户生成用户画像的第二示范性流程图。图4为根据本专利技术实施例确定相似用户的示意图。图5为根据本专利技术实施例移动终端的结构图。图6为根据本专利技术实施例的移动终端的结构图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步的详细描述。为了描述上的简洁和直观,下文通过描述若干代表性的实施例来对本专利技术的方案进行阐述。实施例中大量的细节仅用于帮助理解本专利技术的方案。但是很明显,本专利技术的技术方案实现时可以不局限于这些细节。为了避免不必要地模糊了本专利技术的方案,一些实施例没有进行细致地描述,而是仅给出了框架。下文中,“包括”是指“包括但不限于”,“根据……”是指“至少根据……,但不限于仅根据……”。由于汉语的语言习惯,下文中没有特别指出一个成分的数量时,意味着该成分可以是一个也可以是多个,或可理解为至少一个。申请人发现:现有技术中基于用户全景数据直接生成用户画像的方式具有计算量大的缺点。特别是,在计算资源有限的移动终端中,基于用户全景数据直接生成用户画像的方式的缺点尤其突出。而且,申请人还发现:很多原因可能导致无法获取用户的全景数据(比如,用户没有登录终端帐号或不具有采集用户数据的权限,等等),此时无法生成用户画像。为克服上述技术问题,申请人突破现有技术中基于用户全景数据直接生成用户画像的思维定势,并不直接利用用户全景数据生成用户画像。相反,申请人考虑到输入习惯能够反映用户的年龄、地域、爱好等重要个人特征,首先确定出与需要生成用户画像的目标用户具有类似输入习惯的相似用户,再借鉴相似用户的用户画像生成目标用户的用户画像,可以显著降低计算量,并且不依赖于目标用户的全景数据即可生成目标用户的用户画像。图1为根据本专利技术实施例生成用户画像的方法的流程图,该方法适用于移动终端。如图1所示,该方法包括:步骤101:基于目标用户输入的数据,生成目标用户的输入习惯数据。在这里,目标用户为需要生成用户画像的用户。目标用户输入的数据为目标用户使用终端设备过程中的输入数据,比如为目标用户使用移动终端输入法过程中的输入数据,或目标用户使用移动终端时以语音方式输入的数据,等等。优选的,移动终端输入法可以为移动终端的操作系统自带的输入法,还可以是第三方开发的输入法。比如,输入法可以包括:全拼输入法、双拼输入法、微软拼音输入法、智能ABC输入法、郑码输入法、内码输入法、表形码输入法、五笔输入法、仓颉输入法、自然码输入法、紫光输入法、笔画输入法,等等。目标用户输入的数据可以为预定时间段内的数据,比如一个星期之内、三个月之内或使用移动终端全部时间内的数据。在一个实施方式中,步骤101中基于目标用户输入的数据,生成目标用户的输入习惯数据,包括:确定包含M个维度的向量模型;从所述目标用户输入的数据中提取对应于每个维度的统计数据;将每个维度的统计数据分别赋值到所述向量模型中,其中M为大于等于1的正整数。经上述赋值后的M维向量模型,即为表征目标用户的输入习惯数据的向量。优选的,向量模型的维度包括下列中的至少一个:高频词汇及使用频率;表情符号的分类及使用频率;形容词的分类及使用频率;成语或诗词的分类及使用频率;专业词汇的分类及使用频率,等等。以上示范性描述了目标用户输入的数据和生成目标用户的输入习惯数据的典型示例,本领域技术人员可以意识到,这种描述仅是示范性的,并不用于限定本专利技术实施方式的保护范围。举例,可以通过表1所示的五个维度,根据目标用户输入的数据建立目标用户的输入习惯数据。表1具体地,生成目标用户的输入习惯数据的过程包括:首先,确定出包含表1所示的5个维度的向量模型。然后,从目标用户输入的数据中提取对应于表1所示五个维度的统计数据,包括:从目标用户输入的数据中提取出关于高频词汇及使用频率的统计数据(比如,确定出哪些词汇是高频词汇以及高频词汇的使用频率)、关于表情符号的分类及使用频率的统计数据(比如,与天气相关的表情符号、与心情相关的表情符号、与动植物相关的表情符号以及各分类表情符号的使用频率)、关于形容词的分类及使用频率的统计数据(比如,与外貌相关的形容词、与心情相关的形容词以及各分类形容词的使用频率)、关于成语或诗词的分类及使用频率的统计数据(比如,四字成语分类、五字成语分类、唐诗分类、宋词分类以及各分类成语或诗词的使用频率)、关于专业词汇的分类及使用频率的统计数据(比如,医学词本文档来自技高网...

【技术保护点】
1.一种用户画像的生成方法,应用于移动终端,其特征在于,包括:基于目标用户输入的数据,生成所述目标用户的输入习惯数据;基于所述目标用户的输入习惯数据与候选用户的输入习惯数据的比较结果,从所述候选用户中确定所述目标用户的相似用户;基于所述相似用户的用户画像,生成所述目标用户的用户画像。

【技术特征摘要】
1.一种用户画像的生成方法,应用于移动终端,其特征在于,包括:基于目标用户输入的数据,生成所述目标用户的输入习惯数据;基于所述目标用户的输入习惯数据与候选用户的输入习惯数据的比较结果,从所述候选用户中确定所述目标用户的相似用户;基于所述相似用户的用户画像,生成所述目标用户的用户画像。2.根据权利要求1所述的用户画像的生成方法,其特征在于,所述基于目标用户输入的数据,生成所述目标用户的输入习惯数据,包括:确定包含M个维度的向量模型;从所述目标用户输入的数据中提取对应于每个维度的统计数据;将每个维度的统计数据分别赋值到所述向量模型中,其中M为大于等于1的正整数。3.根据权利要求2所述的用户画像的生成方法,其特征在于,所述基于目标用户的输入习惯数据与候选用户的输入习惯数据的比较结果,从所述候选用户中确定所述目标用户的相似用户,包括:分别计算每个候选用户的M维向量与所述目标用户的M维向量之间的向量距离;对所述向量距离排序;基于所述向量距离的排序结果,从所述候选用户中确定所述目标用户的相似用户。4.根据权利要求3所述的用户画像的生成方法,其特征在于,所述基于所述向量距离的排序结果,从所述候选用户中确定所述目标用户的相似用户,包括:按照从小到大的顺序排列所述向量距离,取前面N个向量距离对应的N个候选用户为所述目标用户的N个相似用户,其中N为大于等于1的正整数;所述基于所述相似用户的用户画像,生成所述目标用户的用户画像,包括:当N为1时,将所述相似用户的用户画像,确定为所述目标用户的用户画像;或当N为大于等于2的正整数时,计算所述N个相似用户的用户画像的加权结果,将所述加权结果确定为所述目标用户的用户画像。5.根据权利要求2所述的用户画像的生成方法,其特征在于,所述基于所述目标用户的输入习惯数据与候选用户的输入习惯数据的比较结果,从所述候选用户中确定所述目标用户的相似用户,包括:将所述目标用户与所述候选用户聚类;分别计算所述目标用户对应的簇中的每个候选用户的M维向量与所述目标用户的M维向量之间的向量距离;对所述向量距离排序;基于所述向量距离的排序结果,从所述目标用户对应的簇中的候选用户中确定所述目标用户的相似用户。6.根据权利要求5所述的用户画像的生成方法,其特征在于,所述基于所述向量距离的排序结果,从所述目标用户对应的簇中的候选用户中确定所述目标用户的相似用户,包括:按照从小到大的顺序排列所述向量距离,取前面N个向量距离对应的N个候选用户为所述目标用户的N个相似用户,其中N为大于等于1的正整数;所述基于所述相似用户的用户画像,生成所述目标用户的用户画像,包括:当N为1时,将所述相似用户的用户画像,确定为所述目标用户的用户画像;或当N为大于等于2的正整数时,计算所述N个相似用户的用户画像的加权结果,将所述加权结果确定为所...

【专利技术属性】
技术研发人员:姚昱希
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1