用户画像构建方法和装置制造方法及图纸

技术编号:15691028 阅读:98 留言:0更新日期:2017-06-24 03:54
本发明专利技术提供一种用户画像构建方法和装置。本发明专利技术提供的用户画像构建方法,包括:获取用户在社交平台上发布的网络信息,所述网络信息包括用户的注册信息和第一预设时长内用户发布的网络内容;根据所述注册信息,确定所述用户的人口属性信息;根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签;根据所述人口属性信息和所述用户的兴趣标签,生成所述用户的用户画像。本发明专利技术提供的用户画像构建方法和装置,解决了现有技术中的用户画像构建方法所构建出的用户画像不能充分体现用户的特征,从而使得平台无法充分的了解用户,进而无法为用户提供精细化的服务,用户体验度不高的问题。

User portrait building method and device

The invention provides a user portrait building method and device. The construction method, the user image provided by the invention comprises: acquiring user posted on social networking platform of network information, network content of the network information including user registration information and the first preset time posted by users; according to the registration information, determine the population attribute information of the user; according to the network content and multiple tags thesaurus preset, determining the user's interest in the label; according to the demographic information and the user interest in the label, the user generated user portrait. The present invention provides user portrait construction method and device to solve the characteristics of user portrait in the prior art construction methods to create user portrait can not fully reflect the user, so that the platform can not fully understand the users to provide fine service for the user, the user experience is not high problem.

【技术实现步骤摘要】
用户画像构建方法和装置
本专利技术涉及数据处理技术,尤其涉及一种用户画像构建方法和装置。
技术介绍
随着网络和信息技术的不断发展,各类社交平台应用而生,为改善社交平台的各项功能,以使社交平台更好地为用户服务,需要了解、分析社交平台内用户的各项信息。目前,常通过构建用户画像的方式来了解用户的属性信息。其中,用户画像是真实用户的虚拟代表,其能够展示用户的属性信息。现有的用户画像构建方法,包括:获取用户的人口属性信息;根据用户的人口属性信息生成用户画像。其中,用户的人口属性信息包括用户的姓名、性别、地域、职业等。通过现有的用户画像构建方法所构建出的用户画像仅展示用户的人口属性信息,不能充分体现用户的特征,从而使得平台无法为用户提供精细化的服务,用户体验度不高。
技术实现思路
本专利技术提供一种用户画像构建方法和装置,以解决现有技术中的用户画像构建方法所构建出的用户画像不能充分体现用户的特征,从而使得平台无法充分的了解用户,进而无法为用户提供精细化的服务,用户体验度不高的问题。本专利技术第一方面提供一种用户画像构建方法,包括:获取用户在社交平台上发布的网络信息,所述网络信息包括用户的注册信息和第一预设时长内用户发布的网络内容,所述用户的注册信息用于表征所述用户的基本属性;根据所述注册信息,确定所述用户的人口属性信息;根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签;其中,不同的标签词库表征不同的兴趣类别;根据所述人口属性信息和所述用户的兴趣标签,生成所述用户的用户画像。进一步地,所述根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签,具体包括:对所述网络内容进行分词处理,得到所述网络内容对应的至少一个切分词;确定每个所述切分词在每个标签词库中出现的次数;根据每个所述切分词在每个标签词库中出现的次数,确定所述用户的兴趣标签。进一步地,所述根据每个所述切分词在每个标签词库中出现的次数,确定所述用户的兴趣标签,具体包括:根据所有切分词在同一个标签词库中的出现次数之和,确定所述用户的兴趣标签为所述出现次数之和最大的标签词库对应的标签。进一步地,所述根据每个所述切分词在每个标签词库中出现的次数,确定所述用户的兴趣标签,具体包括:根据每个所述切分词在每个标签词库中出现的次数、切分词的个数以及每个所述切分词的预设权重,确定所述网络内容与每个所述标签词库的匹配度;根据所述网络内容与每个所述标签词库的匹配度,确定所述用户的兴趣标签。进一步地,所述切分词包括直接切分词和所述直接切分词的同义词,所述直接切分词为所述网络内容中的原词。进一步地,所述网络信息还包括所述网络内容的转发信息,所述转发信息包括转发对象,所述方法还包括,根据所述网络内容的转发信息,确定所述用户的好友信息;将所述好友信息添加到所述用户的用户画像上。进一步地,在本专利技术一种可能的实现方式中,所述方法还包括:根据所述用户在第二预设时长内发布的网络内容的数量和第一预设阈值,确定所述用户在所述第二预设时长内的活跃度信息;所述第一预设阈值为所述第二预设时长内样本用户发布的网络内容的平均数量;将所述活跃度信息添加到所述用户画像上。进一步地,所述网络信息还包括所述用户的活跃度信息,所述方法还包括:根据所述活跃度信息、所述用户的活跃等级信息和第二预设阈值,确定所述用户的影响力信息;所述第二预设阈值为样本用户的活跃等级信息的平均值;将所述影响力信息添加到所述用户画像上。进一步地,在本专利技术一种可能的实现方式中,所述方法还包括:根据所述网络内容、预设的热点词、预设的热点词的个数和每个所述热点词的预设权重,确定用户的敏感度信息;将所述敏感度信息添加到所述用户画像上。本专利技术第二方面提供一种用户画像构建装置,包括:获取模块和处理模块,其中,所述获取模块,用于获取用户在社交平台上发布的网络信息,所述网络信息包括用户的注册信息和第一预设时长内用户发布的网络内容,所述用户的注册信息用于表征所述用户的基本属性;所述处理模块,用于根据所述注册信息,确定所述用户的人口属性信息,并根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签,以及根据所述人口属性信息和所述用户的兴趣标签,生成所述用户的用户画像;其中,不同的标签词库表征不同的兴趣类别。进一步地,所述处理模块,具体用于对所述网络内容进行分词处理,得到所述网络内容对应的至少一个切分词;确定每个所述切分词在每个标签词库中出现的次数;并根据每个所述切分词在每个标签词库中出现的次数,确定所述用户的兴趣标签。进一步地,所述处理模块,还具体用于根据所有切分词在同一个标签词库中的出现次数之和,确定所述用户的兴趣标签为所述出现次数之和最大的标签词库对应的标签。进一步地,所述处理模块,还具体用于根据每个所述切分词在每个标签词库中出现的次数、切分词的个数以及每个所述切分词的预设权重,确定所述网络内容与每个所述标签词库的匹配度,并根据所述网络内容与每个所述标签词库的匹配度,确定所述用户的兴趣标签。进一步地,在本专利技术一种可能的实现方式中,所述网络信息还包括所述网络内容的转发信息,所述转发信息包括转发对象,所述处理模块,还具体用于根据所述网络内容的转发信息,确定所述用户的好友信息,并将所述好友信息添加到所述用户的用户画像上。进一步地,所述处理模块,还具体用于根据所述用户在第二预设时长内发布的网络内容的数量和第一预设阈值,确定所述用户在所述第二预设时长内的活跃度信息,并将所述活跃度信息添加到所述用户画像上;其中,所述第一预设阈值为所述第二预设时长内样本用户发布的网络内容的平均数量。进一步地,在本专利技术一种可能的实现方式中,所述网络信息还包括所述用户的活跃等级信息,所述处理模块,还具体用于根据所述活跃度信息、所述用户的活跃等级信息和第二预设阈值,确定所述用户的影响力信息,并将所述影响力信息添加到所述用户画像上;其中,所述第二预设阈值为样本用户的活跃等级信息的平均值。进一步地,所述处理模块200,还具体用于根据所述网络内容、预设的热点词、预设的热点词的个数和每个所述热点词的预设权重,确定用户的敏感度信息,并将所述敏感度信息添加到所述用户画像上。本专利技术提供的用户画像构建方法和装置,通过获取用户在社交平台上发布的网络信息,其中,所述网络信息包括用户的注册信息和第一预设时长内用户发布的网络内容,所述用户的注册信息用于表征所述用户的基本属性,进而根据所述注册信息,确定所述用户的人口属性信息,并根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签;其中,不同的标签词库表征不同的兴趣类别,从而根据所述人口属性信息和所述用户的兴趣标签,生成所述用户的用户画像。这样,使得构建的用户画像不仅能够反映用户的人口属性信息,还能够反映用户的兴趣,从而使得平台能够充分了解用户,进而为用户提供更精细化的服务。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例一提供的用户画像构建方法的流程图;图2为本专利技术实施例二提供的用户画像构建方法的流程图;图3为本文档来自技高网...
用户画像构建方法和装置

【技术保护点】
一种用户画像构建方法,其特征在于,包括:获取用户在社交平台上发布的网络信息,所述网络信息包括用户的注册信息和第一预设时长内用户发布的网络内容,所述用户的注册信息用于表征所述用户的基本属性;根据所述注册信息,确定所述用户的人口属性信息;根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签;其中,不同的标签词库表征不同的兴趣类别;根据所述人口属性信息和所述用户的兴趣标签,生成所述用户的用户画像。

【技术特征摘要】
1.一种用户画像构建方法,其特征在于,包括:获取用户在社交平台上发布的网络信息,所述网络信息包括用户的注册信息和第一预设时长内用户发布的网络内容,所述用户的注册信息用于表征所述用户的基本属性;根据所述注册信息,确定所述用户的人口属性信息;根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签;其中,不同的标签词库表征不同的兴趣类别;根据所述人口属性信息和所述用户的兴趣标签,生成所述用户的用户画像。2.根据权利要求1所述的方法,其特征在于,所述根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签,具体包括:对所述网络内容进行分词处理,得到所述网络内容对应的至少一个切分词;确定每个所述切分词在每个标签词库中出现的次数;根据每个所述切分词在每个标签词库中出现的次数,确定所述用户的兴趣标签。3.根据权利要求2所述的方法,其特征在于,所述根据每个所述切分词在每个标签词库中出现的次数,确定所述用户的兴趣标签,具体包括:根据所有切分词在同一个标签词库中的出现次数之和,确定所述用户的兴趣标签为所述出现次数之和最大的标签词库对应的标签。4.根据权利要求2所述的方法,其特征在于,所述根据每个所述切分词在每个标签词库中出现的次数,确定所述用户的兴趣标签,具体包括:根据每个所述切分词在每个标签词库中出现的次数、切分词的个数以及每个所述切分词的预设权重,确定所述网络内容与每个所述标签词库的匹配度;根据所述网络内容与每个所述标签词库的匹配度,确定所述用户的兴趣标签。5.根据权利要求3或4所述的方法,其特征在于,所述切分词包括直接切分词和所述直接切分词的同义词,所述直接切分词为所述网络内容中的原词。6.根据权利要求...

【专利技术属性】
技术研发人员:李建欣李俊李晨彭浩张日崇
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1