The invention provides a user portrait building method and device. The construction method, the user image provided by the invention comprises: acquiring user posted on social networking platform of network information, network content of the network information including user registration information and the first preset time posted by users; according to the registration information, determine the population attribute information of the user; according to the network content and multiple tags thesaurus preset, determining the user's interest in the label; according to the demographic information and the user interest in the label, the user generated user portrait. The present invention provides user portrait construction method and device to solve the characteristics of user portrait in the prior art construction methods to create user portrait can not fully reflect the user, so that the platform can not fully understand the users to provide fine service for the user, the user experience is not high problem.
【技术实现步骤摘要】
用户画像构建方法和装置
本专利技术涉及数据处理技术,尤其涉及一种用户画像构建方法和装置。
技术介绍
随着网络和信息技术的不断发展,各类社交平台应用而生,为改善社交平台的各项功能,以使社交平台更好地为用户服务,需要了解、分析社交平台内用户的各项信息。目前,常通过构建用户画像的方式来了解用户的属性信息。其中,用户画像是真实用户的虚拟代表,其能够展示用户的属性信息。现有的用户画像构建方法,包括:获取用户的人口属性信息;根据用户的人口属性信息生成用户画像。其中,用户的人口属性信息包括用户的姓名、性别、地域、职业等。通过现有的用户画像构建方法所构建出的用户画像仅展示用户的人口属性信息,不能充分体现用户的特征,从而使得平台无法为用户提供精细化的服务,用户体验度不高。
技术实现思路
本专利技术提供一种用户画像构建方法和装置,以解决现有技术中的用户画像构建方法所构建出的用户画像不能充分体现用户的特征,从而使得平台无法充分的了解用户,进而无法为用户提供精细化的服务,用户体验度不高的问题。本专利技术第一方面提供一种用户画像构建方法,包括:获取用户在社交平台上发布的网络信息,所述网络信息包括用户的注册信息和第一预设时长内用户发布的网络内容,所述用户的注册信息用于表征所述用户的基本属性;根据所述注册信息,确定所述用户的人口属性信息;根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签;其中,不同的标签词库表征不同的兴趣类别;根据所述人口属性信息和所述用户的兴趣标签,生成所述用户的用户画像。进一步地,所述根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签,具体包括:对 ...
【技术保护点】
一种用户画像构建方法,其特征在于,包括:获取用户在社交平台上发布的网络信息,所述网络信息包括用户的注册信息和第一预设时长内用户发布的网络内容,所述用户的注册信息用于表征所述用户的基本属性;根据所述注册信息,确定所述用户的人口属性信息;根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签;其中,不同的标签词库表征不同的兴趣类别;根据所述人口属性信息和所述用户的兴趣标签,生成所述用户的用户画像。
【技术特征摘要】
1.一种用户画像构建方法,其特征在于,包括:获取用户在社交平台上发布的网络信息,所述网络信息包括用户的注册信息和第一预设时长内用户发布的网络内容,所述用户的注册信息用于表征所述用户的基本属性;根据所述注册信息,确定所述用户的人口属性信息;根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签;其中,不同的标签词库表征不同的兴趣类别;根据所述人口属性信息和所述用户的兴趣标签,生成所述用户的用户画像。2.根据权利要求1所述的方法,其特征在于,所述根据所述网络内容和预设的多个标签词库,确定所述用户的兴趣标签,具体包括:对所述网络内容进行分词处理,得到所述网络内容对应的至少一个切分词;确定每个所述切分词在每个标签词库中出现的次数;根据每个所述切分词在每个标签词库中出现的次数,确定所述用户的兴趣标签。3.根据权利要求2所述的方法,其特征在于,所述根据每个所述切分词在每个标签词库中出现的次数,确定所述用户的兴趣标签,具体包括:根据所有切分词在同一个标签词库中的出现次数之和,确定所述用户的兴趣标签为所述出现次数之和最大的标签词库对应的标签。4.根据权利要求2所述的方法,其特征在于,所述根据每个所述切分词在每个标签词库中出现的次数,确定所述用户的兴趣标签,具体包括:根据每个所述切分词在每个标签词库中出现的次数、切分词的个数以及每个所述切分词的预设权重,确定所述网络内容与每个所述标签词库的匹配度;根据所述网络内容与每个所述标签词库的匹配度,确定所述用户的兴趣标签。5.根据权利要求3或4所述的方法,其特征在于,所述切分词包括直接切分词和所述直接切分词的同义词,所述直接切分词为所述网络内容中的原词。6.根据权利要求...
【专利技术属性】
技术研发人员:李建欣,李俊,李晨,彭浩,张日崇,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。