The invention provides a method and device for generating user portraits. The method includes: acquiring video Click behavior information of multiple video accounts, determining user representations of each video account based on video Click behavior information, clustering multiple video accounts according to preset clustering algorithm based on user representations, and acquiring historical click video corresponding to various video accounts after clustering. Frequency Title: Extract the keywords in the video titles corresponding to the historical clicks of various video accounts, select the keywords that meet the preset conditions from the extracted keywords, and generate the user portraits of the corresponding categories of video accounts according to the keywords that meet the preset conditions. The embodiment of the present invention uses user representations to cluster different video accounts, and uses the title of the video clicked by the user as the user portrait of the corresponding category of video accounts, so that when subsequent users want to watch the video, they can recommend the video more in line with the user's interests and interests based on the user's corresponding user portrait.
【技术实现步骤摘要】
一种用户画像的生成方法及装置
本专利技术涉及数据处理
,特别是涉及一种用户画像的生成方法及装置。
技术介绍
随着互联网的迅速发展,网络视频已经成为人们获取视频信息和娱乐信息的主要来源之一。并且视频数量在快速增长,各大视频网站或者客户端为了提高用户的体验效果,往往会根据视频用户的喜爱程度对用户进行相应的视频推荐。向用户推荐视频信息时采用的关键技术之一是建立用户画像,用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来。现有技术方案虽然可以满足视频类型有单一喜好的用户需求,但随着用户对观看视频的需求更为多样,无法实在推荐到用户真正喜好的视频内容,不能满足用户复杂的视频需求,用户往往可能浪费更多时间在浏览和观看自己并不感兴趣的视频内容,降低了用户的使用体验,进而必将影响视频应用或网站的推广。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的用户画像的生成方法及装置。依据本专利技术的一方面,提供了一种用户画像的生成方法,包括:获取多个视频账户的视频点击行为信息,依据所述视频点击行为信息确定各视频账户的用户表示,所述用户表示用于标识视频账户行为特征;基于所述用户表示按照预设聚类算法对所述多个视频账户进行聚类,获取聚类后各类视频账户的历史点击视频对应的视频标题;提取各类视频账户的历史点击视频对应的视频标题中的关键词,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条 ...
【技术保护点】
1.一种用户画像的生成方法,包括:获取多个视频账户的视频点击行为信息,依据所述视频点击行为信息确定各视频账户的用户表示,所述用户表示用于标识视频账户行为特征;基于所述用户表示按照预设聚类算法对所述多个视频账户进行聚类,获取聚类后各类视频账户的历史点击视频对应的视频标题;提取各类视频账户的历史点击视频对应的视频标题中的关键词,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条件的关键词生成相应类别视频账户的用户画像。
【技术特征摘要】
1.一种用户画像的生成方法,包括:获取多个视频账户的视频点击行为信息,依据所述视频点击行为信息确定各视频账户的用户表示,所述用户表示用于标识视频账户行为特征;基于所述用户表示按照预设聚类算法对所述多个视频账户进行聚类,获取聚类后各类视频账户的历史点击视频对应的视频标题;提取各类视频账户的历史点击视频对应的视频标题中的关键词,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条件的关键词生成相应类别视频账户的用户画像。2.根据权利要求1所述的方法,其中,所述视频点击行为信息包括:视频账户所属用户点击过的视频对应的标题。3.根据权利要求2所述的方法,其中,获取多个视频账户的视频点击行为信息,包括:收集多个视频账户的历史视频数据,从收集到历史视频数据中解析出视频标题;获取解析到的视频标题并将其作为所述多个视频账户的视频点击行为信息。4.根据权利要求3所述的方法,其中,依据所述视频点击行为信息确定各视频账户的用户表示,包括:将所述多个视频账户对应的视频标题进行分词处理,得到多个词语单元;统计各视频账户对应的词语单元出现的频率,将出现频率大于指定频率阈值的词语单元作为相应视频账户的用户表示。5.根据权利要求1-4任一项所述的方法,其中,提取各类视频账户的历史点击视频对应的视频标题中的关键词,包括:将各类视频账户的历史点击视频对应的视频标题进行分词操作,得到多个词语单元;从所述分词操作得到的多个词语单元中提取出与视频特征有关的多个关键词。6.根据权利要求5所述的方法,其中,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条件的...
【专利技术属性】
技术研发人员:罗玄,黄君实,陈强,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。