一种用户画像的生成方法及装置制造方法及图纸

技术编号:20919675 阅读:28 留言:0更新日期:2019-04-20 10:21
本发明专利技术提供了一种用户画像的生成方法及装置,该方法包括:获取多个视频账户的视频点击行为信息,依据视频点击行为信息确定各视频账户的用户表示;基于用户表示按照预设聚类算法对多个视频账户进行聚类,获取聚类后各类视频账户的历史点击视频对应的视频标题;提取各类视频账户的历史点击视频对应的视频标题中的关键词,从提取的关键词中选取符合预设条件的关键词,依据符合预设条件的关键词生成相应类别视频账户的用户画像。本发明专利技术实施例利用用户表示对不同的视频账户进行聚类,且依据用户点击过的视频的标题作为相应类别视频账户的用户画像,以在后续用户想要观看视频时,可以基于用户对应的用户画像来为其推荐更加符合用户兴趣爱好的视频。

A Method and Device for Generating User Portraits

The invention provides a method and device for generating user portraits. The method includes: acquiring video Click behavior information of multiple video accounts, determining user representations of each video account based on video Click behavior information, clustering multiple video accounts according to preset clustering algorithm based on user representations, and acquiring historical click video corresponding to various video accounts after clustering. Frequency Title: Extract the keywords in the video titles corresponding to the historical clicks of various video accounts, select the keywords that meet the preset conditions from the extracted keywords, and generate the user portraits of the corresponding categories of video accounts according to the keywords that meet the preset conditions. The embodiment of the present invention uses user representations to cluster different video accounts, and uses the title of the video clicked by the user as the user portrait of the corresponding category of video accounts, so that when subsequent users want to watch the video, they can recommend the video more in line with the user's interests and interests based on the user's corresponding user portrait.

【技术实现步骤摘要】
一种用户画像的生成方法及装置
本专利技术涉及数据处理
,特别是涉及一种用户画像的生成方法及装置。
技术介绍
随着互联网的迅速发展,网络视频已经成为人们获取视频信息和娱乐信息的主要来源之一。并且视频数量在快速增长,各大视频网站或者客户端为了提高用户的体验效果,往往会根据视频用户的喜爱程度对用户进行相应的视频推荐。向用户推荐视频信息时采用的关键技术之一是建立用户画像,用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来。现有技术方案虽然可以满足视频类型有单一喜好的用户需求,但随着用户对观看视频的需求更为多样,无法实在推荐到用户真正喜好的视频内容,不能满足用户复杂的视频需求,用户往往可能浪费更多时间在浏览和观看自己并不感兴趣的视频内容,降低了用户的使用体验,进而必将影响视频应用或网站的推广。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的用户画像的生成方法及装置。依据本专利技术的一方面,提供了一种用户画像的生成方法,包括:获取多个视频账户的视频点击行为信息,依据所述视频点击行为信息确定各视频账户的用户表示,所述用户表示用于标识视频账户行为特征;基于所述用户表示按照预设聚类算法对所述多个视频账户进行聚类,获取聚类后各类视频账户的历史点击视频对应的视频标题;提取各类视频账户的历史点击视频对应的视频标题中的关键词,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条件的关键词生成相应类别视频账户的用户画像。可选地,所述视频点击行为信息包括:视频账户所属用户点击过的视频对应的标题。可选地,获取多个视频账户的视频点击行为信息,包括:收集多个视频账户的历史视频数据,从收集到历史视频数据中解析出视频标题;获取解析到的视频标题并将其作为所述多个视频账户的视频点击行为信息。可选地,依据所述视频点击行为信息确定各视频账户的用户表示,包括:将所述多个视频账户对应的视频标题进行分词处理,得到多个词语单元;统计各视频账户对应的词语单元出现的频率,将出现频率大于指定频率阈值的词语单元作为相应视频账户的用户表示。可选地,提取各类视频账户的历史点击视频对应的视频标题中的关键词,包括:将各类视频账户的历史点击视频对应的视频标题进行分词操作,得到多个词语单元;从所述分词操作得到的多个词语单元中提取出与视频特征有关的多个关键词。可选地,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条件的关键词生成相应类别视频账户的用户画像,包括:对于任一类视频账户,统计与其对应的各关键词的出现频率;选取出现频率大于预设频率值的关键词,依据选取出的关键词生成所述任一类视频账户的用户画像。可选地,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条件的关键词生成相应类别视频账户的用户画像,包括:对于任一类视频账户,统计与其对应的各关键词的出现频率;基于统计出的关键词的出现频率,对所述任一类视频账户对应的多个关键词进行排序;选取排名大于预设排名的关键词,依据选取出的关键词生成所述任一类视频账户的用户画像。可选地,所述方法还包括:当监测到任意视频账户的登录操作时,确定所述任意视频账户所属视频账户类别;获取所述任意视频账户所属视频账户类别的用户画像,为所述任意视频账户推荐与获取到的用户画像相关的视频数据。可选地,所述方法还包括:获取多个视频账户未点击视频的视频标题,基于获取的未点击视频的视频标题为各视频账户添加用户标签;当监测到任意视频账户的登录操作时,确定所述任意视频账户所属视频账户类别;获取所述任意视频账户的用户标签,分析所述用户标签中是否存在与确定的视频账户类别中其他视频账户的用户表示相匹配的用户标签;若是,将与其他视频账户的用户表示相匹配的用户标签相关的视频数据推荐给所述任意账户。可选地,所述预设聚类算法包括k-means聚类算法。依据本专利技术的另一方面,还提供了一种用户画像的生成装置,包括:第一确定模块,适于获取多个视频账户的视频点击行为信息,依据所述视频点击行为信息确定各视频账户的用户表示,所述用户表示用于标识视频账户行为特征;聚类模块,适于基于所述用户表示按照预设聚类算法对所述多个视频账户进行聚类,获取聚类后各类视频账户的历史点击视频对应的视频标题;生成模块,适于提取各类视频账户的历史点击视频对应的视频标题中的关键词,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条件的关键词生成相应类别视频账户的用户画像。可选地,所述视频点击行为信息包括:视频账户所属用户点击过的视频对应的标题。可选地,所述第一确定模块还适于:收集多个视频账户的历史视频数据,从收集到历史视频数据中解析出视频标题;获取解析到的视频标题并将其作为所述多个视频账户的视频点击行为信息。可选地,所述第一确定模块还适于:将所述多个视频账户对应的视频标题进行分词处理,得到多个词语单元;统计各视频账户对应的词语单元出现的频率,将出现频率大于指定频率阈值的词语单元作为相应视频账户的用户表示。可选地,所述生成模块还适于:将各类视频账户的历史点击视频对应的视频标题进行分词操作,得到多个词语单元;从所述分词操作得到的多个词语单元中提取出与视频特征有关的多个关键词。可选地,所述生成模块还适于:对于任一类视频账户,统计与其对应的各关键词的出现频率;选取出现频率大于预设频率值的关键词,依据选取出的关键词生成所述任一类视频账户的用户画像。可选地,所述生成模块还适于:对于任一类视频账户,统计与其对应的各关键词的出现频率;基于统计出的关键词的出现频率,对所述任一类视频账户对应的多个关键词进行排序;选取排名大于预设排名的关键词,依据选取出的关键词生成所述任一类视频账户的用户画像。可选地,所述装置还包括:第二确定模块,适于当监测到任意视频账户的登录操作时,确定所述任意视频账户所属视频账户类别;第一推荐模块,适于获取所述任意视频账户所属视频账户类别的用户画像,为所述任意视频账户推荐与获取到的用户画像相关的视频数据。可选地,所述装置还包括:添加模块,适于获取多个视频账户未点击视频的视频标题,基于获取的未点击视频的视频标题为各视频账户添加用户标签;第三确定模块,适于当监测到任意视频账户的登录操作时,确定所述任意视频账户所属视频账户类别;分析模块,适于获取所述任意视频账户的用户标签,分析所述用户标签中是否存在与确定的视频账户类别中其他视频账户的用户表示相匹配的用户标签;第二推荐模块,适于,若所述分析模块分析所述用户标签中存在与确定的视频账户类别中其他视频账户的用户表示相匹配的用户标签,将与其他视频账户的用户表示相匹配的用户标签相关的视频数据推荐给所述任意账户。可选地,所述预设聚类算法包括k-means聚类算法。依据本专利技术的另一方面,还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序代码,当所述计算机程序代码在计算设备上运行时,导致所述计算设备执行上文任意实施例所述的用户画像的生成方法。依据本专利技术的另一方面,还提供了一种计算设备,包括:处理器;存储有计算机程序代码的存储器;当所述计算机程序代码本文档来自技高网...

【技术保护点】
1.一种用户画像的生成方法,包括:获取多个视频账户的视频点击行为信息,依据所述视频点击行为信息确定各视频账户的用户表示,所述用户表示用于标识视频账户行为特征;基于所述用户表示按照预设聚类算法对所述多个视频账户进行聚类,获取聚类后各类视频账户的历史点击视频对应的视频标题;提取各类视频账户的历史点击视频对应的视频标题中的关键词,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条件的关键词生成相应类别视频账户的用户画像。

【技术特征摘要】
1.一种用户画像的生成方法,包括:获取多个视频账户的视频点击行为信息,依据所述视频点击行为信息确定各视频账户的用户表示,所述用户表示用于标识视频账户行为特征;基于所述用户表示按照预设聚类算法对所述多个视频账户进行聚类,获取聚类后各类视频账户的历史点击视频对应的视频标题;提取各类视频账户的历史点击视频对应的视频标题中的关键词,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条件的关键词生成相应类别视频账户的用户画像。2.根据权利要求1所述的方法,其中,所述视频点击行为信息包括:视频账户所属用户点击过的视频对应的标题。3.根据权利要求2所述的方法,其中,获取多个视频账户的视频点击行为信息,包括:收集多个视频账户的历史视频数据,从收集到历史视频数据中解析出视频标题;获取解析到的视频标题并将其作为所述多个视频账户的视频点击行为信息。4.根据权利要求3所述的方法,其中,依据所述视频点击行为信息确定各视频账户的用户表示,包括:将所述多个视频账户对应的视频标题进行分词处理,得到多个词语单元;统计各视频账户对应的词语单元出现的频率,将出现频率大于指定频率阈值的词语单元作为相应视频账户的用户表示。5.根据权利要求1-4任一项所述的方法,其中,提取各类视频账户的历史点击视频对应的视频标题中的关键词,包括:将各类视频账户的历史点击视频对应的视频标题进行分词操作,得到多个词语单元;从所述分词操作得到的多个词语单元中提取出与视频特征有关的多个关键词。6.根据权利要求5所述的方法,其中,从提取的关键词中选取符合预设条件的关键词,依据所述符合预设条件的...

【专利技术属性】
技术研发人员:罗玄黄君实陈强
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1