一种融合社会属性信息的短视频推送系统技术方案

技术编号:38813563 阅读:14 留言:0更新日期:2023-09-15 19:52
本发明专利技术公开了一种融合社会属性信息的短视频推送系统,属于人工智能技术领域,该系统利用爬虫单元获取各短视频的识别标签、各短视频的弹幕内容信息以及各短视频的相关参数;再利用情感分析单元对短视频弹幕内容进行情感分析,判断各弹幕的情感倾向为积极、消极还是中性;再利用控制器获取一个用户的各相关短视频以及各相关短视频相对该用户的推荐系数Tj;该推送系统考虑到传统的推送过程中,视频标签覆盖范围较广导致推荐的视频类别实际覆盖范围较大,与用户之间的契合度较低,推荐效果不佳的问题,在利用标签进行初次筛选的基础上,再次利用弹幕内容对系统预进行推荐的短视频内容范围进行进一步的缩小,从而有利于提升短视频智能推荐的准确性。视频智能推荐的准确性。

【技术实现步骤摘要】
一种融合社会属性信息的短视频推送系统


[0001]本专利技术属于人工智能
,具体涉及一种融合社会属性信息的短视频推送系统。

技术介绍

[0002]互联网自出现以来,承载的信息量随着时间出现爆炸式的增长,导致用户在对信息进行查询时,无法快速准确的获取用户所需的或者用户感兴趣的信息,为了降低用户获取需要信息的难度,智能推荐技术也在互联网技术中得到了充分的发展与利用,用户在互联网进行活动时,平台可以根据在过去一段时间内用户的活动记录对用户感兴趣或者可能感兴趣的信息进行推荐,使用户能够快速准确的获取相关信息,降低了用户在信息获取上花费的时间,同时也提升了平台与用户之间的信息交互效率。
[0003]现有技术中短视频平台在对短视频进行推荐时,由于视频标签覆盖范围较广,导致推荐的视频类别实际覆盖范围较大,与用户之间的契合度较低,推荐效果不佳,为了解决上述问题,提供一种能够提升短视频推荐精度的方案,本专利技术提供了以下技术方案。

技术实现思路

[0004]本专利技术的目的在于提供一种融合社会属性信息的短视频推送系统,旨在解决现有技术中短视频平台在对短视频进行推荐时,由于视频标签覆盖范围较广,导致推荐的视频类别实际覆盖范围较大,与用户之间的契合度较低,推荐效果不佳的问题。
[0005]本专利技术的目的可以通过以下技术方案实现:一种融合社会属性信息的短视频推送系统,包括:爬虫单元,用于获取各短视频的识别标签、各短视频的弹幕内容信息以及各短视频的点击率、转发率、评论率、点赞率、播放次数;情感分析单元,用于对短视频弹幕内容进行情感分析,判断各弹幕的情感倾向为积极、消极还是中性;控制器,用于获取一个用户的各相关短视频以及各相关短视频相对该用户的推荐系数Tj;推荐单元,用于将对应的短视频推荐至对应用户的终端设备;控制器计算一个用户的各相关短视频以及各相关短视频相对该用户的推荐系数Tj的方法包括如下步骤:S1、通过爬虫单元获取各短视频的识别标签以及在过去的预设时间T1内各短视频的热度值r;S2、获取过去的预设时间T2内,目标用户所对应的身份标签;S3、对于一个短视频,获取其对应的识别标签与目标用户的身份标签之间的重合度α,将重合度α大于预设值α1的短视频标记为待选短视频,获取各待选短视频在过去的T1时间内的热度值r;
根据公式计算得到对于目标用户,各待选短视频的相关热度系数R;将相关热度系数R大于等于预设值R1的待选短视频标记为相关短视频;S4、对各相关短视频的弹幕关键词进行获取;获取目标用户的相关关键词,目标用户的相关关键词根据目标用户在过去T2时间内观看的短视频的弹幕关键词;获取目标用户的相关关键词与各相关短视频的弹幕关键词之间的相似度αx;S5、当两个用户对应的相关关键词的重合度大于等于预设值y3时,则认为这两个用户为同属性用户;获取目标用户的同属性用户;获取各相关短视频被同属性用户观看的次数g;通过情感分析单元判断各弹幕的情感倾向为积极、消极还是中性;获取各相关短视频中情感倾向为积极以及中性的弹幕的占比之和b;根据公式计算得到对于目标用户,各对应的相关短视频的推荐系数Tj;其中θ1、θ2与θ3均为预设系数,1<μ<1.1;S6、推荐单元按照推荐系数Tj越大,优先度越大的原则将各相关短视频推荐至目标用户。
[0006]作为本专利技术的进一步方案,短视频的热度值r的计算方法为:获取在过去的预设时间T1内,各短视频的点击率d1、转发率d2、评论率d3、点赞率d4以及播放次数d;根据公式r=λ5*d*(λ1*d1+λ2*d2+λ3*d3+λ4*d4)计算得到在过去的T1时间内,对应短视频的热度值r;λ1、λ2、λ3、λ4、λ5均为预设系数。
[0007]作为本专利技术的进一步方案,目标用户的身份标签的获取方法为:获取在过去的预设时间T2内,目标用户所观看的各短视频的识别标签的集合;获取识别标签的集合中各识别标签的数量ki;将满足ki>ky1或满足ki>ky2且ki/kz>β1的识别标签作为目标用户的身份标签;其中ky1、ky2与β1均为预设值,kz为识别标签的集合中识别标签的总数,且ky1>ky2。
[0008]作为本专利技术的进一步方案,所述重合度α=u1/umax,其中u1为短视频的识别标签与目标用户的身份标签之间的重合标签的数量,umax为短视频标签与目标用户的身份标签中数量较大一方的标签数量;作为本专利技术的进一步方案,αx=u2/u2max,其中u2为目标用户的相关关键词与各相关短视频的弹幕关键词之间的重合关键词的数量,u2max为目标用户的相关关键词总数与相关短视频的弹幕关键词总数中较大一方。
[0009]作为本专利技术的进一步方案,相关短视频的弹幕关键词的获取方法为:在过去的T1时间内,随机获取预设数量的弹幕,形成对应相关短视频的弹幕集合;
对弹幕集合中弹幕词汇进行分析,将出现频率最高的前e个词汇标记对应短视频在过去T1时间内的弹幕关键词,e为预设值。
[0010]作为本专利技术的进一步方案,目标用户对应的相关关键词的获取方法:获取目标用户在过去的T2时间内观看的短视频的弹幕关键词集合;将弹幕关键词集合中出现次数c满足c>c1或者满足c>c2且c/cz>β2的关键词标记为目标用户对应的相关关键词;其中c1、c2、β2均为预设值,cz为弹幕关键词集合中弹幕关键词的总数,c1>c2。
[0011]作为本专利技术的进一步方案,μ取值为1.001。
[0012]本专利技术的有益效果如下:1、本专利技术利用用户画像,将更加符合用户需求的短视频优先推荐至对应用户,降低用户获取所需信息的难度,提升用户查看短视频的体验的流畅性;2、本专利技术考虑到传统的推送过程中,视频标签覆盖范围较广导致推荐的视频类别实际覆盖范围较大,与用户之间的契合度较低,推荐效果不佳的问题,在利用标签进行初次筛选的基础上,再次利用弹幕内容对系统预进行推荐的短视频内容范围进行进一步的缩小,从而有利于提升短视频智能推荐的准确性;3、本专利技术利用用户在短视频平台活动期间涉及的弹幕来对用户进行评价,并以此来判断获取与用户的社会属性相似的其他用户,并在最终的判断过程中考虑这些其他用户的短视频观看记录,从而使最终推荐的短视频更加符合用户的需求,有利于提升平台的用户粘度。
具体实施方式
[0013]下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0014]一种融合社会属性信息的短视频推送系统,包括:爬虫单元,用于获取各短视频的识别标签、各短视频的弹幕内容信息以及各短视频的点击率、转发率、评论率、点赞率、播放次数等原始信息;情感分析单元,用于对短视频弹幕内容进行情感分析,判断各弹幕的情感倾向为积极、消极还是中性;控制器,用于获取一个用户的各相关短视频以及各相关短视频相对该用户的推荐系数Tj;推荐单元,用于将对应的短视频推荐至对应用户的终端设备。
[001本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合社会属性信息的短视频推送系统,其特征在于,包括:爬虫单元,用于获取各短视频的识别标签、各短视频的弹幕内容信息以及各短视频的点击率、转发率、评论率、点赞率、播放次数;情感分析单元,用于对短视频的弹幕内容信息进行情感分析,判断各弹幕内容信息的情感倾向为积极、消极还是中性;控制器,用于获取一个用户的各相关短视频以及各相关短视频相对该用户的推荐系数Tj;推荐单元,用于将对应的短视频推荐至对应用户的终端设备;控制器计算一个用户的各相关短视频以及各相关短视频相对该用户的推荐系数Tj的方法包括如下步骤:S1、通过爬虫单元获取各短视频的识别标签以及在过去的预设时间T1内各短视频的热度值r;S2、获取过去的预设时间T2内,目标用户所对应的身份标签;S3、对于一个短视频,获取其对应的识别标签与目标用户的身份标签之间的重合度α,将重合度α大于预设值α1的短视频标记为待选短视频,获取各待选短视频在过去的T1时间内的热度值r;根据公式计算得到对于目标用户,各待选短视频的相关热度系数R;将相关热度系数R大于等于预设值R1的待选短视频标记为相关短视频;S4、对各相关短视频的弹幕关键词进行获取;获取目标用户的相关关键词,目标用户的相关关键词根据目标用户在过去T2时间内观看的短视频的弹幕关键词;获取目标用户的相关关键词与各相关短视频的弹幕关键词之间的相似度αx;αx=u2/u2max,其中u2为目标用户的相关关键词与各相关短视频的弹幕关键词之间的重合关键词的数量,u2max为目标用户的相关关键词总数与相关短视频的弹幕关键词总数中较大一方;S5、当两个用户对应的相关关键词的重合度大于等于预设值y3时,则认为这两个用户为同属性用户;获取目标用户的同属性用户;获取各相关短视频被同属性用户观看的次数g;通过情感分析单元判断各弹幕内容信息的情感倾向为积极、消极还是中性;获取各相关短视频中情感倾向为积极以及中性的弹幕内容信息的占比之和b;根据公式计算得到对于目标用户,各对应的相关短视频的推荐系数Tj;其中θ1、θ2与θ3均为预设系数,μ为预设数值且1<μ<1.1;S6、推荐单元按照推荐系数Tj越大,优先度越大的原则将各相关短...

【专利技术属性】
技术研发人员:李强赵峰宋卫平魏伟高胜杰桂胜李习靖杨蕊
申请(专利权)人:国网信息通信产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1