一种多媒体资源作者相似度的识别方法、装置及设备制造方法及图纸

技术编号:35029572 阅读:19 留言:0更新日期:2022-09-24 23:03
本申请公开了一种多媒体资源作者相似度的识别方法、装置及设备,该方法包括:首先在预设时间段内确定目标多媒体资源作者的有效观众,并将目标多媒体资源作者与其每一有效观众构成关系对;然后根据关系对计算目标多媒体资源作者与其他作者之间重合的有效观众数量;接着利用重合的有效观众数量和有效观众总数,对目标多媒体资源作者与其他作者的观众重合度进行归一化和去极值处理,得到归一化后的观众重合度值,进而将目标多媒体资源作者与其他作者的归一化后的观众重合度值拼接为重合度向量,并计算任意两个目标多媒体资源作者对应的重合度向量之间的相似度,从而提高了相似度的识别效率和准确率。识别效率和准确率。识别效率和准确率。

【技术实现步骤摘要】
一种多媒体资源作者相似度的识别方法、装置及设备


[0001]本申请涉及计算机
,尤其涉及一种多媒体资源作者相似度的识别方法、装置及设备。

技术介绍

[0002]随着算机技术和移动通信技术的迅速发展,基于电子设备的各种多媒体播放平台得到了普遍应用,极大地丰富了人们的日常生活。比如,用户可以通过各种短视频播放平台方便地上传和观看各种视频或音频等多媒体资源。
[0003]目前网络服务商会主动向用户推荐短视频、音乐等多媒体资源,通常这些多媒体资源是由其他的作者提供并上传到网络服务商的服务器上,为了能够向用户提供更符合其喜好的多媒体资源,往往需要借鉴该用户所在领域的群体所接受或信任、并对该群体的关注行为有较大影响力的权威作者所发布的多媒体资源,但目前对于这些权威作者的识别,往往是通过人工筛选的方式,根据多媒体资源作者的标签和点赞数等指标进行选取,一方面这种人工识别的效率比较低,另一方面也难以保证识别结果的准确率。并且,当需要同时识别出大量具有较大影响力、相似度较高的权威作者时,人工识别的成本也较高。

技术实现思路

[0004]本申请实施例的主要目的在于提供一种多媒体资源作者的相似度识别方法、装置及设备,能够根据观众观看作者发布多媒体资源的情况,准确识别出作者之间的相似程度,进而确定出相似度更高的作者。
[0005]本申请实施例提供了一种多媒体资源作者相似度的识别方法,包括:
[0006]在预设时间段内,确定待识别的目标多媒体资源作者的有效观众,并将所述目标多媒体资源作者与其每一有效观众构成关系对;
[0007]根据所述关系对,计算所述目标多媒体资源作者与其他作者之间重合的有效观众数量;
[0008]利用所述重合的有效观众数量和所述目标多媒体资源作者的有效观众总数,对所述目标多媒体资源作者与其他作者的观众重合度进行归一化处理和去极值处理,得到所述目标多媒体资源作者与其他作者的归一化后的观众重合度值;
[0009]将所述目标多媒体资源作者与其他作者的归一化后的观众重合度值拼接为一个重合度向量,并计算任意两个所述目标多媒体资源作者对应的重合度向量之间的相似度。
[0010]一种可能的实现方式中,所述在预设时间段内,确定待识别的目标多媒体资源作者的有效观众,包括:
[0011]在预设时间段内,查询对所述目标多媒体资源作者所发布的多媒体资源进行了有效观看、点赞、评论和分享中至少一项操作的观众,作为所述目标多媒体资源作者的有效观众。
[0012]一种可能的实现方式中,所述有效观看为观看所述目标多媒体资源作者所发布的
任一多媒体资源达到预设进度。
[0013]一种可能的实现方式中,所述在预设时间段内,确定待识别的目标多媒体资源作者的有效观众,并将所述目标多媒体资源作者与其每一有效观众构成关系对之后,所述方法还包括:
[0014]将在预设时间段内每天得到的所述目标多媒体资源作者与其每一有效观众构成关系对进行去重处理,得到去重后的关系对;
[0015]所述根据所述关系对,计算所述目标多媒体资源作者与其他作者之间重合的有效观众数量,包括:
[0016]根据所述去重后的关系对,计算所述目标多媒体资源作者与其他作者之间重合的有效观众数量。
[0017]一种可能的实现方式中,所述利用所述重合的有效观众数量和所述目标多媒体资源作者的有效观众总数,对所述目标多媒体资源作者与其他作者的观众重合度进行归一化处理和去极值处理,得到所述目标多媒体资源作者与其他作者的归一化后的观众重合度值,包括:
[0018]计算所述重合的有效观众数量和所述目标多媒体资源作者的有效观众总数的比值,并将所述比值进行去极值处理后作为所述目标多媒体资源作者对应的与其他作者的归一化后的观众重合度值。
[0019]一种可能的实现方式中,所述计算任意两个所述目标多媒体资源作者对应的重合度向量之间的相似度,包括:
[0020]计算任意两个所述目标多媒体资源作者对应的重合度向量之间的余弦相似度;或者,采用欧式距离的方式,计算任意两个所述目标多媒体资源作者对应的重合度向量之间的相似度。
[0021]一种可能的实现方式中,所述预设时间段为当前日期的前30天。
[0022]本申请实施例还提供了一种多媒体资源作者相似度的识别装置,所述装置包括:
[0023]确定单元,用于在预设时间段内,确定待识别的目标多媒体资源作者的有效观众,并将所述目标多媒体资源作者与其每一有效观众构成关系对;
[0024]第一计算单元,用于根据所述关系对,计算所述目标多媒体资源作者与其他作者之间重合的有效观众数量;
[0025]处理单元,用于利用所述重合的有效观众数量和所述目标多媒体资源作者的有效观众总数,对所述目标多媒体资源作者与其他作者的观众重合度进行归一化处理和去极值处理,得到所述目标多媒体资源作者与其他作者的归一化后的观众重合度值;
[0026]第二计算单元,用于将所述目标多媒体资源作者与其他作者的归一化后的观众重合度值拼接为一个重合度向量,并计算任意两个所述目标多媒体资源作者对应的重合度向量之间的相似度。
[0027]一种可能的实现方式中,所述确定单元具体用于:
[0028]在预设时间段内,查询对所述目标多媒体资源作者所发布的多媒体资源进行了有效观看、点赞、评论和分享中至少一项操作的观众,作为所述目标多媒体资源作者的有效观众。
[0029]一种可能的实现方式中,所述有效观看为观看所述目标多媒体资源作者所发布的
任一多媒体资源达到预设进度。
[0030]一种可能的实现方式中,所述装置还包括:
[0031]去重单元,用于将在预设时间段内每天得到的所述目标多媒体资源作者与其每一有效观众构成关系对进行去重处理,得到去重后的关系对;
[0032]所述第一计算单元具体用于:
[0033]根据所述去重后的关系对,计算所述目标多媒体资源作者与其他作者之间重合的有效观众数量。
[0034]一种可能的实现方式中,所述处理单元具体用于:
[0035]计算所述重合的有效观众数量和所述目标多媒体资源作者的有效观众总数的比值,并将所述比值进行去极值处理后作为所述目标多媒体资源作者对应的与其他作者的归一化后的观众重合度值。
[0036]一种可能的实现方式中,所述第二计算单元具体用于:
[0037]计算任意两个所述目标多媒体资源作者对应的重合度向量之间的余弦相似度;或者,采用欧式距离的方式,计算任意两个所述目标多媒体资源作者对应的重合度向量之间的相似度。
[0038]一种可能的实现方式中,所述预设时间段为当前日期的前30天。
[0039]本申请实施例还提供了一种多媒体资源作者相似度的识别设备,包括:处理器、存储器、系统总线;
[0040]所述处理器以及所述存储器通过所述系统总线相连;
[0041]所述存储器用于存储一个或多个程序,所述一个或多个程序包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多媒体资源作者相似度的识别方法,其特征在于,所述方法包括:在预设时间段内,确定待识别的目标多媒体资源作者的有效观众,并将所述目标多媒体资源作者与其每一有效观众构成关系对;根据所述关系对,计算所述目标多媒体资源作者与其他作者之间重合的有效观众数量;利用所述重合的有效观众数量和所述目标多媒体资源作者的有效观众总数,对所述目标多媒体资源作者与其他作者的观众重合度进行归一化处理和去极值处理,得到所述目标多媒体资源作者与其他作者的归一化后的观众重合度值;将所述目标多媒体资源作者与其他作者的归一化后的观众重合度值拼接为一个重合度向量,并计算任意两个所述目标多媒体资源作者对应的重合度向量之间的相似度。2.根据权利要求1所述的方法,其特征在于,所述在预设时间段内,确定待识别的目标多媒体资源作者的有效观众,包括:在预设时间段内,查询对所述目标多媒体资源作者所发布的多媒体资源进行了有效观看、点赞、评论和分享中至少一项操作的观众,作为所述目标多媒体资源作者的有效观众。3.根据权利要求2所述的方法,其特征在于,所述有效观看为观看所述目标多媒体资源作者所发布的任一多媒体资源达到预设进度。4.根据权利要求1所述的方法,其特征在于,所述在预设时间段内,确定待识别的目标多媒体资源作者的有效观众,并将所述目标多媒体资源作者与其每一有效观众构成关系对之后,所述方法还包括:将在预设时间段内每天得到的所述目标多媒体资源作者与其每一有效观众构成关系对进行去重处理,得到去重后的关系对;所述根据所述关系对,计算所述目标多媒体资源作者与其他作者之间重合的有效观众数量,包括:根据所述去重后的关系对,计算所述目标多媒体资源作者与其他作者之间重合的有效观众数量。5.根据权利要求1所述的方法,其特征在于,所述利用所述重合的有效观众数量和所述目标多媒体资源作者的有效观众总数,对所述目标多媒体资源作者与其他作者的观众重合度进行归一化处理和去极值处理,得到所述目标多媒体资源作者与其他作者的归一化后的观众重合度值,包括:计算所述重合的有效...

【专利技术属性】
技术研发人员:闾晓琛
申请(专利权)人:抖音视界北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1