标签确定方法、电子设备及存储介质技术

技术编号:24853659 阅读:43 留言:0更新日期:2020-07-10 19:07
本发明专利技术实施例提供了一种标签确定方法、电子设备及存储介质,其中,上述标签确定方法,包括:确定M个样本多媒体资源中每一个样本多媒体资源与目标多媒体资源的相似值,其中,所述M个样本多媒体资源与P个样本标签关联,M、P均为正整数;基于所述P个样本标签中每一个样本标签关联的样本多媒体资源与所述目标多媒体资源的相似值,确定所述每一个样本标签的评分值;根据所述每一个所述样本标签的评分值确定所述目标多媒体资源关联的目标标签,所述目标标签包括所述P个样本标签中的至少一个样本标签。本发明专利技术实施例提供的标签确定方法,能够有效节省标签确定过程所需人力成本,提高多媒体资源的标签的确定效率。

【技术实现步骤摘要】
标签确定方法、电子设备及存储介质
本专利技术涉及信息处理
,特别是涉及一种标签确定方法、电子设备及存储介质。
技术介绍
随着互联网技术的发展,多媒体资源的数量日益庞大。对于例如小说、新闻、论文等文字类型的多媒体资源,通过为其添加标签,可有助于用户快速获取多媒体资源的核心内容,或者从大量多媒体资源中方便地获取感兴趣的部分。现有技术中,通常采用人工标注的方式逐一为多媒体资源确定标签,然而,人工标注的效率通常较低,标签确定过程费时费力。
技术实现思路
本专利技术实施例的目的在于提供一种标签确定方法、电子设备及存储介质,以实现对多媒体资源标签确定过程的效率的提升。具体技术方案如下:在本专利技术实施的第一方面,首先提供了一种标签确定方法,包括:确定M个样本多媒体资源中每一个样本多媒体资源与目标多媒体资源的相似值,其中,所述M个样本多媒体资源与P个样本标签关联,M、P均为正整数;基于所述P个样本标签中每一个样本标签关联的样本多媒体资源与所述目标多媒体资源的相似值,确定所述每一个样本标签的评分值;根据本文档来自技高网...

【技术保护点】
1.一种标签确定方法,其特征在于,包括:/n确定M个样本多媒体资源中每一个样本多媒体资源与目标多媒体资源的相似值,其中,所述M个样本多媒体资源与P个样本标签关联,M、P均为正整数;/n基于所述P个样本标签中每一个样本标签关联的样本多媒体资源与所述目标多媒体资源的相似值,确定所述每一个样本标签的评分值;/n根据所述每一个所述样本标签的评分值确定所述目标多媒体资源关联的目标标签,所述目标标签包括所述P个样本标签中的至少一个样本标签。/n

【技术特征摘要】
1.一种标签确定方法,其特征在于,包括:
确定M个样本多媒体资源中每一个样本多媒体资源与目标多媒体资源的相似值,其中,所述M个样本多媒体资源与P个样本标签关联,M、P均为正整数;
基于所述P个样本标签中每一个样本标签关联的样本多媒体资源与所述目标多媒体资源的相似值,确定所述每一个样本标签的评分值;
根据所述每一个所述样本标签的评分值确定所述目标多媒体资源关联的目标标签,所述目标标签包括所述P个样本标签中的至少一个样本标签。


2.根据权利要求1所述的方法,其特征在于,确定所述样本多媒体资源与所述目标多媒体资源的相似值,包括:
计算目标相似度;
基于所述目标相似度,确定所述样本多媒体资源与所述目标多媒体资源的相似值;
其中,所述目标相似度包括第一相似度和/或第二相似度,所述第一相似度由目标多媒体资源的第一语义向量和所述样本多媒体资源的第二语义向量的相似度确定,所述第二相似度由所述目标多媒体资源的第一评价数据和样本多媒体资源的第二评价数据确定。


3.根据权利要求2所述的方法,其特征在于,在所述目标相似度包括所述第一相似度和第二相似度的情况下,所述基于目标相似度,确定所述样本多媒体资源与所述目标多媒体资源的相似值,包括:
获取所述第一相似度的第一权重与所述第二相似度的第二权重;
依据所述第一相似度、所述第二相似度、所述第一权重以及所述第二权重,加权计算所述目标多媒体资源与所述样本多媒体资源的相似值。


4.根据权利要求3所述的方法,其特征在于,所述获取所述第一相似度的第一权重与所述第二相似度的第二权重,包括:
获取所述P个样本标签中每一个样本标签所归属的标签类别;
依据所述标签类别,确定所述第一相似度的第一权重与所述第二相似度的第二权重。


5.根据权利要求1所述的方法,其特征在于,所述基于所述P个样本标签中每一个样本标签关联的样本多媒体资源与所述目标多媒体资源的相似值,确定所述每一个样本标签的评分值,包括:
获取所述P个样本标签中第一样本标签关联的N个样本多媒体资源,其中,所述第一样本标签为所述P个样本标签中的任一个样本标签,所述N个样本多媒体资源为所述M个样本多媒体资源中的全部或部分样本多媒体资源,N为小于或等于M的正整数;
获取所述N个样本多媒体资源中每一个样本多媒体资源关于所述第一样本标签的标签值;
依据所述标签值与所述N个样本多媒体资源中每一个样本多媒体资源对应的所述相似值,确定所述第一样本标签的评分值,其中,LA为所述第一样本标签的评分值,lBi为第i个样本多媒体资源对应的相似值,bi为第i个样本多媒体资源对应的标签值,i为小于或等于N的正整数。


6.根据权利要求1所述的方法,其特征在于,所述根据所述每一个所述样本标签的评分值确定所述目标多媒体资源关联的目标标签之后,所述方法还包括:
获取所述目标多媒体资源所归属的资源类别,以及所述资源类别对应的标签标注规则,所述标签标注规则包括:针对所述资源类别下的多媒体资源添加第一预设标签,和/或,针对所述资源类别下的多媒体资源删除第二预设标签;
依据所述标签标注规则,对所述目标多媒体资源关联的目标标签进行调整。


7.根据权利要求1所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:刘广东张洪祯杨勇
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1