视频标签的获取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26762870 阅读:25 留言:0更新日期:2020-12-18 23:17
本发明专利技术实施例公开了一种视频标签的获取方法、装置、电子设备及存储介质,所述方法包括:从多个来源网站中获取第一视频对应的多个媒资数据;根据多个来源网站的网站排名,得到媒资数据的准确性权重;对媒资数据进行分词,并计算分词集中每一个单词的词权重;从分词集中选择代表单词,并获取与代表单词关联的关联单词的权重;基于多个媒资数据的准确性权重、多个代表单词的词权重以及多个关联单词的权重,得到多个代表单词的最终权重;根据多个代表单词的最终权重得到第一视频的标签。本发明专利技术实施例可以提升视频标签选择的准确性和效率,从而可增强视频推荐的用户体验。

【技术实现步骤摘要】
视频标签的获取方法、装置、电子设备及存储介质
本专利技术涉及互联网
,具体涉及一种视频标签的获取方法、装置、电子设备及存储介质。
技术介绍
在用户观看视频时,如影视作品,可以基于用户的观看记录等确定出用户的兴趣点或关注点,然后基于视频标注的标签为用户推荐相关的视频。推荐的视频是否是用户感兴趣或者关注的,取决于视频标注的标签的准确性。视频的标签标注方式包括人工标注、深度学习的机器学习标注以及通过对影视媒资的分词,然后通过每个单词的权重来进行标注。人工标注和机器学习标注需要投入大量的人力,且人工标注费事费力,准确性差,机器学习标注需要专业的人才,成本高且如果机器学习如果没有标注某样“事物”,则当该事物出现在新的视频中后,容易对深度学习模型的判断产生影响,导致标签标注不准确;对影视媒资的分词方式,利用现有的一些分词算法,对媒资数据进行分词分析,找到权重较高的单词作为标签,维度过于单一,可能导致标签不能对影视媒资的全面覆盖,进而影响标签标注的准确性。
技术实现思路
基于现有技术中存在的问题,本专利技术实施例提出一种视频本文档来自技高网...

【技术保护点】
1.一种视频标签的获取方法,其特征在于,包括:/n从多个来源网站中获取第一视频对应的多个媒资数据;/n根据多个所述来源网站的网站排名,得到每一个媒资数据的准确性权重;/n对每一个所述媒资数据进行分词,并计算分词集中每一个单词的词权重;/n从所述分词集中选择代表单词,并获取与所述代表单词关联的关联单词的权重;/n基于多个所述媒资数据的准确性权重、多个代表单词的词权重以及多个关联单词的权重,得到多个所述代表单词的最终权重;/n根据多个所述代表单词的最终权重得到第一视频的标签。/n

【技术特征摘要】
1.一种视频标签的获取方法,其特征在于,包括:
从多个来源网站中获取第一视频对应的多个媒资数据;
根据多个所述来源网站的网站排名,得到每一个媒资数据的准确性权重;
对每一个所述媒资数据进行分词,并计算分词集中每一个单词的词权重;
从所述分词集中选择代表单词,并获取与所述代表单词关联的关联单词的权重;
基于多个所述媒资数据的准确性权重、多个代表单词的词权重以及多个关联单词的权重,得到多个所述代表单词的最终权重;
根据多个所述代表单词的最终权重得到第一视频的标签。


2.根据权利要求1所述的视频标签的获取方法,其特征在于,所述根据多个所述来源网站的网站排名,得到每一个媒资数据的准确性权重,包括:
根据多个所述网站排名,确定基础排名;
根据所述基础排名和每一个来源网站的排名,对应地确定每一个媒资数据的准确性权重。


3.根据权利要求1所述的视频标签的获取方法,其特征在于,所述对每一个所述媒资数据进行分词,并计算分词集中每一个单词的词权重,包括:
根据预设的词组库对每一个所述媒资数据进行分词;
对分词结果中的同名的单词进行去重,以得到所述分词集;
计算所述分词集中每一个单词的词权重。


4.根据权利要求1所述的视频标签的获取方法,其特征在于,所述从所述分词集中选择代表单词,并获取与所述代表单词关联的关联单词的权重,包括:
基于预设的同义词/近义词词表,对所述分词集中的单词进行分类;
基于每一类单词中每一个单词的词权重,确定对应于每一类单词的代表单词;
将所述每一类单词中的除代表单词之外的剩余单词作为与所述代表单词关联的关联单词;
根据所述关联单词在所述分词集中的数量和所述分词集中单词的数量,得到与所述代表单词关联的关联单词的权重。


5.根据权利要求1-4任一项所述的视频标签的获取方法,其特征在于,所述...

【专利技术属性】
技术研发人员:李琳张晓颖王晓炜
申请(专利权)人:咪咕文化科技有限公司中国移动通信集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1