确定视频标签的方法、装置、存储介质和终端设备制造方法及图纸

技术编号：19480361 阅读：19 留言：0更新日期：2018-11-17 10:34

本发明专利技术提出一种确定视频标签的方法、装置、存储介质和终端设备，其中，所述方法包括：根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本；从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签；对各所述候选标签进行排序；以及根据排序结果，从所述各候选标签中选择出与所述待处理视频相符合的标签。采用本发明专利技术，提高视频标签描述的准确程度。

全部详细技术资料下载

【技术实现步骤摘要】
确定视频标签的方法、装置、存储介质和终端设备
本专利技术涉及计算机
，尤其涉及一种确定视频标签的方法、装置、存储介质和终端设备。
技术介绍
随着互联网资讯的发展，基于用户的兴趣点，为用户进行个性化的资讯推荐是资讯消费的新潮流。其中，视频的推荐为个性化推荐的一个重要组成部分。为了实现视频的个性化推荐，需要事先理解视频的内容，实现视频的标签化。标签化是定义视频的标签的过程，视频的标签可以描述视频内容的关注点。目前，定义视频标签的方案包括：1、根据视频的标题文本进行提炼分析，从中提取关键词作为视频的标签。2、通过人工观看视频，人为理解视频的内容，然后给视频打上相应的标签。但是，上述方案存在以下不足之处：1、对于方案1来说，视频的标题通常较短，且标题的描述相对口语化，从标题中提取到的关键词较少，没有基于视频内容的理解和校验，所定义的标签难以准确地描述视频内容。2、对于方案2来说，人为理解视频内容虽然可以提升定义标签的准确性，但是效率低、成本高。
技术实现思路
本专利技术实施例提供一种确定视频标签的方法、装置、存储介质和终端设备，以解决或缓解现有技术中的以上一个或多个技术问题。第一方面，本专利技术实施例提供了一种确定视频标签的方法，包括：根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本；从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签；对各所述候选标签进行排序；以及根据排序结果，从所述各候选标签中选择出与所述待处理视频相符合的标签。结合第一方面，在第一方面的第一种实施方式中，根据待处理视频所属的领域，确定...

【技术保护点】
1.一种确定视频标签的方法，其特征在于，包括：根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本；从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签；对各所述候选标签进行排序；以及根据排序结果，从所述各候选标签中选择出与所述待处理视频相符合的标签。

【技术特征摘要】
1.一种确定视频标签的方法，其特征在于，包括：根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本；从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签；对各所述候选标签进行排序；以及根据排序结果，从所述各候选标签中选择出与所述待处理视频相符合的标签。2.如权利要求1所述的确定视频标签的方法，其特征在于，根据待处理视频所属的领域，确定对所述待处理视频的关联文本的获取方式，以抽取所述待处理视频的关联文本，包括：如果所述待处理视频属于目标领域，则采用图像识别技术，从所述待处理视频中获取字幕文本；以及如果所述待处理视频不属于目标领域，则获取所述待处理视频的标题。3.如权利要求2所述的确定视频标签的方法，其特征在于，从所述待处理视频的关联文本中抽取所述待处理视频的各候选标签，包括：如果所述关联文本为所述字幕文本，则对所述字幕文本进行结构分析、语义分析和主题分类，获得所述待处理视频的候选标签。4.如权利要求3所述的确定视频标签的方法，其特征在于，对所述字幕文本进行结构分析，包括：根据所述字幕文本的文本结构，确定构成所述字幕文本的关键词；统计各关键词出现在所述字幕文本中的频次；以及根据所述各关键词的频次，从所述各关键词中选择关键词作为所述视频的候选标签。5.如权利要求3所述的确定视频标签的方法，其特征在于，对所述字幕文本进行语义分析，包括：根据语义分析模型，计算预设的标签与所述字幕文本之间的语义相似度；以及根据预设的标签与所述字幕文本之间的语义相似度，从预设的标签中选取标签作为所述视频的候选标签。6.如权利要求3所述的确定视频标签的方法，其特征在于，对所述字幕文本进行主题分类，包括：根据所述视频的候选标签与预设的主题标签之间的相似度，从所述预设的主题标签中获取标签，并作为所述视频的候选标签。7.如权利要求1所述的确定视频标签的方法，其特征在于，对各所述候选标签进行排序，包括：根据各所述候选标签出现在所述关联文本的频次，为所述候选标签设置权重值；当所述候选标签出现在所述关联文本的频次为零时，根据所述候选标签与所述关联文本的语义相似度，调整所述候选标签的权重值；以及根据各所述候选标签的权重值，对各所述候选标签进行排序。8.如权利要求1至7任一项所述的确定视频标签的方法，其特征在于，所述方法还包括：对所述关联文本进行预处理；其中，所述预处理包括：分段、分句、分词、词性标识和命名实体识别中的至少一者；以及对所述候选标签进行后处理；其...

【专利技术属性】
技术研发人员：刘呈祥，何伯磊，吴甜，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人