一种短视频标签抽取方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:23400101 阅读:29 留言:0更新日期:2020-02-22 12:21
本发明专利技术公开了一种短视频标签抽取方法、装置、计算机设备及存储介质。该方法包括:根据短视频的描述信息从标签词库中抽取短视频的先验标签;根据用户观看短视频的先后次序,构造短视频与短视频之间的有向边;对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重;通过短视频的先验标签构建短视频的先验标签向量;通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量;基于所述最终标签向量,确定短视频的最终标签。该方法通过对短视频与短视频之间的关系进行标签的抽取,提高了标签的抽取效率。

A short video label extraction method, device, computer equipment and storage medium

【技术实现步骤摘要】
一种短视频标签抽取方法、装置、计算机设备及存储介质
本专利技术涉及短视频
,尤其涉及一种短视频标签抽取方法、装置、计算机设备及存储介质。
技术介绍
短视频由于标题和描述的信息较少,无法从文本信息中抽取足够的标签信息,但由于从视频内容解析内容不仅计算成本高而且难度大,因此基于文本信息来抽取视频标签依然是行业的主流做法。当前的短视频标签抽取方式主要是通过人工打标、文本分类、视频内容标签分类,所有这些技术都依赖海量的人工标注工作,其抽取方法效率较低,而且随着新内容的出现,人工标注的标签会过时以及缺少新标签,而且人工难以赋予视频标签合适的权重。
技术实现思路
本专利技术实施例提供了一种短视频标签抽取方法、装置、计算机设备及存储介质,旨在解决现有短视频标签抽取方法效率低的问题。本专利技术实施例提供一种短视频标签抽取方法,其包括:根据短视频的描述信息从标签词库中抽取短视频的先验标签;根据用户观看短视频的先后次序,构造短视频与短视频之间的有向边;对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重;通过短视频的先验标签构建短视频的先验标签向量;通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量;基于所述最终标签向量,确定短视频的最终标签。优选的,所述根据短视频的描述信息从标签词库中抽取短视频的先验标签,包括:获取短视频自身携带的描述文本、搜索短视频所使用的搜索词以及自定义标签中的一种或几种;将所述短视频自身携带的描述文本、搜索短视频所使用的搜索词以及自定义标签中的一种或几种与标签词库进行匹配,从标签词库中抽取出所述短视频的先验标签。优选的,所述对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重,包括:获取从第一短视频到第二短视频的入度边的条数,并记为第一条数;获取从所有短视频到第二短视频的入度边的条数,并记为第二条数;获取第一条数除以第二条数的结果,并记为所述第一短视频到第二短视频的有向边的权重。优选的,所述通过短视频的先验标签构建短视频的先验标签向量,包括:针对所述短视频所具有的先验标签,将所述短视频相应的先验标签向量设为1;针对所述短视频不具有的先验标签,将所述短视频相应的先验标签向量设为0。优选的,所述通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量,包括:将所述短视频的先验标签向量以及其他短视频到所述短视频的有向边的权重进行迭代计算,得到各短视频的最终标签向量。优选的,所述将所述短视频的先验标签向量以及其他短视频到所述短视频的有向边的权重进行迭代计算,得到各短视频的最终标签向量,包括:按照如下公式计算迭代第t+1次时短视频v的最终标签向量:其中,wi,v表示短视频i到短视频v的有向边的权重,表示短视频v在先验标签prior上的先验标签向量,kv表示短视频v的所有入度边的集合。优选的,所述基于所述最终标签向量,确定短视频的最终标签,包括:将所述短视频的各最终标签向量与预设的阈值进行比较;若所述最终标签向量大于或等于所述阈值,则保留所述最终标签向量,若所述最终标签向量小于所述阈值,则舍弃所述最终标签向量;将保留的各最终标签向量对应的最终标签进行组合,得到所述短视频的最终标签集合。本专利技术实施例还提供一种短视频标签抽取装置,其包括:先验标签抽取单元,用于根据短视频的描述信息从标签词库中抽取短视频的先验标签;有向边构造单元,用于根据用户观看短视频的先后次序,构造短视频与短视频之间的有向边;累加归一化单元,用于对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重;先验标签向量构建单元,用于通过短视频的先验标签构建短视频的先验标签向量;最终标签向量计算单元,用于通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量;最终标签确定单元,用于基于所述最终标签向量,确定短视频的最终标签。本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的短视频标签抽取方法。本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如上所述的短视频标签抽取方法。本专利技术实施例提供了一种短视频标签抽取方法、装置、计算机设备及存储介质,该方法包括:根据短视频的描述信息从标签词库中抽取短视频的先验标签;根据用户观看短视频的先后次序,构造短视频与短视频之间的有向边;对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重;通过短视频的先验标签构建短视频的先验标签向量;通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量;基于所述最终标签向量,确定短视频的最终标签。该方法通过对短视频与短视频之间的关系进行标签的抽取,提高了标签的抽取效率。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种短视频标签抽取方法的流程示意图;图2为本专利技术实施例提供的一种短视频标签抽取方法的有向图;图3为本专利技术实施例提供的一种短视频标签抽取装置的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。请参阅图1,图1为本专利技术实施例提供的一种短视频标签抽取方法的流程示意图,该方法可以包括步骤S101~S106:S101、根据短视频的描述信息从标签词本文档来自技高网...

【技术保护点】
1.一种短视频标签抽取方法,其特征在于,包括:/n根据短视频的描述信息从标签词库中抽取短视频的先验标签;/n根据用户观看短视频的先后次序,构造短视频与短视频之间的有向边;/n对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重;/n通过短视频的先验标签构建短视频的先验标签向量;/n通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量;/n基于所述最终标签向量,确定短视频的最终标签。/n

【技术特征摘要】
1.一种短视频标签抽取方法,其特征在于,包括:
根据短视频的描述信息从标签词库中抽取短视频的先验标签;
根据用户观看短视频的先后次序,构造短视频与短视频之间的有向边;
对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重;
通过短视频的先验标签构建短视频的先验标签向量;
通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量;
基于所述最终标签向量,确定短视频的最终标签。


2.根据权利要求1所述的短视频标签抽取方法,其特征在于,所述根据短视频的描述信息从标签词库中抽取短视频的先验标签,包括:
获取短视频自身携带的描述文本、搜索短视频所使用的搜索词以及自定义标签中的一种或几种;
将所述短视频自身携带的描述文本、搜索短视频所使用的搜索词以及自定义标签中的一种或几种与标签词库进行匹配,从标签词库中抽取出所述短视频的先验标签。


3.根据权利要求1所述的短视频标签抽取方法,其特征在于,所述对短视频两两之间的所有入度边进行累加归一化,得到短视频之间有向边的权重,包括:
获取从第一短视频到第二短视频的入度边的条数,并记为第一条数;
获取从所有短视频到第二短视频的入度边的条数,并记为第二条数;
获取第一条数除以第二条数的结果,并记为所述第一短视频到第二短视频的有向边的权重。


4.根据权利要求1所述的短视频标签抽取方法,其特征在于,所述通过短视频的先验标签构建短视频的先验标签向量,包括:
针对所述短视频所具有的先验标签,将所述短视频相应的先验标签向量设为1;
针对所述短视频不具有的先验标签,将所述短视频相应的先验标签向量设为0。


5.根据权利要求1所述的短视频标签抽取方法,其特征在于,所述通过所述短视频的先验标签向量和短视频之间有向边的权重计算得到各短视频的最终标签向量,包括:
将所述短视频的先验标签向量以及其他短视频到所述短视频的有向边的权重进行迭代计算,得到各短视频的最终标签向量。


6...

【专利技术属性】
技术研发人员:苏映滨
申请(专利权)人:深圳墨世科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1