一种视频标签生成方法及装置制造方法及图纸

技术编号:17837529 阅读:24 留言:0更新日期:2018-05-03 19:14
本发明专利技术提供了一种视频标签生成方法及其装置,涉及网络视频技术领域,其中,在该视频标签生成方法中包括:S1获取视频语音的文字信息;S2将得到的文字信息进行分词并保留其中的名词和动词;S3将得到的名词和动词进行重要性排序获得视频关键词;S4根据视频关键词得到视频标签。在本发明专利技术提供的视频标签生成方法及其装置中,在不需要人工参与的情况下,根据视频语音对应的文字信息自动生成视频标签,以此自动对视频打标签,得到的视频标签与视频内容完全匹配,内容丰富。

A method and device for generating video label

The invention provides a video label generation method and its device, which involves the field of network video technology, in which the video label generation method includes: S1 gets the text information of the video voice; S2 divides the text information obtained by the word and preserves the noun and verb in the video; S3 will get the noun and verb to be obtained. To get the video keywords, S4 will get the video labels according to the video keywords. In the video label generation method and the device provided by the invention, the video tag is automatically generated according to the text information corresponding to the video voice without the need of manual participation, which automatically labels the video, and the video tag is completely matched with the video content, and the internal capacity is rich.

【技术实现步骤摘要】
一种视频标签生成方法及装置
本专利技术涉及网络视频
,尤其涉及一种视频标签生成方法及其装置。
技术介绍
视频标签是指用于描述视频特征的短语,丰富的视频标签可以用来提高搜索排名,方便浏览者更准确的搜索。但目前视频标签通常是编辑或者视频上传者手动直接填写,这种方法对视频的描述较片面,内容不够丰富,且视频标签仅能标识视频类型,对视频内容关联较小,效率低下,不利于浏览者对视频的检索。当然,现在也有在线视频标签生成方法,其首先根据经验对每一种类型的视频标签做一个整理,形成标签库,这样,编辑在发布或者上传视频时,根据上传视频的类型选择相关的视频标签,但是,这种方法对于视频内容的体现也较片面,且效率较低。
技术实现思路
针对上述问题,本专利技术旨在提供了一种视频标签生成方法及其装置,有效解决现有视频标签较为片面且生成效率低下的问题。本专利技术提供的技术方案如下:一种视频标签生成方法,包括:S1获取视频语音的文字信息;S2将得到的文字信息进行分词并保留其中的名词和动词;S3将得到的名词和动词进行重要性排序获得视频关键词;S4根据视频关键词得到视频标签。进一步优选地,在步骤S2中根据得到的文字信息进行分词的步骤具体为:根据汉语言处理包(HanLanguageProcessing,简称HanLP)中的NLP(Neuro-LinguisticProgramming,神经语言程序学)分词器对文字信息进行分词,并标注分词得到的每个词汇的词性。进一步优选地,在步骤S3,根据得到的名词和动词进行重要性排序获得视频关键词中具体包括:S31分别计算各名词/动词的权重;S32根据各名词/动词的权重及预设视频关键词数量得到视频关键词。进一步优选地,在步骤S4,根据视频关键词得到视频标签中具体包括:S41根据关键词扩展方法对视频关键词进行排序重组,选定候选视频标签;S42计算候选视频标签的权重;S43根据预设视频标签数量及候选视频标签的权重得到视频标签。进一步优选地,在步骤S41中,根据关键词扩展方法对视频关键词进行排序重组,选定候选视频标签具体为:将视频关键词进行排序,并统计其两两组在步骤S1中得到的文字信息中出现的次数,若出现的次数超过预设次数,则选定为候选标签。进一步优选地,在步骤S42中,计算候选视频标签的权重具体为:将视频标签中包括的名词和/或动词的权重相加得到候选视频标签的权重。本专利技术还提供了一种视频标签生成装置,包括:视频语音获取模块,用于获取视频语音;文字信息转换模块,用于将视频语音获取模块获取的视频语音转换为文字信息;分词模块,用于根据文字信息转换模块转换得到的文字信息进行分词并保留其中的名词和动词;视频关键词获取模块,用于将分词模块得到的名词和动词进行重要性排序获得视频关键词;视频标签获取模块,用于根据视频关键词获取模块获取的视频关键词得到视频标签。进一步优选地,在分词模块中:根据汉语言处理包中的NLP分词器对文字信息进行分词,并标注分词得到的每个词汇的词性。进一步优选地,视频关键词获取模块中包括:权重计算单元,用于分别计算分词模块得到的各名词/动词的权重;视频关键词截取单元,用于根据权重计算单元计算的各名词/动词的权重及预设视频关键词数量截取得到视频关键词。进一步优选地,在视频标签获取模块中包括:候选视频标签获取单元,用于根据关键词扩展方法对视频关键词截取单元截取的视频关键词进行排序重组得到候选视频标签;标签权重计算单元,用于计算候选视频标签获取单元获取的候选视频标签的权重;视频标签获取模块,用于根据预设视频标签数量及标签权重计算单元计算得到的候选视频标签的权重得到视频标签。本专利技术提供的视频标签生成方法及其装置,能够带来以下有益效果:在本专利技术提供的视频标签生成方法及其装置中,在不需要人工参与的情况下,根据视频语音对应的文字信息自动生成视频标签,以此自动对视频打标签,得到的视频标签与视频内容完全匹配,不会出现视频标签内容不丰富、较为片面的问题,更准确的丰富视频的标识,以此实现后续对视频更精确的检索。且由于不需要人工参与,大大提高了视频标签的处理效率。附图说明下面将以明确易懂的方式,结合附图说明优选实施方式,对上述特性、技术特征、优点及其实现方式予以进一步说明。图1为本专利技术中视频标签生成方法流程示意图;图2为本专利技术中视频标签生成装置示意图。附图标号说明:100-视频标签生成装置,110-视频语音获取模块,120-文字信息转换模块,130-分词模块,140-视频关键词获取模块,150-视频标签获取模块。具体实施方式为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对照附图说明本专利技术的具体实施方式。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。如图1所示为本专利技术提供的视频标签生成方法流程示意图,从图中可以看出,在该视频标签生成方法中包括:S1获取视频语音的文字信息;S2将得到的文字信息进行分词并保留其中的名词和动词;S3将得到的名词和动词进行重要性排序获得视频关键词;S4根据视频关键词得到视频标签。具体来说,在该视频标签生成方法中,首先,在步骤S1中将需要进行视频标签的视频的语音信息转化为文字信息。之后,在步骤S2中根据得到的文字信息进行分词并将分词得到的名词和动词保留。具体,在该步骤中,根据HanLP中的NLP分词器对文字信息进行分词,并标注分词得到的每个词汇的词性。之后,逐一判断分词得到的词汇是否为名词/动词,若是名词/动词,保留;若不是名词/动词,删除,即将语义词、助词、副词等删除。筛选出文字信息分词得到的名词和动词之后,在步骤S3中进一步得到视频关键词,具体包括:S31分别计算各名词/动词的权重,即对保留的名词/动词做投票算法,得到每个名词/动词的重要性;S32根据各名词/动词的权重及预设视频关键词数量得到视频关键词,即根据依照权重排序,取预设视频关键词数量的动词/名词作为视频关键词。在一个实例中,使用TextRank算法计算各名词/动词的权重。若预设关键词的数量为50,则依照步骤S31中计算得到的各名词/动词的权重排序,按权重从大到小,截取50个作为视频关键词。当然,在其他实施例中,还可以使用其他算法计算各名词/动词的权重,预设关键词的数量也可以设定为其他值,在此不做具体限定。截取出视频关键词之后,在步骤S4中进一步得到视频标签,具体包括:S41根据关键词扩展方法对视频关键词进行排序重组,选定候选视频标签;S42计算候选视频标签的权重;S43根据预设视频标签数量及候选视频标签的权重得到视频标签。具体来说,在步骤S41中,将视频关键词进行排序,并统计其两两组在步骤S1中得到的文字信息中出现的次数,若出现的次数超过预设次数,则选定为候选标签。在步骤S42中,将视频标签中包括的名词和/或动词的权重相加得到候选视频标签的权重。在一个实例中,假若视频语音转化得到的文字信息为:19日3时31分,神舟十一号载人飞船与天宫二号空间实验室成功实现自动交会对接。这是天宫二号自9月15日发射入轨以来,与神舟飞船开展的首次交会对接。在科技人员精确控制下,神舟十一号载人飞船经过多次变轨,于19日1时11分转入自主本文档来自技高网...
一种视频标签生成方法及装置

【技术保护点】
一种视频标签生成方法,其特征在于,所述视频标签生成方法中包括:S1获取视频语音的文字信息;S2将得到的文字信息进行分词并保留其中的名词和动词;S3将得到的名词和动词进行重要性排序获得视频关键词;S4根据视频关键词得到视频标签。

【技术特征摘要】
1.一种视频标签生成方法,其特征在于,所述视频标签生成方法中包括:S1获取视频语音的文字信息;S2将得到的文字信息进行分词并保留其中的名词和动词;S3将得到的名词和动词进行重要性排序获得视频关键词;S4根据视频关键词得到视频标签。2.如权利要求1所述的视频标签生成方法,其特征在于,在步骤S2中根据得到的文字信息进行分词的步骤具体为:根据汉语言处理包中的NLP分词器对文字信息进行分词,并标注分词得到的每个词汇的词性。3.如权利要求1或2所述的视频标签生成方法,其特征在于,在步骤S3,根据得到的名词和动词进行重要性排序获得视频关键词中具体包括:S31分别计算各名词/动词的权重;S32根据各名词/动词的权重及预设视频关键词数量得到视频关键词。4.如权利要求3所述的视频标签生成方法,其特征在于,在步骤S4,根据视频关键词得到视频标签中具体包括:S41根据关键词扩展方法对视频关键词进行排序重组,选定候选视频标签;S42计算候选视频标签的权重;S43根据预设视频标签数量及候选视频标签的权重得到视频标签。5.如权利要求4所述的视频标签生成方法,其特征在于,在步骤S41中,根据关键词扩展方法对视频关键词进行排序重组,选定候选视频标签具体为:将视频关键词进行排序,并统计其两两组在步骤S1中得到的文字信息中出现的次数,若出现的次数超过预设次数,则选定为候选标签。6.如权利要求4或5所述的视频标签生成方法,其特征在于,在步骤S42中,计算候选视频标签的...

【专利技术属性】
技术研发人员:黄建杰朱立松
申请(专利权)人:央视国际网络无锡有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1