一种短视频关键词提取方法技术

技术编号:37540710 阅读:14 留言:0更新日期:2023-05-12 16:09
本发明专利技术公开了一种短视频关键词提取方法,具体步骤如下:步骤一:获取需要提取关键词的短视频,并对短视频进行字幕提取,同时对字幕自动修复、优化,并进行分段,并对无字幕的视频进行智能提取字幕;步骤二:将分段的字幕中关键词进行提取,将提取后的关键词与分段语句中所对应长度的视频进行比对,当比对率为95~100%时,对多余的关键词进行删除;本发明专利技术在对短视频关键词的提取中,通过多种方式对短视频内容进行分析,从而提升生成的关键词准确性,并且能够结合当下时事、流行语生成具有时代性的关键词,给后期短视频提升曝光度,并且能够极大程度的缩短关键词的字数与数量,方便后期整理。整理。

【技术实现步骤摘要】
一种短视频关键词提取方法


[0001]本专利技术属于关键词提取
,具体涉及一种短视频关键词提取方法。

技术介绍

[0002]短视频即短片视频,是一种互联网内容传播方式,一般是在互联网新媒体上传播的时长在5分钟以内的视频;随着移动终端普及和网络的提速,短平快的大流量传播内容逐渐获得各大平台、粉丝和资本的青睐,而为了对短视频的内容进行提取,方便后期对短视频的归整、标题设置等工作,需要将短视频内的关键词进行提取。
[0003]现有对短视频关键词的提取方式主要依托与对图像的截取,并根据图像进行系统分析,从而实现提取关键词的功能,该种技术在公告号CN113591853A中有所体现,而该种技术在对关键词的提取中,仍存在准确度不够、无法结合当下时事、流行语等具有时代性的特点提取、生成关键词,同时也会出现无法精准提取而导致关键词较长,查看繁琐;在后期对关键词的找寻中,一旦录入的关键词数量较多,会造成搜索结果过多,找寻耗时较大的问题,因此实际使用中存在可改进的空间。

技术实现思路

[0004]本专利技术的目的在于提供一种短视频关键词提取方法,以解决上述
技术介绍
中提出的现有对短视频中关键词的提取方式单一,并且生成的关键词不具备时代性特点的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种短视频关键词提取方法,具体步骤如下:
[0006]步骤一:获取需要提取关键词的短视频,并对短视频进行字幕提取,同时对字幕自动修复、优化,并进行分段,并对无字幕的视频进行智能提取字幕;
>[0007]步骤二:将分段的字幕中关键词进行提取,将提取后的关键词与分段语句中所对应长度的视频进行比对,当比对率为95~100%时,对多余的关键词进行删除,反之,当比对率低于95%时,结合视频与语句进行再次提取,直至比对率不低于95%;
[0008]步骤三:将提取的关键词进行合理的时代性替换;
[0009]步骤四:将提取出的所有关键词整合为关键词集,其中整合为关键词集的关键词数量为4~8个,对关键词集进行再一次关键词提取。
[0010]作为本专利技术中一种优选的技术方案,所述步骤一中,在对无字幕视频的智能提取中,根据视频中的动态、静态画面进行分析,配合短视频已有的字幕整合分析。
[0011]作为本专利技术中一种优选的技术方案,所述步骤一中,在对字幕自动修复、优化的方法如下:
[0012]S1:根据视频中的音频生成原声字+中字的组合;
[0013]S2:检测生成的原声字+中字的语句是否连贯、完整,当出现明显不完整时,根据前后段落以及视频画面,智能修复补充;
[0014]S3:对修复优化后的句子根据语义进行断句并根据实际场景对语句添加符号。
[0015]作为本专利技术中一种优选的技术方案,所述步骤二中,比对率为95~100%时,对多余的关键词进行删除中,应当逐个删除,当所删除的关键词对比对率造成影响时,则恢复,反之删除。
[0016]作为本专利技术中一种优选的技术方案,所述比对率的计算方式是根据将关键词整合,并通过关键词能够智能生成完整句子,当生成的句子与原句子语义相同或相近时,则表明比对率不低于95%,反之则低于95%。
[0017]作为本专利技术中一种优选的技术方案,所述步骤三中,完成关键词的替换后,将前后所有的关键词模拟生成完整句子,并查看生成的句子中是否存在语义不清、语句不通的问题,若存在,则摒弃对该关键词的替换。
[0018]作为本专利技术中一种优选的技术方案,所述步骤三中,关键词的替换应当与当下热点、热词进行实时交互。
[0019]作为本专利技术中一种优选的技术方案,所述步骤四中,关键词集的标签总字数为2~6个,并且关键词集的标签能够包含该关键词集内所有的关键词含义。
[0020]与现有技术相比,本专利技术的有益效果是:
[0021]本专利技术在对短视频关键词的提取中,通过多种方式对短视频内容进行分析,从而提升生成的关键词准确性,并且能够结合当下时事、流行语生成具有时代性的关键词,给后期短视频提升曝光度,并且能够极大程度的缩短关键词的字数与数量,方便后期整理,并且本专利技术中引入了关键词集,能够将众多的关键词进行再次整合分离,在对关键词寻找定位中,能够减少搜索出来的结果,提升定位找寻的速度,完善了现有提取方式中功能性不足的问题。
具体实施方式
[0022]下面将结合本专利技术实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0023]实施例1
[0024]本专利技术提供了一种技术方案:一种短视频关键词提取方法,具体步骤如下:
[0025]步骤一:获取需要提取关键词的短视频,并对短视频进行字幕提取,同时对字幕自动修复、优化,并进行分段,并对无字幕的视频进行智能提取字幕;
[0026]步骤二:将分段的字幕中关键词进行提取,将提取后的关键词与分段语句中所对应长度的视频进行比对,当比对率为95%时,对多余的关键词进行删除,反之,当比对率低于95%时,结合视频与语句进行再次提取,直至比对率不低于95%;
[0027]步骤三:将提取的关键词进行合理的时代性替换;
[0028]步骤四:将提取出的所有关键词整合为关键词集,其中整合为关键词集的关键词数量为4个,对关键词集进行再一次关键词提取。
[0029]本实施例中,步骤一中,在对无字幕视频的智能提取中,根据视频中的动态、静态画面进行分析,配合短视频已有的字幕整合分析,如,短视频前段字幕中提取的“日落、海边、贝壳”,而短视频后段无字幕,所体现的画面为单人行走,则会自动生成关键词“孤单、想
念”。
[0030]本实施例中,步骤一中,在对字幕自动修复、优化的方法如下:
[0031]S1:根据视频中的音频生成原声字+中字的组合;
[0032]S2:检测生成的原声字+中字的语句是否连贯、完整,当出现明显不完整时,根据前后段落以及视频画面,智能修复补充,如当生成的语句为“这一个风丽的地方”,该句当中的“风丽”明显为语句错误的描述,同时“这一”语句不通顺,此时根据前后的语义以及视频中与该句子对应的视频来分析,从而自动生成为“这是一个风景美丽的地方”,完成修复和优化,同时根据视频中的音频的平仄以及体现的情绪、引入的歌曲以及该该歌曲表达的含义配合生成字幕的标点符号,以及对关键词的影响;
[0033]S3:对修复优化后的句子根据语义进行断句并根据实际场景对语句添加符号,如修复优化后的句子为“这是一个风景美丽的地方我很喜欢它”,通过断句以及根据视频场景标号,生成为“这是一个风景美丽的地方,我很喜欢它!”。
[0034]本实施例中,步骤二中,比对率为95%时,对多余的关键词进行删除中,应当逐个删除,如当对句子“这片山峰十分秀丽,给人的感觉也十分壮观,真的好美啊本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种短视频关键词提取方法,其特征在于:具体步骤如下:步骤一:获取需要提取关键词的短视频,并对短视频进行字幕提取,同时对字幕自动修复、优化,并进行分段,并对无字幕的视频进行智能提取字幕;步骤二:将分段的字幕中关键词进行提取,将提取后的关键词与分段语句中所对应长度的视频进行比对,当比对率为95~100%时,对多余的关键词进行删除,反之,当比对率低于95%时,结合视频与语句进行再次提取,直至比对率不低于95%;步骤三:将提取的关键词进行合理的时代性替换;步骤四:将提取出的所有关键词整合为关键词集,其中整合为关键词集的关键词数量为4~8个,对关键词集进行再一次关键词提取。2.根据权利要求1所述的一种短视频关键词提取方法,其特征在于:所述步骤一中,在对无字幕视频的智能提取中,根据视频中的动态、静态画面进行分析,配合短视频已有的字幕整合分析。3.根据权利要求1所述的一种短视频关键词提取方法,其特征在于:所述步骤一中,在对字幕自动修复、优化的方法如下:S1:根据视频中的音频生成原声字+中字的组合;S2:检测生成的原声字+中字的语句是否连贯、完整,当出现明显不完整时,根据前后段落以及视频画面,智能修复...

【专利技术属性】
技术研发人员:付勇王超郑晨梦黄凯
申请(专利权)人:湖南润科通信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1