一种视频内容理解方法、装置、电子设备和存储介质制造方法及图纸

技术编号:32235490 阅读:25 留言:0更新日期:2022-02-09 17:39
本发明专利技术公开了一种视频内容理解方法、装置、电子设备和存储介质,听取原视频中的第一语音;对所述第一语音进行识别、翻译,得到第二语音;确定第二语音的语速,确定第二语音地听取时长,获取第二语音的音量变化,获取第二语音的各个字节之间的间隔;根据所述目标字幕的显示速度生成所述第二语音对应的识别字幕;根据第一语音的长度和所述识别字幕的默认显示速度,确定所述识别字幕的默认显示时长。该视频内容理解方法、装置、电子设备和存储介质,设置有字幕添加功能,通过字幕对视频内容的音频展示进行补充,增加原视频内容的传播方式,使原视频的内容更加容易被理解,也能够防止对原视频内容的误解,提高信息传输的正确性。提高信息传输的正确性。

【技术实现步骤摘要】
一种视频内容理解方法、装置、电子设备和存储介质


[0001]本专利技术涉及信息
,具体为一种视频内容理解方法、装置、电子设备和存储介质。

技术介绍

[0002]信息技术使用计算机来存储、检索、传输和操作数据或信息,通常用在商业或其他企业环境中。信息技术被认为是信息和通信技术的一个子集。一个信息技术系统通常是一个信息系统、通信系统,或者更具体地说是一个由有限用户群体操作的计算机系统,它包括所有硬件、软件和外围设备,其中视频内容就是信息技术运用的一种体现,通过对一些视频信息的采集、传播、观看,达到快速交流的目的,而现有的一些视频内容,进行具备音频显示功能,声音的理解范围很广,容易导致人民对视频内容的理解产生偏差,导致信息传输错误。
[0003]所以我们提出了一种视频内容理解方法、装置、电子设备和存储介质,以便于解决上述中提出的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种视频内容理解方法、装置、电子设备和存储介质,以解决上述
技术介绍
提出的目前市场上现有的一些视频内容,进行具备音频显示功能,声音的理解范围很广,容易导致人民对视频内容的理解产生偏差,导致信息传输错误的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种视频内容理解方法,其特征在于:所述理解方法包括:
[0006](1)听取原视频中的第一语音;
[0007](2)对所述第一语音进行识别、翻译,得到第二语音;
[0008](3)确定第二语音的语速,确定第二语音地听取时长,获取第二语音的音量变化,获取第二语音的各个字节之间的间隔;
[0009](4)根据所述目标字幕的显示速度生成所述第二语音对应的识别字幕;
[0010](5)根据第一语音的长度和所述识别字幕的默认显示速度,确定所述识别字幕的默认显示时长;
[0011](6)判断所述任意一段字幕的实际显示时长与默认显示时长的大小;
[0012]若所述任意一段字幕显示时长大于或等于所述默认时长,则判断所述第二语音的长度是否在预设的范围内;
[0013]若所述第二语音的长度在所述预设范围内,则增加识别字幕的显示速度,或者提高第二语音的时长,使得所述第二语音的长度与所述识别字幕的显示时长相对应,使第二语音的长度与识别字幕的显示时长之间的第一差异值小于或等于第一限定值;
[0014]若所述任意一段字幕的显示时长小于所述默认时长,且所述任意一段字幕的显示时长和所述默认时长之间的第二差异小于或等于第二限定值,则所述第二语音的显示时长
为所述任意一段字幕对应的时间,所述识别字幕的显示速度为所述默认显示速度;
[0015](7)将所述识别字幕与第二语音之间识别配对,得到第三语音;
[0016](8)将所述原视频中的所述第一语音替换为所述第三语音,得到目标视频,并在所述目标视频中与所述识别字幕的显示时长对应的片段中显示所述识别字幕。
[0017]优选的,所述增加识别字幕的显示速度,或者提高第二语音的时长,包括:在所述识别字幕的默认显示速度的基准上,逐渐增加识别字幕的显示速度;
[0018]若所述识别字幕的显示速度达到显示速度的最大极限值,且所述第一差异大于第一限定值,则在第二语音的播放时长在识别字幕显示时长的基础上,逐渐降低第二语音的语速,增加第二语音的播放时长,直到第一差异小于第一限定值。
[0019]优选的,所述增加识别字幕的显示速度,或者提高第二语音的时长,包括:在所述第二语音的默认时长的基础上,逐渐增加第二语音的播放时长;
[0020]若第二语音的播放时长达到最大值,且所述第一差异大于第一限定值,则在所述识别弹幕的默认显示速度的基准上,逐渐增加识别弹幕的显示速度,直到第一差异小于第一限定值。
[0021]优选的,所述增加识别字幕的显示速度,或者提高第二语音的时长,包括:在所述识别字幕的默认显示速度的基准上,逐渐增加识别字幕的显示速度,同时在所述第二语音的默认时长的基础上,逐渐增加第二语音的播放时长,直到所述第一差异大于第一限定值。
[0022]优选的,所述增加第二语音的播放时长,通过降低任意一段视频的播放速度来完成,所述增加识别字幕的显示速度,通过加速字幕替换速度来完成。
[0023]优选的,所述任一段识别字幕的时长小于所述默认时长,且所述任一段识别字幕的时长和所述默认时长之间的第二差异大于第二限定值,则确定所述第二语音的长度是否在预设范围内;若所述第二语音的长度在所述预设范围内,则增加所述识别字幕的显示时长,或降低所述第二语音的时长,使得所述识别字幕的显示时长与所述第二语音的播放时长之间相对应。
[0024]优选的,所述增加所述目标字幕的显示时长,或降低所述第二语音的时长,包括:在所述识别字幕的默认显示速度之上,逐渐降低显示速度,若显示速度已到达最低值,且所述第一差异大于第一限定值,则在所述第二语音的默认播放速度的基准上,逐渐增加第二语音的播放速度,直到第一差异小于第一限定值;在所述第二语音的默认播放速度的基准上,逐渐增加第二语音的播放速度,若播放速度已到达最大值,第一差异大于第一限定值,在所述识别字幕的默认显示速度之上,逐渐降低显示速度直到第一差异小于第一限定值;在所述识别字幕的默认显示速度之上和在所述第二语音的默认播放速度的基准上,同时降低显示速度和增加第二语音的播放速度,直到第一差异小于第一限定值。
[0025]一种视频处理装置,包括:
[0026]提取模块,用于获取原视频中的第一语音;
[0027]转换模块,用于对所述语音进行识别、翻译,得到第二语音;
[0028]判断模块,用于获取第二语音的音量变化,获取第二语音的各个字节之间的间隔;
[0029]处理模块,用于确定字幕的目标显示速度;
[0030]字幕模块,用于根据所述字幕的目标显示速度生成所述第二语音对应的识别字幕。
[0031]一种视频用电子设备和存储介质,所述电子设备包括:一个处理器,用于运行一个或多个程序,使一个或者多个程序按照权利要求1所述的方法来处理视频;所述存储介质,为一种计算机可读存储设备,用于执行程序和视频数据的存储。
[0032]与现有技术相比,本专利技术的有益效果是:该视频内容理解方法、装置、电子设备和存储介质,设置有字幕添加功能,通过字幕对视频内容的音频展示进行补充,增加原视频内容的传播方式,使原视频的内容更加容易被理解,也能够防止对原视频内容的误解,提高信息传输的正确性。
具体实施方式
[0033]下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]一种视频内容理解方法,所述理解方法包括:
[0035](1)听取原视频中的第一语音,该第一语音为视频中一整段话的语音,第一语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频内容理解方法,其特征在于:所述理解方法包括:(1)听取原视频中的第一语音;(2)对所述第一语音进行识别、翻译,得到第二语音;(3)确定第二语音的语速,确定第二语音地听取时长,获取第二语音的音量变化,获取第二语音的各个字节之间的间隔;(4)根据所述目标字幕的显示速度生成所述第二语音对应的识别字幕;(5)根据第一语音的长度和所述识别字幕的默认显示速度,确定所述识别字幕的默认显示时长;(6)判断所述任意一段字幕的实际显示时长与默认显示时长的大小;若所述任意一段字幕显示时长大于或等于所述默认时长,则判断所述第二语音的长度是否在预设的范围内;若所述第二语音的长度在所述预设范围内,则增加识别字幕的显示速度,或者提高第二语音的时长,使得所述第二语音的长度与所述识别字幕的显示时长相对应,使第二语音的长度与识别字幕的显示时长之间的第一差异值小于或等于第一限定值;若所述任意一段字幕的显示时长小于所述默认时长,且所述任意一段字幕的显示时长和所述默认时长之间的第二差异小于或等于第二限定值,则所述第二语音的显示时长为所述任意一段字幕对应的时间,所述识别字幕的显示速度为所述默认显示速度;(7)将所述识别字幕与第二语音之间识别配对,得到第三语音;(8)将所述原视频中的所述第一语音替换为所述第三语音,得到目标视频,并在所述目标视频中与所述识别字幕的显示时长对应的片段中显示所述识别字幕。2.根据权利要求1所述的一种视频内容理解方法,其特征在于:所述增加识别字幕的显示速度,或者提高第二语音的时长,包括:在所述识别字幕的默认显示速度的基准上,逐渐增加识别字幕的显示速度;若所述识别字幕的显示速度达到显示速度的最大极限值,且所述第一差异大于第一限定值,则在第二语音的播放时长在识别字幕显示时长的基础上,逐渐降低第二语音的语速,增加第二语音的播放时长,直到第一差异小于第一限定值。3.根据权利要求1所述的一种视频内容理解方法,其特征在于:所述增加识别字幕的显示速度,或者提高第二语音的时长,包括:在所述第二语音的默认时长的基础上,逐渐增加第二语音的播放时长;若第二语音的播放时长达到最大值,且所述第一差异大于第一限定值,则在所述识别弹幕的默认显示速度的基准上,逐渐增加识别弹幕的显示速度,直到第一差异小于第一限定值。4.根据权利要求1所述的一种视频内容理解方法,其特征在于:所述...

【专利技术属性】
技术研发人员:张寒冰潘磊
申请(专利权)人:上海大晓智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1