一种视频内容理解方法、装置、电子设备和存储介质制造方法及图纸

技术编号：32235490 阅读：42 留言：0更新日期：2022-02-09 17:39

本发明专利技术公开了一种视频内容理解方法、装置、电子设备和存储介质，听取原视频中的第一语音；对所述第一语音进行识别、翻译，得到第二语音；确定第二语音的语速，确定第二语音地听取时长，获取第二语音的音量变化，获取第二语音的各个字节之间的间隔；根据所述目标字幕的显示速度生成所述第二语音对应的识别字幕；根据第一语音的长度和所述识别字幕的默认显示速度，确定所述识别字幕的默认显示时长。该视频内容理解方法、装置、电子设备和存储介质，设置有字幕添加功能，通过字幕对视频内容的音频展示进行补充，增加原视频内容的传播方式，使原视频的内容更加容易被理解，也能够防止对原视频内容的误解，提高信息传输的正确性。提高信息传输的正确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频内容理解方法、装置、电子设备和存储介质

[0001]本专利技术涉及信息
，具体为一种视频内容理解方法、装置、电子设备和存储介质。

技术介绍

[0002]信息技术使用计算机来存储、检索、传输和操作数据或信息，通常用在商业或其他企业环境中。信息技术被认为是信息和通信技术的一个子集。一个信息技术系统通常是一个信息系统、通信系统，或者更具体地说是一个由有限用户群体操作的计算机系统，它包括所有硬件、软件和外围设备，其中视频内容就是信息技术运用的一种体现，通过对一些视频信息的采集、传播、观看，达到快速交流的目的，而现有的一些视频内容，进行具备音频显示功能，声音的理解范围很广，容易导致人民对视频内容的理解产生偏差，导致信息传输错误。
[0003]所以我们提出了一种视频内容理解方法、装置、电子设备和存储介质，以便于解决上述中提出的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种视频内容理解方法、装置、电子设备和存储介质，以解决上述
技术介绍
提出的目前市场上现有的一些视频内容，进行具备音频显示...

【技术保护点】

【技术特征摘要】
1.一种视频内容理解方法，其特征在于：所述理解方法包括：(1)听取原视频中的第一语音；(2)对所述第一语音进行识别、翻译，得到第二语音；(3)确定第二语音的语速，确定第二语音地听取时长，获取第二语音的音量变化，获取第二语音的各个字节之间的间隔；(4)根据所述目标字幕的显示速度生成所述第二语音对应的识别字幕；(5)根据第一语音的长度和所述识别字幕的默认显示速度，确定所述识别字幕的默认显示时长；(6)判断所述任意一段字幕的实际显示时长与默认显示时长的大小；若所述任意一段字幕显示时长大于或等于所述默认时长，则判断所述第二语音的长度是否在预设的范围内；若所述第二语音的长度在所述预设范围内，则增加识别字幕的显示速度，或者提高第二语音的时长，使得所述第二语音的长度与所述识别字幕的显示时长相对应，使第二语音的长度与识别字幕的显示时长之间的第一差异值小于或等于第一限定值；若所述任意一段字幕的显示时长小于所述默认时长，且所述任意一段字幕的显示时长和所述默认时长之间的第二差异小于或等于第二限定值，则所述第二语音的显示时长为所述任意一段字幕对应的时间，所述识别字幕的显示速度为所述默认显示速度；(7)将所述识别字幕与第二语音之间识别配对，得到第三语音；(8)将所述原视频中的所述第一语音替换为所述第三语音，得到目标视频，并在所述目标视频中与所述识别字幕的显示时长对应的片段中显示所述识别字幕。2.根据权利要求1所述的一种视频内容理解方法，其特征在于：所述增加识别字幕的显示速度，或者提高第二语音的时长，包括：在所述识别字幕的默认显示速度的基准上，逐渐增加识别字幕的显示速度；若所述识别字幕的显示速度达到显示速度的最大极限值，且所述第一差异大于第一限定值，则在第二语音的播放时长在识别字幕显示时长的基础上，逐渐降低第二语音的语速，增加第二语音的播放时长，直到第一差异小于第一限定值。3.根据权利要求1所述的一种视频内容理解方法，其特征在于：所述增加识别字幕的显示速度，或者提高第二语音的时长，包括：在所述第二语音的默认时长的基础上，逐渐增加第二语音的播放时长；若第二语音的播放时长达到最大值，且所述第一差异大于第一限定值，则在所述识别弹幕的默认显示速度的基准上，逐渐增加识别弹幕的显示速度，直到第一差异小于第一限定值。4.根据权利要求1所述的一种视频内容理解方法，其特征在于：所述...

【专利技术属性】
技术研发人员：张寒冰，潘磊，
申请(专利权)人：上海大晓智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人