一种音视频的音频处理控制系统技术方案

技术编号:37997527 阅读:8 留言:0更新日期:2023-06-30 10:11
本发明专利技术公开了一种音视频的音频处理控制系统,涉及音频处理技术领域,包括:音视信息获取导入模块获取用户输入目标制作软件的科研音视频,音视检测分析模块提取科研音频文件和科研视频文件中的音频标识特征数据,并根据音频标识特征数据对科研音频文件进行音频质量检测,以获取音频质量检测分析结果;检测分析结果判断模块判断音频质量检测分析结果是否为中高音频质量标记,若为中高音频质量标记,则将中高音频质量标记作为第一检测结果;音视同步模块基于第一检测结果对科研音频文件和科研视频文件进行科研视频文件基准下的音视同步控制。同步控制。同步控制。

【技术实现步骤摘要】
一种音视频的音频处理控制系统


[0001]本专利技术涉及音频处理
,尤其涉及一种音视频的音频处理控制系统。

技术介绍

[0002]随着高新技术的不断发展,越来越多的企业和科研人员需要在科研过程中进行科研材料的音视频制作和报告,在科研领域的音视频制作过程中,音频和视频的同步是非常重要的;若存在音视频不同步不仅影响科研音视频材料的质量,还会影响到后续数据分析的准确性和科学研究的可信度;然而经专利技术人针对当下科研音视频系统研究应用发现,当前在科研音视频处理过程中仍存在以下缺陷:(1)在利用科研音视频制作软件制作科研音视频材料报告时,缺乏对科研音视频的质量自动检测,无法发现科研音视频的细微缺陷,易导致后续播放效果不佳;(2)在利用科研音视频制作软件制作科研音视频材料报告时,缺乏对科研音视频制作过程的同步检测,需用户自己进行肉眼识别,费时费力,易增加用户的科研音视频制作时间;(3)在利用科研音视频制作软件制作科研音视频材料报告时,若产生音视不同步,需重新逐步回调,且在重新回调过程中需要人工手动进行科研音视频的同步处理,若用户缺乏手动同步处理控制的经验,会使得制作出来的科研音视频材料同步精度较低,且制作效率较低。
[0003]目前,现有音频处理控制系统在解决音视频不同步问题上时大多通过引入时间戳的方式实现,例如:申请公开号为CN112243145A的中国专利公开了音频与视频同步方法和音频与视频处理装置,该专利技术虽然通过计算第一出现时戳与主控时戳之间的第一时戳差值以及第二出现时戳与主控时戳之间的第二时戳差值,实现了音视频同步,但时间戳极易产生误差累计,且在伴随音频丢帧或视频丢帧而引起的音频时间戳缺失或视频时间戳缺失时,上述方式无法解决该情况下的同步问题,进而极易降低科研音视频材料制作的效率以及后续科研音视频材料的播放效果。
[0004]鉴于此,本专利技术提出一种音视频的音频处理控制系统以解决上述问题。

技术实现思路

[0005]本专利技术的目的是解决现有技术中存在的缺陷,而提出的一种音视频的音频处理控制系统。
[0006]为了实现上述目的,本专利技术采用了如下技术方案:一种音视频的音频处理控制系统,包括:音视信息获取导入模块,用于获取用户输入目标制作软件的科研音视频,所述科研音视频包括至少一个科研音频文件和至少一个科研视频文件;音视检测分析模块,包括第一音视检测分析单元,所述第一音视检测分析单元用于提取科研音频文件和科研视频文件中的音频标识特征数据,并根据音频标识特征数据对
所述科研音频文件进行音频质量检测,以获取音频质量检测分析结果;所述音频标识特征数据包括第一音频标识特征数据和第二音频标识特征数据;检测分析结果判断模块,用于判断所述音频质量检测分析结果是否为中高音频质量标记,若为中高音频质量标记,则将中高音频质量标记作为第一检测结果;音视同步模块,包括第一同步控制处理单元,所述第一同步控制处理单元用于基于所述第一检测结果对所述科研音频文件和科研视频文件进行科研视频文件基准下的音视同步控制。
[0007]进一步地,对所述科研音频文件进行音频质量检测前,还包括:提取所述科研音频文件中的第一音频标记和第二音频标记,并提取科研视频文件中的第一视频标记和第二视频标记;将位于第一音频标记与第二音频标记之间的科研音频文件进行等分划分,以获取j个音频数据段,j={1、2、3、

、J},将位于第一视频标记与第二视频标记之间的科研视频文件进行等分划分,以获取g个视频数据段,g={1、2、3、

、G};随机提取j

k个音频数据段内的科研音频文件播放时长,k为大于等于1的正整数,且k<j,并提取与j

k个音频数据段对应视频数据段内的科研视频数据播放时长;将j

k个音频数据段内的科研音频文件播放时长与对应视频数据段内的科研视频数据播放时长进行公式化计算,以获取时间判断系数QT,,式中:表示第v个音频数据段的科研音频文件播放时长,表示第v个视频数据段的科研视频数据播放时长,v={1、2、3、

、V};判断所述时间判断系数QT是否等于设定时间判定常数,若等于,则确定所述科研音频文件与科研视频文件音视同步,若不等于,则确定所述科研音频文件与科研视频文件音视不同步。
[0008]进一步地,提取科研音频文件和科研视频文件中的音频标识特征数据,并根据音频标识特征数据对所述科研音频文件进行音频质量检测,包括:对科研音频文件进行播放显示,提取播放显示中所述科研音频文件的前景音频和背景音频,并分别提取每一前景音频帧的时间戳以及对应背景音频帧的时间戳;将相邻两前景音频帧的时间戳的差值与预设第一音频差值阈值进行比较,若相邻两前景音频帧的时间戳的差值大于预设第一音频差值阈值,则将相邻两前景音频帧的时间戳的差值标记为第一音频标识特征数据;并将相邻两前景音频帧和背景音频帧的时间戳的差值与预设第二音频差值阈值进行比较,若相邻两前景音频帧和背景音频帧的时间戳的差值大于预设第二音频差值阈值,则将相邻两前景音频帧和背景音频帧的时间戳的差值标记为第二音频标识特征数据;分别提取第一音频标识特征数据和第二音频标识特征数据的数据个数,以及分别提取第一音频标识特征数据和第二音频标识特征数据的数据长度;分别统计第一音频标识特征数据的个数总数和第二音频标识特征数据的个数总数,并对第一音频标识特征数据的个数总数、第二音频标识特征数据的个数总数与第一音频标识特征数据的数据长度和第二音频标识特征数据的数据长度归一化处理后进行公式
化计算,以获取音频质量判断系数AQ,,式中:表示第一音频标识特征数据的个数总数,表示第二音频标识特征数据的个数总数,表示第e个第一音频标识特征数据的数据长度,表示第h个第二音频标识特征数据的数据长度,、、和为不为零权重系数,;设置音频评价阈值KT1和KT2,KT1<KT2,将音频质量判断系数AQ与音频评价阈值KT1和KT2进行比对,得到音频质量检测分析结果,所述音频质量检测分析结果包括低音频质量标记、中高音频质量标记和高音频质量标记中的一种。
[0009]进一步地,基于所述第一检测结果对所述科研音频文件和科研视频文件进行科研视频文件基准下的音视同步控制,包括:获取每一帧所述科研视频文件的时间对应值;提取每一帧所述科研音频文件中的有效初始音频帧和有效末尾音频帧,获取有效初始音频帧的时间对应值和有效末尾音频帧的时间对应值;据所述视频帧率获取每一帧下科研视频文件的播放时刻值;根据每一帧下科研视频文件的播放时刻值对有效初始音频帧的时间对应值进行循环赋值,直至赋值到有效末尾音频帧时停止循环赋值,得到若干个循环音频时间对应值以及有效末尾音频帧的赋值时刻值;判断有效末尾音频帧的赋值时刻值与有效末尾音频帧的时间对应值的差值是否大于预设有效音频差值阈值,若大于预设有效音频差值阈值,则将有效末尾音频帧的赋值时刻值与有效末尾音频帧的时间对应值的差值作为误差数据,并根据误差数据对每个循环音频时间对应值进行校正,根据校正后循环音频时间对应值对所述科研音频文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音视频的音频处理控制系统,其特征在于,包括:音视信息获取导入模块,用于获取输入目标制作软件的科研音视频,所述科研音视频包括至少一个科研音频文件和至少一个科研视频文件;音视检测分析模块,包括第一音视检测分析单元,所述第一音视检测分析单元用于提取科研音频文件和科研视频文件中的音频标识特征数据,并根据音频标识特征数据对所述科研音频文件进行音频质量检测,以获取音频质量检测分析结果;所述音频标识特征数据包括第一音频标识特征数据和第二音频标识特征数据;检测分析结果判断模块,用于判断所述音频质量检测分析结果是否为中高音频质量标记,若为中高音频质量标记,则将中高音频质量标记作为第一检测结果;音视同步模块,包括第一同步控制处理单元,所述第一同步控制处理单元基于所述第一检测结果对所述科研音频文件和科研视频文件进行科研视频文件基准下的音视同步控制。2.根据权利要求1所述的一种音视频的音频处理控制系统,其特征在于,对所述科研音频文件进行音频质量检测前,还包括:提取所述科研音频文件中的第一音频标记和第二音频标记,并提取科研视频文件中的第一视频标记和第二视频标记;将位于第一音频标记与第二音频标记之间的科研音频文件进行等分划分,以获取j个音频数据段,j={1、2、3、

、J},将位于第一视频标记与第二视频标记之间的科研视频文件进行等分划分,以获取g个视频数据段,g={1、2、3、

、G};随机提取j

k个音频数据段内的科研音频文件播放时长,k为大于等于1的正整数,且k<j,并提取与j

k个音频数据段对应视频数据段内的科研视频数据播放时长;将j

k个音频数据段内的科研音频文件播放时长与对应视频数据段内的科研视频数据播放时长进行公式化计算,以获取时间判断系数QT,,式中:表示第v个音频数据段的科研音频文件播放时长,表示第v个视频数据段的科研视频数据播放时长,v={1、2、3、

、V};判断所述时间判断系数QT是否等于设定时间判定常数,若等于,则确定所述科研音频文件与科研视频文件音视同步,若不等于,则确定所述科研音频文件与科研视频文件音视不同步。3.根据权利要求2所述的一种音视频的音频处理控制系统,其特征在于,提取科研音频文件和科研视频文件中的音频标识特征数据,并根据音频标识特征数据对所述科研音频文件进行音频质量检测,包括:对科研音频文件进行播放显示,提取播放显示中所述科研音频文件的前景音频和背景音频,并分别提取每一前景音频帧的时间戳以及对应背景音频帧的时间戳;将相邻两前景音频帧的时间戳的差值与预设第一音频差值阈值进行比较,若相邻两前景音频帧的时间戳的差值大于预设第一音频差值阈值,则将相邻两前景音频帧的时间戳的差值标记为第一音频标识特征数据;并将相邻两前景音频帧和背景音频帧的时间戳的差值与预设第二音频差值阈值进行比较,若相邻两前景音频帧和背景音频帧的时间戳的差值大
于预设第二音频差值阈值,则将相邻两前景音频帧和背景音频帧的时间戳的差值标记为第二音频标识特征数据;分别提取第一音频标识特征数据和第二音频标识特征数据的数据个数,以及分别提取第一音频标识特征数据和第二音频标识特征数据的数据长度;分别统计第一音频标识特征数据的个数总数和第二音频标识特征数据的个数总数,并对第一音频...

【专利技术属性】
技术研发人员:张巧霞宗建新刘恋恋孟书铖
申请(专利权)人:江苏弦外音智造科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1