音频质量确定方法、异常检测方法、系统、设备及介质技术方案

技术编号:37074269 阅读:15 留言:0更新日期:2023-03-29 19:51
本申请提供音频质量确定方法、异常检测方法、系统、设备及介质,该音频质量确定方法包括获取增强音频数据和第一系统参数,根据第一音频通道数、第一采样个数及第一采样位数,确定增强音频数据中单位时间内播放的音频的数据量,基于第一采样频率,确定增强音频数据中每帧音频数据的播放时长,按照增强音频数据中单位时间内播放的音频的数据量读取增强音频数据,在增强音频数据中每帧音频数据的播放时长内,基于增强音频数据中单位时间内播放的音频的数据量,确定增强音频数据中每帧音频的质量,若音频质量存在异常,可根据异常对应帧音频数据确定音频异常位置。频数据确定音频异常位置。频数据确定音频异常位置。

【技术实现步骤摘要】
音频质量确定方法、异常检测方法、系统、设备及介质


[0001]本申请涉及智能控制
,具体涉及音频质量确定方法、异常检测方法、系统、设备及介质。

技术介绍

[0002]近年来,随着互联网软件技术的发展,为满足人们对软件使用方便的需求,语音类软件开发开始兴起并获得快速发展。这些语音类软件可以为用户提供语音设置、语音拨通、语音社交等多种功能,这些多样化的功能服务可以为用户带来个性化的使用体验。
[0003]在实际的研发过程中,语音开发环境中会存在很多问题,当语音开发过程中遇到无法唤醒或者识别语音设备时,通常会需要依赖各种检测工具对语音音频进行分析。随着设备的智能化发展趋势,需要降低对检测设备的依赖性,故而亟需一种对于音频异常的检测方法,以实现音频异常的检测的智能化。
[0004]相关技术中通过将音频数据通过傅里叶变换得到频域信息,进而通过检测两个时间段的声音频率,判断音频播放装置或音频接收装置是否存在异常。然而,从音频接收装置出来的音频与经过语音增强后的音频数据存在差异性,无法获知异常点的位置。

技术实现思路

[0005]鉴于以上所述现有技术的缺点,本专利技术提供音频质量确定方法、异常检测方法、系统、设备及介质,以解决上述相关技术中通过将音频数据通过傅里叶变换得到频域信息,进而通过检测两个时间段的声音频率,判断音频播放装置或音频接收装置是否存在异常,从音频接收装置出来的音频与经过语音增强后的音频数据存在差异性,无法获知异常点的位置的技术问题。
[0006]为实现上述目的,第一个方面,本申请提供一种音频质量确定方法,所述音频质量确定方法包括:
[0007]获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
[0008]根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;
[0009]基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;
[0010]按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;
[0011]在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。
[0012]在本申请的一示例性实施例中,确定所述增强音频数据中每帧音频的质量,包括:
[0013]在所述每帧音频数据的播放时长内,将增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;
[0014]在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将增强音频数据中相应帧音频数据的质量确定为静音;
[0015]在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在所述每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第一次数;
[0016]若所述第一次数大于预设第一次数阈值,将增强音频数据中相应帧音频的质量确定为破音。
[0017]在本申请的一示例性实施例中,所述音频质量确定方法还包括:
[0018]获取原始音频数据和第二系统参数,所述第二系统参数为对原始音频数据进行采样的采样系统的参数,所述第二系统参数包括第二采样频率、第二音频通道数、第二采样个数及第二采样位数;
[0019]根据所述第二音频通道数、第二采样个数及第二采样位数,确定所述原始音频数据中单位时间内播放的音频的数据量;
[0020]基于所述第二采样频率,确定所述原始音频数据中每帧音频数据的播放时长;
[0021]按照所述原始音频数据中单位时间内播放的音频的数据量读取所述原始音频数据;
[0022]在原始音频数据中每帧音频数据的播放时长内,基于所述原始音频数据中单位时间内播放的音频的数据量,确定所述原始音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。
[0023]在本申请的一示例性实施例中,确定所述原始音频数据中每帧音频的质量,包括:
[0024]在所述每帧音频数据的播放时长内,将原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;
[0025]在所述每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将原始音频数据中相应帧音频数据的质量确定为静音;
[0026]在所述每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在所述每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第二次数;
[0027]若所述第二次数大于预设第二次数阈值,将原始音频数据中相应帧音频的质量确定为破音。
[0028]第二个方面,本申请提供一种音频异常检测方法,所述音频异常检测方法包括:
[0029]获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
[0030]根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;
[0031]基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;
[0032]按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;
[0033]在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。
[0034]若所述增强音频数据中音频的质量为静音或破音,将静音或破音对应帧音频数据确定为音频异常位置。
[0035]第三个方面,本申请提供一种音频质量确定系统,所述音频质量确定系统包括:
[0036]采集模块,用于获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;
[0037]第一确定模块,用于根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;
[0038]第二确定模块,用于基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;
...

【技术保护点】

【技术特征摘要】
1.一种音频质量确定方法,其特征在于,所述音频质量确定方法包括:获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;按照所述增强音频数据中单位时间内播放的音频的数据量读取所述增强音频数据;在增强音频数据中每帧音频数据的播放时长内,基于所述增强音频数据中单位时间内播放的音频的数据量,确定所述增强音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。2.根据权利要求1所述的音频质量确定方法,其特征在于,确定所述增强音频数据中每帧音频的质量,包括:在所述每帧音频数据的播放时长内,将增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将增强音频数据中相应帧音频数据的质量确定为静音;在所述每帧音频数据的播放时长内,若增强音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在所述每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第一次数;若所述第一次数大于预设第一次数阈值,将增强音频数据中相应帧音频的质量确定为破音。3.根据权利要求1所述的音频质量确定方法,其特征在于,所述音频质量确定方法还包括:获取原始音频数据和第二系统参数,所述第二系统参数为对原始音频数据进行采样的采样系统的参数,所述第二系统参数包括第二采样频率、第二音频通道数、第二采样个数及第二采样位数;根据所述第二音频通道数、第二采样个数及第二采样位数,确定所述原始音频数据中单位时间内播放的音频的数据量;基于所述第二采样频率,确定所述原始音频数据中每帧音频数据的播放时长;按照所述原始音频数据中单位时间内播放的音频的数据量读取所述原始音频数据;在原始音频数据中每帧音频数据的播放时长内,基于所述原始音频数据中单位时间内播放的音频的数据量,确定所述原始音频数据中每帧音频的质量,所述每帧音频的质量包括静音和破音。4.根据权利要求3所述的音频质量确定方法,其特征在于,确定所述原始音频数据中每帧音频的质量,包括:在所述每帧音频数据的播放时长内,将原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量与0进行比较;
在所述每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中各单位时间内播放的音频的数据量均为0,将原始音频数据中相应帧音频数据的质量确定为静音;在所述每帧音频数据的播放时长内,若原始音频数据中每帧音频数据中部分单位时间内播放的音频的数据量大于0或每帧音频数据中所有单位时间内播放的音频的数据均大于0,获取在所述每帧音频数据的播放时长内每帧音频数据中连续单位时间内播放的音频的数据量大于预设数据量阈值的第二次数;若所述第二次数大于预设第二次数阈值,将原始音频数据中相应帧音频的质量确定为破音。5.一种音频异常检测方法,其特征在于,所述音频异常检测方法包括:获取增强音频数据和第一系统参数,所述第一系统参数为对原始音频数据进行语音增强后得到的增强音频数据进行采样的采样系统的参数,所述第一系统参数包括第一采样频率、第一音频通道数、第一采样个数及第一采样位数;根据所述第一音频通道数、第一采样个数及第一采样位数,确定所述增强音频数据中单位时间内播放的音频的数据量;基于所述第一采样频率,确定所述增强音频数据中每帧音频数据的播放时长;...

【专利技术属性】
技术研发人员:王雪高斯雄
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1