【技术实现步骤摘要】
串音数据检测方法和电子设备
本说明书涉及计算机
,特别涉及串音数据检测方法和电子设备。
技术介绍
在现实生活中,人们会在一起沟通、讨论事项。在一些场景中,可以使用麦克风对声源进行放大,现场多个麦克风可以采集每个角色的音频数据。在一些情况下,两个以上麦克风距离很近的情况下,可能会出现串音现象。
技术实现思路
本说明书实施方式提供一种可以检测串音数据的串音数据检测方法和电子设备。本说明书实施方式提供一种串音数据检测方法,包括:接收第一音频数据块和第二音频数据块;其中,所述第一音频数据块和所述第二音频数据块分别包括多个音频数据分段;计算所述第一音频数据块的音频数据分段与第二音频数据块的音频数据分段的相关系数,得出相关系数的峰值;将所述峰值对应的所述第一音频数据块中的音频数据分段与第二音频数据块中的音频数据分段的获取时间的时间差作为基准时差;将所述第一音频数据块的音频数据分段与第二音频数据块中对应的音频数据分段的获取时间的时间差作为音频分段时差;在所述音频分段时差与所述基准时差不相匹配的情况下,确定 ...
【技术保护点】
1.一种串音数据检测方法,其特征在于,包括:/n接收第一音频数据块和第二音频数据块;其中,所述第一音频数据块和所述第二音频数据块分别包括多个音频数据分段;/n计算所述第一音频数据块的音频数据分段与第二音频数据块的音频数据分段的相关系数,得出相关系数的峰值;/n将所述峰值对应的所述第一音频数据块中的音频数据分段与第二音频数据块中的音频数据分段的获取时间的时间差作为基准时差;/n将所述第一音频数据块的音频数据分段与第二音频数据块中对应的音频数据分段的获取时间的时间差作为音频分段时差;/n在所述音频分段时差与所述基准时差不相匹配的情况下,确定所述第一音频数据块的相应音频数据分段包括串音数据。/n
【技术特征摘要】
1.一种串音数据检测方法,其特征在于,包括:
接收第一音频数据块和第二音频数据块;其中,所述第一音频数据块和所述第二音频数据块分别包括多个音频数据分段;
计算所述第一音频数据块的音频数据分段与第二音频数据块的音频数据分段的相关系数,得出相关系数的峰值;
将所述峰值对应的所述第一音频数据块中的音频数据分段与第二音频数据块中的音频数据分段的获取时间的时间差作为基准时差;
将所述第一音频数据块的音频数据分段与第二音频数据块中对应的音频数据分段的获取时间的时间差作为音频分段时差;
在所述音频分段时差与所述基准时差不相匹配的情况下,确定所述第一音频数据块的相应音频数据分段包括串音数据。
2.根据权利要求1所述的方法,其特征在于,在计算所述第一音频数据块的音频数据分段与第二音频数据块的音频数据分段的相关系数,得出相关系数的峰值的步骤中包括:
计算所述第一音频数据块中的音频数据分段与所述第二音频数据块中的音频数据分段的相关系数,形成相关系数集;将所述相关系数集中的最大值作为所述峰值。
3.根据权利要求1所述的方法,其特征在于,在计算所述第一音频数据块的音频数据分段与第二音频数据块的音频数据分段的相关系数,得出相关系数的峰值步骤中,所述峰值的数量为二个;
相应的,在将所述峰值对应的所述第一音频数据块中的音频数据分段与第二音频数据块中的音频数据分段的获取时间的时间差作为基准时差的步骤中包括:
分别计算所述二个峰值对应的所述第一音频数据块中的音频数据分段与第二音频数据块中的音频数据分段的获取时间的时间差,分别为第一时间差和第二时间差;其中,所述第一时间差和所述第二时间差之中较小的作为所述基准时差。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述第一时间差和所述第二时间差之中较大的作为串音时差;
相应的,所述方法还包括:在所述音频分段时差与所述串音时差相匹配的情况下,确定所述音频数据分段包括串音数据。
5.根据权利要求4所述的方法,其特征在于,所述音频分段时差与所述串音时差相匹配的情况,包括:
所述音频分段时差与所述串音时差相等;或者,
所述音频分段时差与所述串音时差之间的差值小于第一指定阈值。
6.根据权利要求1所述的方法,其特征在于,所述音频分段时差与所述基准时差不相匹配的情况,包括:
所述音频分段时差与所述基准时差不相等;或者,
所述音频分段时差与所述基准时差之间的差值大于第二指定阈值。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在相关系数大于设定系数值的情况下,标记所述相关系数对应的第一音频数据块中的音频数据分段为有效数据;
相应的,在将所述第一音频数据块的音频数据分段与第二音频数据块中对应的音频数据分段的获取时间的时间差作为音频分段时差的步骤中,仅在所述音频数据分段被标记为有效数据的情况下才将所述时间差作为音频分段时差。
8.根据权利要求1所述的方法,其特征在于,在计算所述第一音频数据块的音频数据分段与第二音频数据块的音频数据分段的相关系数,得出相关系数的峰值的步骤中,所述峰值的数量为一个;
相应的,在将所述峰值对应的所述第一音频数据块中的音频数据分段与第二音频数据块中的音频数据分段的获取时间的时间差作为基准时差的步骤中包括:
在所述第一音频数据块的信号强度高于所述第二音频数据块的信号强度的情况下,将所述时间差确定为基准时差。
9.根据权利要求8所述的方法,其特征在于,所述第一音频数据块中的音频数据分段与所述第二音频数据块中的音频数据分段的相关系数,形成相关系数集;所述方法还包括:
统计所述相关系数集中大于设定系数值的相关系数的统计数量;
相应的,在所述第一音频数据块的信号强度高于所述第二音频数据块的信号强度的情况下,将所述时间差确定为基准时差的步骤中,包括:在所述第一音频数据块的信号强度高于所述第二音频数据块的信号强度,且所述统计数量大于设定数量阈值的情况下,才将所述时间差确定为基准时差。
10.根据权利要求8所述的方法,其特征在于,所述第一音频数据块的信号强度高于所述第二音频数据块的信号强度的情况,包括:
所述第一音频数据块的能量大于对应的第二音频数据块的能量;或者,所述第一音频数据块的声压值大于对应第二音频数据块的声压值。
11.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在所述第一音频数据块的信号强度弱于所述第二音频数据块的信号强度的情况下,将所述时间差确定为串音时差;
相应的,在所述音频分段时差与所述串音时差相匹配的情况下,确定所述音频数...
【专利技术属性】
技术研发人员:许云峰,余涛,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。