【技术实现步骤摘要】
一种音频双向延时估计方法、装置、会议终端及存储介质
[0001]本专利技术实施例涉及音频处理
,尤其涉及一种音频双向延时估计方法、装置、会议终端及存储介质。
技术介绍
[0002]在音视频远程会议软件系统中,往往存在远端参考信号(扬声器播放的音频信号)与近端音频信号(麦克风采集的音频信号)两种音频信号流,为了实现音视频远程会议软件系统中的回声消除,需要将上述两种音频数据流进行音频信号对齐操作,而音频信号对齐的前提是会议软件系统先能准确估计出远端参考信号与近端音频信号之间存在的延时差。
[0003]目前现有技术进行延时差估计时,采用的是正向延时估计方法,然而,在远端参考信号和近端音频信号不满足因果现象时,该正向延时估计方法将出现估计错误的现象出现,从而导致回声消除不能有效工作。
技术实现思路
[0004]本专利技术实施例提供了一种音频双向延时估计方法、装置、会议终端及存储介质,通过确定出的正向相干函数和负向相干函数,进行音频信号的双向延时估计。
[0005]第一方面,本专利技术实施例提供了 ...
【技术保护点】
【技术特征摘要】
1.一种音频双向延时估计方法,其特征在于,包括:确定频域上正向相干函数和负向相干函数,所述正向相干函数为当前帧近端音频信号与所缓存远端参考信号的相干函数,所述负向相干函数为当前帧远端参考信号与所缓存近端音频信号的相干函数;根据所述正向相干函数和所述负向相干函数,确定所缓存近端音频信号和所缓存远端参考信号中每帧信号的平均相干值,所述所缓存近端音频信号中每帧信号的平均相干值为所缓存近端音频信号中每帧信号所对应频带与所述当前帧远端参考信号所对应频带间相干函数的均值,所述所缓存远端参考信号中每帧信号的平均相干值为所缓存远端音频信号中每帧信号所对应频带与所述当前帧近端音频信号所对应频带间相干函数的均值;根据最大平均相干值所对应信号帧的帧数与偏移帧数的差值,确定所缓存远端参考信号和所缓存近端音频信号的延时值,以基于所述延时值进行音频对齐处理,所述最大平均相干值为各所述平均相干值中数值最大的平均相干值,所述偏移帧数基于所允许估计出的最大的负向延时值确定。2.根据权利要求1所述的方法,其特征在于,所述确定频域上正向相干函数和负向相干函数,包括:根据所缓存远端参考信号确定远端自功率谱;根据所缓存近端音频信号确定近端自功率谱;根据所述近端自功率谱、所述远端自功率谱、所缓存远端参考信号和当前帧近端音频信号,确定正向相干函数;根据所述近端自功率谱、所述远端自功率谱、所缓存近端音频信号和当前帧远端参考信号,确定负向相干函数。3.根据权利要求2所述的方法,其特征在于,根据所述近端自功率谱、所述远端自功率谱、所缓存远端参考信号和当前帧近端音频信号,确定正向相干函数,包括:根据所述当前帧近端音频信号的频谱、所缓存远端参考信号的频谱和平滑因子,确定正向互功率谱;根据所述正向互功率谱、当前帧近端音频信号的自功率谱和所述远端自功率谱,确定正向相干函数;其中,所述当前帧近端音频信号为所缓存近端音频信号中最晚缓存的近端音频信号,所述当前帧近端音频信号的自功率谱为所述最晚缓存的近端音频信号对应的近端自功率谱。4.根据权利要求2所述的方法,其特征在于,根据所述近端自功率谱、所述远端自功率谱、所缓存近端音频信号和当前帧远端参考信号,确定负向相干函数,包括:根据所述当前帧远端参考信号的频谱、所缓存近端音频信号的频谱和平滑因子,确定负向互功率谱;根据所述负向互功率谱、当前帧远端参考信号的自功率谱和所述近端自功率谱,确定负向相干函数;其中,所述当前帧远端参考信号为所缓存远端参考信号中最晚缓存的远端音频信号,所述当前帧远端参考信号的自功率谱为所述最晚缓存的远端音频信号对应的远端自功率谱。
5.根据权利要求1所述的方法,其特征在于,所述正向相干函数为当前帧近端音频信号第j个频带与所...
【专利技术属性】
技术研发人员:李正华,李勤,
申请(专利权)人:广州迈聆信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。