【技术实现步骤摘要】
[0013]其中,W为窗函数,n为窗函数序号,N是傅里叶变换长度。
[0014]作为本专利技术的进一步改进,在频域上,对两路输入信号数据求取相关性:
[0015]Sxy=alpha*Sxy+(1
‑
alpha)*X*conj(Y)
[0016]Cxy=Sxy/sqrt(Sxy^2)
[0017]其中,Sxy是互相关结果,alpha为平滑因子,X表示近端待测输入信号数据复数形式,Y表示远端回声消除输出信号数据复数形式,conj表示取共轭,Cxy为最终的相关性结果。
[0018]作为本专利技术的进一步改进,所述平滑后的相关性数值为Smooth_Cxy,所述Smooth_Cxy按以下公式进行更新:
[0019]Smooth_Cxy=beta*Smooth_Cxy+(1
‑
beta)*Cxy
[0020]其中,beta为平滑因子。
[0021]作为本专利技术的进一步改进,所述平滑因子beta的值取决于语音存在概率值,所述语音存在概率值为0
‑
1之间的浮点数, ...
【技术保护点】
【技术特征摘要】
1.一种用于音视频会议的双讲检测方法,其特征在于:包括以下步骤:采集近端待测输入信号和远端回声消除输出信号作为两路输入信号;对两路输入信号进行数据处理及相关性计算,得到相关性平滑数值,并持续对相关性平滑数值进行更新;判断远端存在语音输入时,若相关性数值大于等于预先设置的阈值,则判定近端和远端通话状态为双讲状态。2.如权利要求1所述的一种用于音视频会议的双讲检测方法,其特征在于:将两路输入信号分别加窗,进行短时快速傅里叶变换到频域,在频域上,对两路输入信号数据求取相关性。3.如权利要求2所述的一种用于音视频会议的双讲检测方法,其特征在于:加窗时,采用窗函数:W(n)=0.54
‑
0.46
×
cos(2
×
π
×
n/(n
‑
1)),0≤n≤N
‑
1其中,W为窗函数,n为窗函数序号,N是傅里叶变换长度。4.如权利要求2所述的一种用于音视频会议的双讲检测方法,其特征在于:在频域上,对两路输入信号数据求取相关性:Sxy=alpha*Sxy+(1
‑
alpha)*X*conj(Y)Cxy=Sxy/sqrt(Sxy^2)其中,Sxy是互相关结果,alpha为平滑因子,X表示近端待测输入信号数据复数形式,Y表示远端回声消除输出信号数据复数形式,conj表示取共轭,Cxy为最终的相关性结果。5.如权利要求4所述的一种用于音视频会议的双讲检测方法,其特征在于:所述平滑后的相关性数值为Smooth_Cxy,所述Smooth_Cxy按以下公式进行更新:Smooth_Cxy=beta*Smooth_Cxy+(1
‑
beta)*Cxy其中,bet...
【专利技术属性】
技术研发人员:袁鋆,辛鑫,
申请(专利权)人:苏州蛙声科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。