【技术实现步骤摘要】
语音信号处理方法及装置
本专利技术属于信号处理
,尤其涉及语音信号处理方法及装置。
技术介绍
相关技术中,多声源强干扰下声音源定位是一个具有挑战的难题,现在业内主流的方法是估计直达声,从而获得更好的方位估计(DOA,波达方向,DirectionOfArrival)估计精度。还有一些方法,主要是对各个语音段落估计出来的DOA值进行聚类,根据类的个数和均值获得最终的结果。估计直达声这种方法借鉴了去混响的手段,通过对语音能量进行跟踪和预测,挑选出来正确的直达声时频点,利用这些频点信息进行DOA计算。DOA聚类这类方法主要是对各段语音数据在各个频点上进行简单的DOA估计,主要的算法有MUSIC(MUITILYSIgnalClassification,多重信号分类,是一类空间谱估计算法)和ESPRIT等,然后针对各语音段各个频点估计出来的DOA值进行聚类,根据类的个数和类的均值,确定语音声源对应的DOA。上述两类方法在信噪比低于-5db的场景,进行多个声源定位并不能具有较好的性能。专利技术人在实现本申请的过程中发现:直达声估计的算法,存在的缺陷主要是无法做到与内容相关 ...
【技术保护点】
1.一种语音信号处理方法,包括:获取并分离出与原始输入语音信号对应的多个源信号;对某一源信号进行预设处理区分出所述某一源信号中的至少一个第一语音信号和至少一个第一噪音信号;将所述第一语音信号输入至唤醒引擎中,并获取所述唤醒引擎输出的所述第一语音信号的置信度,其中,所述唤醒引擎能够被置信度大于或等于阈值的唤醒词唤醒;基于所述第一语音信号中置信度最大的信号,所述第一语音信号中未唤醒的信号和所述至少一个第一噪音信号中能量最大的信号,计算所述置信度最大的信号和所述能量最大的信号信噪比;基于与所述至少一个第一语音信号对应的至少一个信噪比计算与所述某一源信号中的语音存在概率;基于与各源 ...
【技术特征摘要】
1.一种语音信号处理方法,包括:获取并分离出与原始输入语音信号对应的多个源信号;对某一源信号进行预设处理区分出所述某一源信号中的至少一个第一语音信号和至少一个第一噪音信号;将所述第一语音信号输入至唤醒引擎中,并获取所述唤醒引擎输出的所述第一语音信号的置信度,其中,所述唤醒引擎能够被置信度大于或等于阈值的唤醒词唤醒;基于所述第一语音信号中置信度最大的信号,所述第一语音信号中未唤醒的信号和所述至少一个第一噪音信号中能量最大的信号,计算所述置信度最大的信号和所述能量最大的信号信噪比;基于与所述至少一个第一语音信号对应的至少一个信噪比计算与所述某一源信号中的语音存在概率;基于与各源信号对应的语音存在概率对所述各源信号进行加权并利用加权后的所述各源信号计算所述原始输入信号的波达方向。2.根据权利要求1所述的方法,其中,所述基于与所述至少一个第一语音信号对应的至少一个信噪比计算与所述某一源信号中的语音存在概率包括:比较与所述第一语音信号对应的信噪比是否小于预设信噪比,当不小于时,定义所述第一语音信号中的语音存在概率为1,当小于时,定义所述第一语音信号中的语音存在概率为0;基于上述定义计算与所述某一源信号对应的至少一个第一语音信号的语音存在概率。3.根据权利要求1所述的方法,其中,所述基于所述第一语音信号中置信度最大的信号,所述第一语音信号中未唤醒的信号和所述至少一个第一噪音信号中能量最大的信号,计算所述置信度最大的信号和所述能量最大的信号信噪比包括:将所述第一语音信号中能够唤醒且置信度最大的信号确定为与所述唤醒词对应的第二语音信号,将所述第一语音信号中无法唤醒的信号确定为第二噪音信号;从所述至少一个第一噪声信号和所述第二噪声信号中选取时频点上能量最大的信号为第三噪声信号;计算所述第二语音信号和所述第三噪声信号的信噪比。4.根据权利要求1所述的方法,其中,所述获取并分离出与原始输入语音信号对应的多个源信号包括:获取目标说话人的原始输入语音信号;对所述原始输入语音信号进行盲源分离,得到多个源信号。5.根据权利要求1-4中任一项所述的方法,其中,所述预设处理为基频提取...
【专利技术属性】
技术研发人员:沈小正,周强,周伟达,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。