基于传声器阵列的语音信号处理方法及装置制造方法及图纸

技术编号:4017973 阅读:213 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于传声器阵列的语音信号处理方法,所述传声器阵列由两个以上的指向性传声器构成;所述方法包括:确定各指向性传声器接收的相同帧的语音信号的能量值;根据所述能量值确定所述相同帧的各语音信号的调整参数;根据各语音信号的调整参数确定语音信号中各取样点信号的权值,将各语音信号中各取样点信号与各自的权值相乘,并对各语音信号的对应取样点信号的乘积值进行累加,将累加后的取样点信号依次输出。本发明专利技术同时公开了一种基于传声器阵列的语音信号处理装置。本发明专利技术计算方式简单,不需要复杂的计算和电路,具有良好的抗混响和定向拾音功能。

【技术实现步骤摘要】

本专利技术涉及语音信号处理技术,尤其涉及一种基于传声器阵列的语音信号处理方 法及装置。
技术介绍
在会议场所,各种干扰源的存在以及混响等噪音干扰着语音信号,会使语音处理 系统的性能急剧下降,因此语音增强技术颇为重要。基于传声器阵列的多通道语音增强算 法融合了信号的时空域信息,利用噪声同语音的相关性差异进行消噪,近几年已经成为多 媒体会议、通信、声控等系统所依赖的重要技术。音质和性能的好坏会严重影响音频会议系 统的整体效果与市场竞争力,因此,针对噪声,目前常通过传声器阵列技术实现消噪,这使 得音频会议系统的参与人员彻底摆脱手持传声器并定向到传声器的束缚,大大提高了音频 会议系统的实用性。对语音信号处理而言,要争取使进入编码器的语音音质就比较好如低 混响、低噪声等,传声器阵列就是保证语音信号的低混响、低噪声。公开号为CN101496417A公开日为2009年7月29日的中国专利申请公开了一种 “语音会议系统”,在不同方向上的多个单向传声器拾取的语音采集信号形成多个语音采集 束信号,其后,与语音到达方向相对应的语音采集束信号的信号电平变高,语音采集部分选 择信号电平超过设定阈值的语音采集束信号,并将该信号送到通信部分。该技术方案中,超 过阈值的语音采集束信号可能有多个,这样在小房间就会增加混响,使声音清晰度降低。公开号为US20050195988A公开日为2005年9月8日的美国专利申请公开了一 ft "System and method for beamforming using a microphone array,,,i亥技术方案是使 用传声器阵列聚束的系统和方法,其技术方案的实质是设计了一个聚束器,该聚束器首先 利用描述传声器阵列的特性和结构的参数信息来计算频域相关的权值矩阵,与一个或多个 为传声器阵列周围环境自动生成或计算得到的噪声模型相结合,来对传声器阵列的最优固 定波束进行设计,然后,在对传声器阵列接收的音频信号进行频域聚束处理时,利用此权值 矩阵对传声器阵列中的每个传声器的输出进行频域加权。该方法需要根据阵列的特性和结 构在频域计算加权矩阵,以达到形成波束的目的,增加了系统的复杂度,加大了系统的开发 难度并且降低了系统的可靠性。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种基于传声器阵列的语音信号处理方法 及装置,利用强指向性传声器阵列能将距发言人最近的语音信号进行放大,从而能动态跟 踪发目人。为达到上述目的,本专利技术的技术方案是这样实现的—种基于传声器阵列的语音信号处理方法,所述传声器阵列由两个以上的指向性 传声器构成;所述方法包括确定各指向性传声器接收的相同帧的语音信号的能量值;4根据所述能量值确定所述相同帧的各语音信号的调整参数;根据各语音信号的调整参数确定语音信号中各取样点信号的权值,将各语音信号 中各取样点信号与各自的权值相乘,并对各语音信号的对应取样点信号的乘积值进行累 加,将累加后的取样点信号依次输出。优选地,所述根据所述能量值确定所述相同帧的各语音信号的调整参数,为将所述相同帧的各语音信号的能量值分别与最大的能量值作商;对各商值进行指数调整处理,并作为各语音信号的调整参数。优选地,所述对各商值进行指数调整处理,并作为各语音信号的调整参数,为将各商值的E次方作为各语音信号的调整参数;其中,E为大于等于2小于等于10 的正数。优选地,所述根据各语音信号的调整参数确定语音信号中各取样点信号的权值, 具体按下式计算Wi(n) = AWi(n-l) + (l-A)C;^^, w, (n)为传声器i中的当前语音信号帧中第n 个取样点信号的权值,Wi(n-l)为传声器i中的当前语音信号帧中第n-1个取样点信号的权 值八为预先设定的遗忘因子,0< A < 1 ;C为当前语音信号帧的调整参数。优选地,所述根据各语音信号的调整参数确定语音信号中各取样点信号的权值, 为Wi(n) = AWi(n-l) + (l-A)C;^^, w, (n)为传声器i中的当前语音信号帧中第n 个取样点信号的初始权值,Wi(n-1)为传声器i中的当前语音信号帧中第个取样点信号 的初始权值;、为预先设定的遗忘因子,0 < A < 1 ;C为当前语音信号帧的调整参数;按下式对&(11)进行处理,将成(功作为传声器i中的当前语音信号帧中第n个取样点信号的最终权值 其中,max()为取最大值计算。 优选地,所述传声器阵列为圆形阵列或球形阵列;所述传声器阵列中的传声器数 量为4至16个。一种基于传声器阵列的语音信号处理装置,所述传声器阵列由两个以上的指向性 传声器构成;所述装置包括第一确定单元、第二确定单元、计算单元和输出单元;其中,第一确定单元,用于确定各指向性传声器接收的相同帧的语音信号的能量值;第二确定单元,用于根据所述能量值确定所述相同帧的各语音信号的调整参数;计算单元,用于根据各语音信号的调整参数确定语音信号中各取样点信号的权 值,将各语音信号中各取样点信号与各自的权值相乘,并对各语音信号的对应取样点信号 的乘积值进行累加;输出单元,用于将累加后的取样点信号依次输出。优选地,所述第二确定单元进一步将所述相同帧的各语音信号的能量值分别与最 大的能量值作商;并对各商值进行指数调整处理,作为各语音信号的调整参数。优选地,所述第二确定单元进一步将各商值的E次方作为各语音信号的调整参 数;其中,E为大于等于2小于等于10的正数。优选地,所述计算单元进一步按下式计算语音信号中各取样点信号的权值Wi(n) = AWi(n-l) + (l-A)C;^^, w, (n)为传声器i中的当前语音信号帧中第n 个取样点信号的权值,Wi(n-l)为传声器i中的当前语音信号帧中第n-1个取样点信号的权 值八为预先设定的遗忘因子,0< A < 1 ;C为当前语音信号帧的调整参数。优选地,所述计算单元进一步按下述方式计算语音信号中各取样点信号的权值Wi(n) = AWi(n-l) + (l-A)C;^^, w, (n)为传声器i中的当前语音信号帧中第n 个取样点信号的初始权值,Wi(n-1)为传声器i中的当前语音信号帧中第个取样点信号 的初始权值;、为预先设定的遗忘因子,0 < A < 1 ;C为当前语音信号帧的调整参数;按下式对&(11)进行处理,将戌…)作为传声器i中的当前语音信号帧中第n个取 样点信号的最终权值 其中,maxO为取最大值计算。 优选地,所述传声器阵列为圆形阵列或球形阵列;所述传声器阵列中的传声器数 量为3至16个。本专利技术中,采用N个强指向性传声器构成圆形阵列,阵列的拾音覆盖360度方位; 首先对强指向性传声器阵列中各传声器接收到的语音信号的能量值,通过语音信号的能量 值信息,确定出各传声器接收到的当前语音帧的语音信号的调整参数,并利用该调整参数 计算当前语音帧的各采样点信号的权值,将所计算出的权值与对应的采样点信号相乘,对 相同位置的采样点信号的乘积进行累加,并按采样点的顺序依次输出。本专利技术利用传声器 阵列中各传声器所接收语音信号的能量值来确定各路语音信号的调整参数,并利用遗忘因 子对各采样点信号进行平滑处理,使得所输出的语音信号更连贯。本专利技术计算本文档来自技高网
...

【技术保护点】
一种基于传声器阵列的语音信号处理方法,其特征在于,所述传声器阵列由两个以上的指向性传声器构成;所述方法包括:确定各指向性传声器接收的相同帧的语音信号的能量值;根据所述能量值确定所述相同帧的各语音信号的调整参数;根据各语音信号的调整参数确定语音信号中各取样点信号的权值,将各语音信号中各取样点信号与各自的权值相乘,并对各语音信号的对应取样点信号的乘积值进行累加,将累加后的取样点信号依次输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:何宏森黄志宏邱小军袁浩
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利