一种麦克风阵列结合唤醒词进行的制造技术

技术编号:39837659 阅读:8 留言:0更新日期:2023-12-29 16:23
本发明专利技术公开了一种麦克风阵列结合唤醒词进行的

【技术实现步骤摘要】
一种麦克风阵列结合唤醒词进行的DOA方法


[0001]本专利技术属于语音处理
,尤其是麦克风阵列声源寻向,具体涉及一种麦克风阵列结合唤醒词进行的
DOA
方法


技术介绍

[0002]麦克风阵语音测向
(DOA

Direction of Arrival)
技术在许多应用领域中发挥着重要作用,包括智能家居,音频会议,个人助手等

[0003]传统的单声源测向和定位系统中,只能确定单个声源的位置,随着技术的发展和需求的增加,多声源场景以及嘈杂场景的测向技术应运而生

常规的多声源语音测向一般先确定声源个数,进而通过麦克风语音测向算法确定多个声源的方向,再从中挑选出对应目标声源的方向

但常规多声源语音测向方法受到声源个数及环境信噪比的影响,当声源个数超过麦克风阵列阵元个数或者环境信噪比较低时,语音测向方法往往不能准确估计各个声源的方向,导致算法失效

[0004]一直以来,多声源场景以及嘈杂场景中对目标声源进行定位及追踪一直是麦克风阵列语音测向的一大重点及难点


技术实现思路

[0005]本专利技术的目的是针对现有技术的不足,提供一种麦克风阵列结合唤醒词进行的
DOA
方法,通过宽度和深度的两步优化策略在保证降噪宽度的基础上,进一步加深降噪深度

[0006]本专利技术方法具体是:
[0007]步骤
(1)<br/>基于盲源分离方法将麦克风阵列语音信号序列
x(n)

[x1(n)
ꢀ…ꢀ
x
M
(n)]进行分离,得到
M
路分离后的语音信号序列
s(n)

[s1(n)
ꢀ…ꢀ
s
M
(n)],其中
M
为麦克风阵列阵元个数,
n
表示采样序号;
[0008]步骤
(2)
将盲源分离得到的
M
路语音信号序列
s(n)
,通过激活词网络,确定激活词所在的语音信号所属的路
s
i
(n)

i∈[1 M];
[0009]步骤
(3)

s(n)

[s1(n)
ꢀ…ꢀ
s
M
(n)]中排除激活词所在的语音信号所属的路
s
i
(n)
,将其他路语音信号统一作为干扰人声和噪声参考信号序列
r(n)

[s1(n)
ꢀ…ꢀ
s
i
‑1(n) s
i+1
(n)
ꢀ…ꢀ
s
M
(n)],重新编号后表示为
r(n)

[r1(n)
ꢀ…ꢀ
r
M
‑1(n)];
[0010]步骤
(4)
基于干扰人声和噪声参考信号序列
r(n)
对麦克风阵列语音信号序列
x(n)
进行降噪,得到消除了干扰人声和噪声的多通道语音信号序列
y(n)

[0011]步骤
(5)
对得到的消除了干扰人声和噪声的多通道语音信号序列
y(n)
提过宽带
MUSIC
算法得到最终
DOA
,即为需要的激活词对应的人声角度

[0012]进一步,步骤
(1)
具体方法是:
[0013]对麦克风阵列语音信号序列
x(n)

[x1(n)
ꢀ…ꢀ
x
M
(n)]进行短时傅里叶变换,得到短时傅里叶变换域中的麦克风阵列语音信号序列
X(t,f)

[X1(t,f)
ꢀ…ꢀ
X
M
(t,f)],其中
X
m
(t,f)
表示在时间单元
t、
频率单元
f
的第
m

1,

,M
个麦克风通道的短时傅里叶变换域的信号;通过盲源分离算法的分离矩阵
D(t,f)
,在短时傅里叶变换域中,分离得到
M
路语音信号序列
S(t,f)

D(t,f)X(t,f)
;对短时傅里叶变换域中的语音信号序列
S(t,f)
进行短时傅里叶逆变换,得到时域中的
M
路分离后的语音信号序列
s(n)

[s1(n)
ꢀ…ꢀ
s
M
(n)]。
[0014]再进一步,步骤
(2)
具体方法是:将盲源分离得到的
M
路语音信号序列
s(n)

[s1(n)
ꢀ…ꢀ
s
M
(n)],通过激活词网络
Φ
,输出每一路语音信号的存在激活词的概率打分序列选择其中最大概率打分的一路
s
i
(n)
为激活词所在的语音信号所属的路,
i∈[1 M]。
[0015]更进一步,步骤
(4)
具体方法是:基于干扰人声和噪声参考信号序列
r(n)

[r1(n)
ꢀ…ꢀ
r
M
‑1(n)],对麦克风阵列语音信号序列
x(n)

[x1(n)
ꢀ…ꢀ
x
M
(n)]进行降噪,得到消除了干扰人声和噪声的多通道语音信号序列
y(n)

[y1(n)
ꢀ…ꢀ
y
M
(n)];具体是:
[0016]首先初始化
r(n)

[r1(n)
ꢀ…ꢀ
r
M
‑1(n)]中的每个干扰人声和噪声参考信号
r
p
(n)
对麦克风阵列语音信号序列
x(n)

[x1(n)
ꢀ…ꢀ
x
M
(n)]中的每个麦克风阵列语音信号
x
q
(n)
的噪声消除滤波器系数
L
为噪声消除滤波器阶数;
[0017]然后计算得到每个
r
p
(n)
对每个
x
q
(n)
的滤波器输出得到干扰人声和噪声参考信号序列
r(n)

...

【技术保护点】

【技术特征摘要】
1.
一种麦克风阵列结合唤醒词进行的
DOA
方法,其特征在于:步骤
(1)
基于盲源分离方法将麦克风阵列语音信号序列
x(n)

[x1(n)

x
M
(n)]
进行分离,得到
M
路分离后的语音信号序列
s(n)

[s1(n)

s
M
(n)]
,其中
M
为麦克风阵列阵元个数,
n
表示采样序号;步骤
(2)
将盲源分离得到的
M
路语音信号序列
s(n)
,通过激活词网络,确定激活词所在的语音信号所属的路
s
i
(n)

i∈[1 M]
;步骤
(3)

s(n)

[s1(n)

s
M
(n)]
中排除激活词所在的语音信号所属的路
s
i
(n)
,将其他路语音信号统一作为干扰人声和噪声参考信号序列
r(n)

[s1(n)

s
i
‑1(n) s
i+1
(n)

s
M
(n)]
,重新编号后表示为
r(n)

[r1(n)

r
M
‑1(n)]
;步骤
(4)
基于干扰人声和噪声参考信号序列
r(n)
对麦克风阵列语音信号序列
x(n)
进行降噪,得到消除了干扰人声和噪声的多通道语音信号序列
y(n)
;步骤
(5)
对得到的消除了干扰人声和噪声的多通道语音信号序列
y(n)
提过宽带
MUSIC
算法得到最终
DOA
,即为需要的激活词对应的人声角度
。2.
如权利要求1所述的一种麦克风阵列结合唤醒词进行的
DOA
方法,其特征在于:步骤
(1)
具体方法是:对麦克风阵列语音信号序列
x(n)

[x1(n)

x
M
(n)]
进行短时傅里叶变换,得到短时傅里叶变换域中的麦克风阵列语音信号序列
X(t,f)

[X1(t,f)

X
M
(t,f)]
,其中
X
m
(t,f)
表示在时间单元
t、
频率单元
f
的第
m

1,

,M
个麦克风通道的短时傅里叶变换域的信号;通过盲源分离算法的分离矩阵
D(t,f)
,在短时傅里叶变换域中,分离得到
M
路语音信号序列
S(t,f)

D(t,f)X(t,f)
;对短时傅里叶变换域中的语音信号序列
S(t,f)
进行短时傅里叶逆变换,得到时域中的
M
路分离后的语音信号序列
s(n)

[s1(n)

s
M
(n)]。3.
如权利要求2所述的一种麦克风阵列结合唤醒词进行的
DOA
方法,其特征在于:步骤
(2)
具体方法是:
s(n)

[s1(n)

s
M
(n)]
,通过激活词网络
Φ
,输出每一路语音信号的存在激活词的概率打分序列选择其中最大概率打分的一路
s
i
(n)
为激活词所在的语音信号所属的路,
i∈...

【专利技术属性】
技术研发人员:卢燕凌云姚欢沈旭东
申请(专利权)人:杭州国芯科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1