当前位置: 首页 > 专利查询>浙江大学专利>正文

基于声场重构的语音分析身份认证方法技术

技术编号:38349467 阅读:18 留言:0更新日期:2023-08-02 09:29
本发明专利技术公开了一种基于声场重构的语音分析身份认证方法,该方法包括距离感知、声场重建、声场提取及模型训练与推断,距离感知是通过扬声器发出啁啾信号并接收,利用互相关方法获取用户到手机的距离;声场重建通过建立一个与距离相关的脉冲响应数据库,根据测量的距离获得相应的传递函数,继而将验证位置的声场重建到注册位置的声场;声场提取将重建声场后的语音信号双声道分别进行信号处理,提取出场纹;模型训练与推断为利用注册场纹和验证阶段重建场纹来构建语音认证模型,本方法可以有效解决原声场方法进行说话人验证时对距离敏感的问题,用户验证时无需保持与注册时固定的距离。离。离。

【技术实现步骤摘要】
基于声场重构的语音分析身份认证方法


[0001]本专利技术属于人工智能语音助手安全
,具体涉及一种基于声场重构的语音分析身份认证方法。

技术介绍

[0002]语音认证系统通过提取用户的语音特征来进行特征训练和匹配,从而对用户进行验证,是一种广泛应用的身份验证方法。其对硬件要求低,成本低,用户友好度高,已逐渐成为一种主流的个人认证方式,在多种智能设备上都得到了普遍的应用。
[0003]现有的基于声场和场纹的语音认证系统正是其中的一种,声场特征与说话内容无关,它不仅保留了语音信号本身的声音信息,还引入了用户的声道,嘴,头部,躯干等有关的生理性身份信息。所以,该系统能够基于声场和场纹信息对语音欺骗攻击进行检测,有效应用于说话人认证,发声体识别领域。
[0004]然而,基于声场和场纹的语音认证系统却对用户和麦克风间的距离非常敏感,麦克风靠近嘴巴或稍远放置时,声场特征会出现很大的差异。在实际应用中,该系统更需要每次使用时用户与麦克风间存在固定的间距,这十分影响在实际使用中该系统的便捷性和用户友好性。

技术实现思路

[0005]为解决上述
技术介绍
中存在的缺陷,本专利技术提供了一种基于声场重构的语音分析身份认证方法,本方法改善了原有的声场和场纹的语音认证系统,有效解决了声场对距离敏感的问题,提高了系统的鲁棒性与用户友好性。
[0006]本专利技术采用如下技术方案实现:
[0007]步骤1:距离感知
[0008]步骤1.1:利用手机扬声器发出测距信号,并使用手机底部麦克风接收回声信号(即测距信号经过人之后返回的信号);
[0009]步骤1.2:对回声信号使用巴特沃斯带通滤波器进行背景噪声的去除;
[0010]步骤1.3:通过回声信号的时域图像找到直接路径和回波路径,以Δt表示回波路径与直接路径间的时间差,使用者与手机之间的距离可通过计算得到,c为光速。
[0011]步骤2:声场重建
[0012]步骤2.1:利用高保真扬声器等稳定声源产生恒定脉冲s(t),利用智能手机的顶部和底部麦克风在距离使用者不同的距离接收信号记为s
k
(d,t),k∈[1,2],设定h
k
(d,t),k∈[1,2]为顶部和底部麦克风的脉冲响应,可以由公式s
k
(d,t)= h
k
(d,t)*s(t)进行反卷积获取,相邻两次距离间隔为1cm接收信号,并保存不同距离下的h
k
(d,t)保存,构成与距离相关的脉冲响应数据库,d为距离,t为时间;
[0013]步骤2.2:使用者注册声场时,通过距离感知获得声源(使用者)与手机间的距离de,查询脉冲响应数据库,可以得到注册阶段的脉冲响应h
k
(de,t);同样的,使用者验证时,
可以获取到使用者与手机间的距离dv,查询脉冲响应数据库得到验证时的传递函数h
k
(dv,t);
[0014]步骤2.3:将验证阶段的接收到的使用者发出的声音信号与验证时的脉冲响应和注册时的逆脉冲响应依次卷积,即可获得重建信号x

(t),具体公式如下:
[0015][0016]步骤3:声场提取
[0017]步骤3.1:对重建完的信号进行噪声去除和静音片段去除;
[0018]步骤3.2:分别对两声道信号进行短时傅里叶变换处理;利用公式计算重建信号两声道间的声压比对数来代表频率f下的声场,则某一帧下的声场表示为
[0019]S(p1,p2)=[Sr(p1,p2,f1),Sr(p1,p2,f2),...,Sr(p1,p2,fn)][0020]其中,p1和p2分别为两个麦克风的位置,f为频率,n为频率的总维度数;
[0021]对于重建信号的声场,采用长时间平均归一化的方法得到n维声场特征向量SFF(p1,p2):
[0022][0023]其中,L为重建信号的帧数;S
i
(p1,p2)为第i帧下的声场;
[0024]步骤4:模型训练与推断
[0025]步骤4.1:用户注册,使用高斯混合模型(GMM)拟合使用者声场特征向量SFF(p1,p2),形成相应的说话人模型。注册用户发出几段语音信号,从注册用户的语音信号中提取出n维声场特征向量SFF(p1,p2),可采用高斯混合模型建模,对于SFF(p1,p2),注册用户s的混合密度p(SFF|λ
s
)定义为
[0026][0027]其中,λ
s
表示注册用户s采用高斯混合模型建模得到的说话人模型;M表示高斯分量的个数;表示注册用户s第j个高斯分量的混合权值;注册用户s的第j个高斯分量的计算公式如下:
[0028][0029]其中μ
j
为n维声场特征向量的平均向量;为n维声场特征向量的协方差矩阵;
[0030]使用迭代期望最大化算法(EM算法)估计和收敛模型参数;
[0031]步骤4.2:在验证阶段,利用训练后的高斯混合模型处理说话人重建信号的n维声场特征向量,获得说话人与注册用户的相似度相似度。如果相似度超过预定义阈值,则说话人身份认证通过;否则,说话人身份认证失败,将被拒绝。
[0032]本专利技术的有益效果是:
[0033]本专利技术提出了一种基于声场重构的语音分析身份认证方法,该方法利用声波测距和脉冲响应实现声场重构,将验证阶段位置的声场重建回注册阶段的位置,确保了注册与验证位置的一致性,使得用户使用时无需固定距离,本专利技术无需增加任何硬件成本增加,使用已有的两个麦克风和扬声器就可以完成声场重构,解决了原有声场和场纹语音认证系统存在的距离敏感问题,可有效应用于活体检测等原本需要位置固定的场景中。
附图说明
[0034]图1是本专利技术的基于声场重构的语音分析身份认证方法具体实施示意图;
[0035]图2是直接路径和回声路径的物理体现图;
[0036]图3是测距信号和接收信号的样本图;
[0037]图4是某一距离下的脉冲响应图;
[0038]图5是声场重建的流程图;
[0039]图6是重建信号与注册信号的声场对比图。
具体实施方式
[0040]为了更好的理解本专利技术的技术方案,现结合附图对本专利技术作进一步说明:
[0041]图1所示为本专利技术方法的流程图,在实施前需要进行脉冲响应数据库的构建,实际实施时分为注册和验证两种情况,注册时,需进行距离感知,声场提取,说话人模型训练流程;验证时,需进行距离感知,声场重建,声场提取,模型推断流程。
[0042]脉冲响应数据库的构建:
[0043]步骤1:脉冲响应的获取。在已有的很多脉冲响应数据集中,获取麦克风脉冲响应方法很多,其中一些瞬时性的声音如拍手声,枪声,由于其方便有效,被广泛采用作为声源。但是,保持拍手声,枪声产生的脉冲始终一致是不可能的,而由高保真扬声器等稳定声源产生的脉冲则更为恒定。本专利技术采用了本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于声场重构的语音分析身份认证方法,其特征在于,该方法包括如下步骤:步骤1:距离感知步骤1.1:利用手机扬声器发出测距信号,并使用手机底部麦克风接收测距信号被使用者反射后返回的回声信号;步骤1.2:对回声信号使用巴特沃斯带通滤波器进行背景噪声的去除;步骤1.3:通过回声信号的时域图像找到直接路径和回波路径,以Δt表示回波路径与直接路径间的时间差,使用者与手机之间的距离可通过计算得到,c为光速;步骤2:声场重建步骤2.1:利用稳定声源产生恒定脉冲s(t),利用手机的顶部和底部麦克风在距离使用者不同的距离接收信号,记为s
k
(d,t),k∈[1,2],设定h
k
(d,t),k∈[1,2]为顶部和底部麦克风的脉冲响应,由公式s
k
(d,t)=h
k
(d,t)*s(t)进行反卷积获取,相邻两次间隔1cm接收信号,并保存不同距离下的h
k
(d,t),构成与距离相关的脉冲响应数据库,d为距离,t为时间;步骤2.2:使用者注册声场时,通过距离感知获得使用者与手机间的距离de,查询脉冲响应数据库,得到注册阶段的脉冲响应h
k
(de,t);同样地,使用者验证时,获取使用者与手机间的距离dv,查询脉冲响应数据库得到验证时的脉冲响应h
k
(dv,t);步骤2.3:将验证阶段的接收到的使用者发出的声音信号x(t)与验证时的脉冲响应和注册时的逆脉冲响应依次卷积,即可获得重建信号x

(t),具体公式如下:步骤3:声场提取步骤3.1:对重建信号进行噪声去除和静音片段去除;步骤3.2:对重建信号进行短时傅里叶变换处理;利用公式步骤3.2:对重建信号进行短时傅里叶变换处理;利用公式计算重建信号两声道间的声压比对数来代表频率f下的声场,则某一帧下的声场表示为S(p1,p2)=[Sr(p1,p2,f1),Sr(p1,p2,f2),...,Sr(p1,p2,fn)]其中,p1和p2分别为两个麦克风的位置,f为频率,n为频率的总维度数;对于重建信号的声场,采用长时间平均归一化的方法得到n维声场特征向量SFF(p1,p2):其中,L为重建信号的帧数;S
i
(p1,p2)为第i帧下的声场;步骤4:模型训练与身份推断步骤4.1:用户注册,使用高斯混...

【专利技术属性】
技术研发人员:徐文渊冀晓宇闫琛李鑫锋吕智陈奕燃郑智聪钟晶晶
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1