说话者身份验证方法及系统技术方案

技术编号：26175241 阅读：50 留言：0更新日期：2020-10-31 14:07

本发明专利技术公开一种说话者身份验证方法，包括：获取所述说话者的音频数据和面部图像数据；从所述音频数据中提取语音特征嵌入，从所述面部图像数据中提取面部特征嵌入；根据所述语音特征嵌入和所述面部特征嵌入确定身份特征嵌入，以用于进行说话者身份验证。本发明专利技术提出了一种使用多模态的信息(来自人脸和声音)来进行人身份验证的一种方案，避免了单一模态下容易受到外部因素影响而无法进行身份验证的问题，提升了进行身份验证的成功率。

Speaker authentication method and system

全部详细技术资料下载

【技术实现步骤摘要】
说话者身份验证方法及系统
本专利技术涉及人工智能
，尤其涉及一种说话者身份验证方法及系统。
技术介绍
现有技术中的说话者身份验证方法有基于声纹的验证方法和基于人脸识别的验证方法。这些技术都是使用人的某些生理特征，来达到验证一个人身份的目的。人的某个生理特征在某种情况下可能不具有区分某个人的条件。例如，在比较嘈杂的环境，我们可能听不到某个特定人的声音；在一个人扭脸或在他/她运动的时候人脸特征可能不具备区分一个人的条件。
技术实现思路
本专利技术实施例提供一种说话者身份验证方法及系统，用于至少解决上述技术问题之一。第一方面，本专利技术实施例提供一种说话者身份验证方法，包括：获取所述说话者的音频数据和面部图像数据；从所述音频数据中提取语音特征嵌入，从所述面部图像数据中提取面部特征嵌入；根据所述语音特征嵌入和所述面部特征嵌入确定身份特征嵌入，以用于进行说话者身份验证。第二方面，本专利技术实施例提供一种说话者身份验证系统，包括：视听数据获取模块，用于获取所述说话者的音频数据和面部图像数据；特征提取模块，用于从所述音频数据中提取语音特征嵌入，从所述面部图像数据中提取面部特征嵌入；身份特征嵌入确定模块，用于根据所述语音特征嵌入和所述面部特征嵌入确定身份特征嵌入，以用于进行说话者身份验证。第三方面，本专利技术实施例提供一种存储介质，所述存储介质中存储有一个或多个包括执行指令的程序，所述执行指令能够被电子设备(包括但不限于计算机，...

【技术保护点】
1.一种说话者身份验证方法，包括：/n获取所述说话者的音频数据和面部图像数据；/n从所述音频数据中提取语音特征嵌入，从所述面部图像数据中提取面部特征嵌入；/n根据所述语音特征嵌入和所述面部特征嵌入确定身份特征嵌入，以用于进行说话者身份验证。/n

【技术特征摘要】
1.一种说话者身份验证方法，包括：
获取所述说话者的音频数据和面部图像数据；
从所述音频数据中提取语音特征嵌入，从所述面部图像数据中提取面部特征嵌入；
根据所述语音特征嵌入和所述面部特征嵌入确定身份特征嵌入，以用于进行说话者身份验证。

2.根据权利要求1所述的方法，其中，所述根据所述语音特征嵌入和所述面部特征嵌入确定身份特征嵌入包括：
将所述语音特征嵌入输入至第一嵌入特征转换层得到预处理语音特征嵌入；
将所述面部特征嵌入输入至第二嵌入特征转换层得到预处理面部特征嵌入；
对所述预处理语音特征嵌入和预处理面部特征嵌入进行融合处理，以得到身份特征嵌入。

3.根据权利要求2所述的方法，其中，所述对所述预处理语音特征嵌入和预处理面部特征嵌入进行融合处理，以得到身份特征嵌入包括：
通过注意力层，根据所述语音特征嵌入和所述面部特征嵌入确定注意力得分：

根据所述注意力得分确定加权系数：

根据所述加权系数和所述预处理语音特征嵌入以及所述预处理面部特征嵌入确定身份特征嵌入：

其中，ev为语音特征嵌入，ef为面部特征嵌入，为预处理语音特征嵌入，为预处理面部特征嵌入。

4.根据权利要求2所述的方法，其中，所述对所述预处理语音特征嵌入和预处理面部特征嵌入进行融合处理，以得到身份特征嵌入包括：
采用紧凑型双线性池化方式对所述预处理语音特征嵌入和预处理面部特征嵌入进行融合处理，以得到身份特征嵌入。

5.根据权利要求2所述的方法，其中，所述对所述预处理语音特征嵌入和预处理面部特征嵌入进行融合处理，以得到身份特征嵌入包括：
根据所述语音特征嵌入和所述面部特征嵌入确定门向量：
z＝σ(fatt([ef，ev]))
采用所述门向量对所述预处理语音特征嵌入和预处理面部特征嵌入进行融合得到身份特征嵌入：

其中，ev为语音特征嵌入，ef为面部特征嵌入，为预处理语音特征嵌入，为预处理面部特征嵌入，⊙表示逐元素乘积。

6.一种说话者身份验证系统，包括：
视听数据获取模块，用于获取所述说话者的音频数据和面部图像数据；
特征提取模块，用于从所述音频数据中提取语音特征嵌入，从所述面部图像数据中提取面部特征嵌入；
身份特征嵌入确定模...

【专利技术属性】
技术研发人员：钱彦旻，陈正阳，王帅，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人