声纹识别方法、装置、存储介质、电子装置制造方法及图纸

技术编号：24689972 阅读：51 留言：0更新日期：2020-06-27 09:50

本发明专利技术提供了一种声纹识别方法、装置、存储介质、电子装置，其中，该方法包括：实时监测是否接收到唤醒词语音；在确定接收到唤醒词语音的情况下，提取唤醒词语音的声纹特征，并将声纹特征录入声纹库；提取实时监测到的当前语音信号的声纹特征；对比当前语音信号的声纹特征与声纹库中存储的任一声纹特征是否相同；如果匹配到相同的声纹特征，则对当前语音信号执行语义识别并进行反馈。通过本发明专利技术，解决现有技术中多人交谈等干扰较强的场景下机器人与发出指令的说话人之间的对话被打断或中止的技术问题，实现了在背景音干扰较强的场景下仍可以保持与发出指令的说话人进行对话的技术效果。

Voiceprint recognition method, device, storage medium and electronic device

全部详细技术资料下载

【技术实现步骤摘要】
声纹识别方法、装置、存储介质、电子装置
本专利技术涉及声纹识别领域，具体而言，涉及一种声纹识别方法、装置、存储介质、电子装置。
技术介绍
声纹(Voiceprint)，是用电声学仪器显示的携带言语信息的声波频谱。人在讲话时使用的发声器官—舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大，所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性，又有变异性，不是绝对的、一成不变的。声纹识别，也称为说话人识别，有两类，即说话人辨认和说话人确认。前者用以判断某段语音是若干人中的哪一个所说的，是“多选一”问题；而后者用以确认某段语音是否是指定的某个人所说的，是“一对一判别”问题。不同的任务和应用会使用不同的声纹识别技术，如缩小刑侦范围时可能需要辨认技术，而银行交易时则需要确认技术。一个典型的声音识别系统的识别过程一般需要涉及如下几个步骤：声音信号的采集与量化、预处理、信号特征的提取、模板匹配识别等。现有的声纹识别应用场景大都为智能安防、公安系统，在机器人的动态识别交互人上还未有应用。在目前的场景中...

【技术保护点】
1.一种声纹识别方法，其特征在于，所述方法包括：/n实时监测是否接收到唤醒词语音；/n在确定接收到所述唤醒词语音的情况下，提取所述唤醒词语音的声纹特征，并将所述声纹特征录入声纹库；/n提取实时监测到的当前语音信号的声纹特征；/n对比所述当前语音信号的声纹特征与声纹库中存储的任一声纹特征是否相同；/n如果匹配到相同的声纹特征，则对所述当前语音信号执行语义识别并进行反馈。/n

【技术特征摘要】
1.一种声纹识别方法，其特征在于，所述方法包括：
实时监测是否接收到唤醒词语音；
在确定接收到所述唤醒词语音的情况下，提取所述唤醒词语音的声纹特征，并将所述声纹特征录入声纹库；
提取实时监测到的当前语音信号的声纹特征；
对比所述当前语音信号的声纹特征与声纹库中存储的任一声纹特征是否相同；
如果匹配到相同的声纹特征，则对所述当前语音信号执行语义识别并进行反馈。

2.根据权利要求1所述的方法，其特征在于，在将所述声纹特征录入声纹库之后，所述方法还包括：
判断所述声纹库中每个所述声纹特征的说话人在最后一次说话的时刻之后，是否超过预设时长之内未再次说话；
如果否，则删除对应的声纹特征；
如果是，则更新对应声纹特征的说话人最后一次说话的时刻。

3.根据权利要求1所述的方法，其特征在于，所述将所述声纹特征录入声纹库，包括：
对包括所述唤醒词语音的声音信号执行预处理；
提取预处理后的包括所述唤醒词语音的声音信号中的声学特征，以得到用于表示所述声纹特征的特征矢量序列；
将所述特征矢量序列存储至所述声纹库。

4.根据权利要求3所述的方法，其特征在于，所述声纹特征通过基于时间帧的特征矢量序列表示，所述对比所述当前语音信号的声纹特征与声纹库中存储的任一声纹特征是否相同，包括：
识别所述当前语音信号中的每个发音音素；
提取所述当前语音信号中每个发音音素对应的声纹信号的特征矢量序列；
计算所述当前语音信号每个发音音素的特征矢量序列与所述声纹库中存储的第一声纹特征的对应发音音素的特征矢量序列的最小距离；
判断所述最小距离是否小于预设阈值，其中，如果小于所述预设阈值，则确定所述当前语音信号匹配到所述第一声纹特征。

5.一种声纹识别装置，其特征在于，所述装置包括：
监测模块，用于实时监测是否接收到唤醒词语音；
第一提取模块，用于在确定接收到所述唤醒词语音的情况下，提取所述唤醒词语音的声纹特征，并将所述声纹特征录入声纹库；...

【专利技术属性】
技术研发人员：郜开开，吴信朝，周宝，陈远旭，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人