一种基于人工智能的对讲机声纹识别方法及系统技术方案

技术编号：39744230 阅读：22 留言：0更新日期：2023-12-17 23:43

本发明专利技术公开了一种基于人工智能的对讲机声纹识别方法及系统，涉及音频分析技术领域，方法包括以下步骤：收集各对讲机使用者的语音信息，预处理后生成第一声纹信息，汇总后建立声纹库；将使用者的第一声纹信息与其对讲机信息绑定；在使用对讲机进行通话时，获取语音信息进行所述预处理生成对应的第二声纹信息；该基于人工智能的对讲机声纹识别方法及系统，通过对对讲机使用者的语音信息进行情感分析，并对不同情感状态下的相同字词句分别进行特征分析，得到相同字

全部详细技术资料下载

【技术实现步骤摘要】
一种基于人工智能的对讲机声纹识别方法及系统

[0001]本专利技术涉及音频分析
，具体涉及一种基于人工智能的对讲机声纹识别方法及系统
。

技术介绍

[0002]语音是人类最自然的交互方式，不同说话者的发声器官具有差异性，比如
,
独特的发声结构
、
喉部大小
、
鼻口腔
、
发音习惯
、
语调
、
节奏等，所形成的声音信息可以代表个人特征，故通过分析讲话人语音特征可以有效识别讲话人身份，即声纹识别
。
在一些特殊场合需要使用无线电
、
对讲机等远程通话，尤其在某些场景下需要保证对讲机对面的人为对讲机持有者本人，用以保证安全等需要
。
[0003]公开号为
CN109920435A
的中国专利，公开了一种声纹识别方法，包含：接收未知用户输入的待识别语音信号；提取所述待识别语音信号中每一帧所对应的帧声纹特征；计算各所述帧声纹特征的后验概率；基于所述后验概率对...

【技术保护点】

【技术特征摘要】
1.
一种基于人工智能的对讲机声纹识别方法，其特征在于：包括以下步骤：
S1、
收集各对讲机使用者的语音信息，预处理后生成第一声纹信息，汇总后建立声纹库；
S2、
将使用者的第一声纹信息与其对讲机信息绑定；
S3、
在使用对讲机进行通话时，获取语音信息进行预处理生成对应的第二声纹信息，基于所述声纹库和声纹识别算法对通话时的第二声纹信息进行特征匹配；
S4、
显示语音信息来源的对讲机及匹配结果；
S5、
对匹配成功的第二声纹信息进行收集，并对所述第二声纹信息进行情感分析；
S6、
根据所述情感分析的结果和声纹匹配的结果对所述第二声纹信息进行分类，得到每个使用者第二声纹信息的多个语音情感组；
S7、
对于每个使用者的每个语音情感组的第二声纹信息进行文字转换，并将第二声纹信息按照文字转换的字
、
词
、
句的不同进行分类，得到语音对比组；
S8、
将所述语音情感组和所述语音对比组，更新到所述声纹库中
。2.
根据权利要求1所述的一种基于人工智能的对讲机声纹识别方法，其特征在于：所述方法还包括基于声纹信息，对声纹识别算法进行训练，生成各使用者的声纹模型
。3.
根据权利要求1所述的一种基于人工智能的对讲机声纹识别方法，其特征在于：所述方法还包括：对每个使用者的每个语音情感组的每个语音对比组的第二声纹信息，进行特征匹配；基于每个所述语音对比组中特征匹配不同的第二声纹信息，分别对声纹识别算法进行训练生成对应的声纹子模型，每个使用者的声纹子模型共同组成该使用者的声纹模型
。4.
根据权利要求3所述的一种基于人工智能的对讲机声纹识别方法，其特征在于：进行所述特征匹配时，首先对相同字的语音对比组对应的第二声纹信息进行特征匹配；基于特征匹配的相似度将对应的第二声纹信息进行分类，并分别基于分类后的每一类第二声纹信息，对声纹识别算法进行训练，分别得到第一声纹子模型与该语音对比组对应；记录各词对应的第二声纹信息出现的频率及次数，并设定词频率阈值和词次数阈值
。5.
根据权利要求4所述的一种基于人工智能的对讲机声纹识别方法，其特征在于：若检测到一个词对应的第二声纹信息，满足出现的频率超过所述词频率阈值，或出现的次数超过词次数阈值中的至少一个，则新建语音对比组用于储存该词对应的第二声纹信息；对词对应的语音对比组的第二声纹信息进行特征匹配；基于特征匹配的相似度将对应的第二声纹信息进行分类，并分别基于分类后的每一类第二声纹信息，对声纹识别算法进行训练...

【专利技术属性】
技术研发人员：张文美，潘仁兴，
申请(专利权)人：中瑞科技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人