【技术实现步骤摘要】
一种声纹识别方法及相关装置
[0001]本申请涉及声纹识别
,尤其涉及一种声纹识别方法及相关装置。
技术介绍
[0002]声纹识别,生物识别技术的一种,也称为说话人识别,有两类,即说话人辨认和说话人确认。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。声纹识别就是把声信号转换成电信号,再用计算机进行识别的过程。
[0003]目前的声纹识别方法中较为普遍的是基于神经网络模型的识别过程,通过获取到的特征向量与数据库向量之间的距离进行相似度识别,但是这种特征向量的特征表达能力还是太过单一,无法保证识别结果的准确性,导致实际的声纹识别效果欠佳。
技术实现思路
[0004]本申请提供了一种声纹识别方法及相关装置,用于解决现有技术的声纹特征向量表达单一,无法确保识别结果的准确性的技术问题。
[0005]有鉴于此,本申请第一方面提供了一种声纹识别方法,包括:
[0006]获取不同人说话的音频信息、对应的年龄段信息和性别信息;
[0 ...
【技术保护点】
【技术特征摘要】
1.一种声纹识别方法,其特征在于,包括:获取不同人说话的音频信息、对应的年龄段信息和性别信息;根据预置提取技术获取所述音频信息的基频、第一共振峰和第二共振峰;采用预置神经网络模型提取所述音频信息的音频特征向量,所述音频特征向量为所述预置神经网络模型的池化层的输入量;基于所述年龄段信息、所述性别信息、所述基频、所述第一共振峰、所述第二共振峰和所述音频特征向量构建综合特征向量;将所述综合特征向量输入所述预置神经网络模型中进行训练,得到音频识别神经网络模型。2.根据权利要求1所述的声纹识别方法,其特征在于,所述基于所述年龄段信息、所述性别信息、所述基频、所述第一共振峰、所述第二共振峰和所述音频特征向量构建综合特征向量,包括:将所述年龄段信息和所述性别信息通过组合的方式转换成组合标注信息;根据所述基频、所述第一共振峰和所述第二共振峰构建音频组合向量;将所述组合标注信息、所述音频组合向量和所述音频特征向量进行拼接,得到综合特征向量。3.根据权利要求2所述的声纹识别方法,其特征在于,所述根据所述基频、所述第一共振峰和所述第二共振峰构建音频组合向量,之后还包括:对所述音频组合向量进行归一化处理。4.根据权利要求1所述的声纹识别方法,其特征在于,所述将所述综合特征向量输入所述预置神经网络模型中进行训练,得到音频识别神经网络模型,之后还包括:采用测试音频、对应的测试年龄段信息和测试性别信息对所述音频识别神经网络模型进行测试,得到测试结果;将测试结果满足预置模型条件的所述音频识别神经网络模型作为目标音频识别模型。5.根据权利要求1所述的声纹识别方法,其特征在于,所述年龄段信息包括儿童、青年、中年和老年。6.一种声纹识别装置,其特征在于...
【专利技术属性】
技术研发人员:吴丽贤,布力,宋才华,林钰杰,关兆雄,杨峰,杜家兵,
申请(专利权)人:广东电网有限责任公司佛山供电局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。