短语语音的声纹识别方法及装置制造方法及图纸

技术编号:24689962 阅读:98 留言:0更新日期:2020-06-27 09:49
本发明专利技术提供一种短语语音的声纹识别方法及装置,方法包括:获取用户录入的短语语音的音频;对所述短语语音的音频进行音素提取处理并对提取的音素进行排序;根据所述排序后的音素和预设的音素提取模型进行特征提取处理并基于提取的特征进行声纹识别。本发明专利技术通过音素提取及排序将短语语音转换为因素的固定文本,基于转换后的固定文本进行声纹识别,提高短语语音的声纹识别准确率。

Voiceprint recognition method and device of phrase speech

【技术实现步骤摘要】
短语语音的声纹识别方法及装置
本专利技术涉及声纹识别
,具体涉及一种短语语音的声纹识别方法及装置。
技术介绍
目前,人工智能技术广泛应用于各领域,尤其是在办公领域中的应用,人工智能技术将大量重复性流程剥离出主要业务流程,显著地提高了办公效率及正确率。在人工智能
中,声纹识别技术正逐渐应用到银行业,典型应用场景为电话银行,电话银行呼叫中心使用声纹识别作为用户身份验证的辅助手段并搭建声纹黑名单,有效抵制电话诈骗。由于声纹识别算法的局限性,要取得较理想的声纹识别准确率必须对有效长语音进行识别,而在声纹识别的实际应用中,用户讲话习惯决定用户的录音往往达不到有效长语音的要求,因而实际场景下的声纹识别准确率相对较低,在某些特定场景下甚至无法达到可应用的最低要求。因此,现有的声纹识别算法在对短语语音的音频进行识别时,还存在识别准确率低的问题。
技术实现思路
针对现有技术中的问题,本专利技术提供一种短语语音的声纹识别方法及装置,能够有效提高对短语语音的音频识别的准确率。为解决上述技术问题,本专利技术提供以本文档来自技高网...

【技术保护点】
1.一种短语语音的声纹识别方法,其特征在于,包括:/n获取用户录入的短语语音的音频;/n对所述短语语音的音频进行音素提取处理并对提取的音素进行排序;/n根据所述排序后的音素和预设的音素提取模型进行特征提取处理并基于提取的特征进行声纹识别。/n

【技术特征摘要】
1.一种短语语音的声纹识别方法,其特征在于,包括:
获取用户录入的短语语音的音频;
对所述短语语音的音频进行音素提取处理并对提取的音素进行排序;
根据所述排序后的音素和预设的音素提取模型进行特征提取处理并基于提取的特征进行声纹识别。


2.根据权利要求1所述的短语语音的声纹识别方法,其特征在于,对所述短语语音的音频进行音素提取处理,包括:
采用音素提取神经网络对短语语音的音频进行辅音音素的提取处理。


3.根据权利要求1所述的短语语音的声纹识别方法,其特征在于,所述基于提取的特征进行声纹识别,包括:
根据提取的特征与用户留存的特征进行比对,若比对结果相同,则声纹识别通过。


4.根据权利要求1所述的短语语音的声纹识别方法,其特征在于,还包括:根据短语语音的音频、该短语语音的音频对应的特征标签和时延神经网络进行训练得到预设的音素提取模型。


5.根据权利要求4所述的短语语音的声纹识别方法,其特征在于,所述根据短语语音的音频、该短语语音的音频对应的特征标签和时延神经网络进行训练得到预设的音素提取模型,包括:
对所述短语语音的音频进行音素提取处理并对提取的音素进行排序;
采用时延神经网络对排序后的音素进行特征提取处理;
将特征提取结果和短语语音的音频对应的特征标签的交叉熵作为损失函数,基于所述损失函数对时延神经网络的参数进行训练;
其中,所述损失函数的函数值小于预设阈值,结束对时延神经网络的参数进行训练。


6.一种短语语音的声纹识别装置,其特征在于,包括:
获取单元,用于获取用户录入的短语语音的音频;
排序单元,用于对所述短语语音的音频进行音素提取处理并对提取的音素进行排序;

【专利技术属性】
技术研发人员:吕楠楠巫昌凯宁博周远侠
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1