【技术实现步骤摘要】
语音识别方法、活体检测方法、模型训练方法及装置
本专利技术涉及信息处理
,尤其涉及一种语音识别方法、活体检测方法、模型训练方法及装置。
技术介绍
随着电子技术和自然语言处理技术的发展,语音识别技术的应用越来越广泛。现有的语音识别系统往往适用于所有类型的字符(例如,汉字、字母、数字等字符)的识别,为了兼顾不同类型的字符的识别,结构往往较为复杂,识别速度较慢,例如,将待识别的语音信号按照预设长度分帧,提取语音特征,将提取的语音特征输入训练好的音素声学模型,得到音素结果,并将音素结果输入语言模型,得到语音识别结果。然而,存在一些场景仅需要进行预设字符的语音识别,例如,密码输入、验证码输入等场景,通常仅需要数字类字符的识别或者字母类字符的识别,若在该种情况下采用上述普适性的语音识别系统进行语音识别,不仅速度较慢,而且语音识别的准确性较差。
技术实现思路
本专利技术实施例提供一种语音识别方法、活体检测方法、模型训练方法及装置,以解决现有技术中预设字符语音识别准确性较差的问题。为了解决上述技术问 ...
【技术保护点】
1.一种语音识别方法,其特征在于,包括:/n提取待识别的语音信号的声谱特征;/n将所述声谱特征输入堆叠的卷积神经网络处理后得到的特征信息输入循环神经网络处理,并将所述经循环神经网络处理后得到的特征信息输入序列到序列网络编解码后,输出所述语音信号对应的字符序列,得到识别结果;/n其中,所述循环神经网络包括双向门控循环单元网络或长短期记忆网络。/n
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
提取待识别的语音信号的声谱特征;
将所述声谱特征输入堆叠的卷积神经网络处理后得到的特征信息输入循环神经网络处理,并将所述经循环神经网络处理后得到的特征信息输入序列到序列网络编解码后,输出所述语音信号对应的字符序列,得到识别结果;
其中,所述循环神经网络包括双向门控循环单元网络或长短期记忆网络。
2.根据权利要求1所述的方法,其特征在于,所述将所述声谱特征输入堆叠的卷积神经网络处理后得到的特征信息输入循环神经网络处理,并将所述经循环神经网络处理后得到的特征信息输入序列到序列网络编解码后,输出所述语音信号对应的字符序列,得到识别结果具体包括:
所述堆叠的卷积神经网络对输入的所述声谱特征中的频域特征进行增强处理;
所述循环神经网络对输入的经所述堆叠的卷积神经网络处理后的声谱特征中的时间特征信息进行增强处理;
所述序列到序列网络对输入的经所述循环神经网络处理后的声谱特征编解码,输出字符序列。
3.一种活体检测方法,其特征在于,包括:
采集待检测对象读目标字符序列的语音信号和包含唇部的视频信号,其中,所述目标字符序列中的字符均为预设字符;
利用权利要求1至2中任一项所述的语音识别方法对所述语音信号进行识别,得到所述语音信号对应的第一字符序列;
对所述视频信号进行唇语识别,得到所述视频信号对应的第二字符序列;
根据所述第一字符序列和所述第二字符序列判断所述对象是否为活体。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一字符序列和所述第二字符序列判断所述对象是否为活体,包括:
计算所述第一字符序列和所述第二字符序列的相似度;
在所述相似度小于阈值的情况下,确定所述对象不是活体;
在所述相似度大于或等于阈值的情况下,根据所述第一字符序列与所述目标字符序列的比对结果判断所述对象是否为活体。
5.一种模型训练方法,其特征在于,包括:
获取N个语音样本,其中,所述语音样本为预设字符对应的语音样本,N为正整数;
分别提取所述N个语音样本中每个语音样本的声谱特征;
根据所述N个语音样本的声谱特征对目标网络进行训练,得到语音识别模型;
其中,所述目标网络包括堆叠的卷积神经网络、循环神经网络和序...
【专利技术属性】
技术研发人员:赵幸福,蒋宁,赵立军,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。