一种支持本地模型训练的离线语音识别设备制造技术

技术编号:37264375 阅读:29 留言:0更新日期:2023-04-20 23:36
本发明专利技术提供了一种支持本地模型训练的离线语音识别设备,包括:声学模型,用于将用户语音并转化为语音数据;指令集,用于存储命令词;语言模型,用于对语音数据进行识别,并提取语音数据里的命令词;声音存储模块,用于存储采集到的用户语音数据;声音检测模块,用于启动声学模型、语言模型,并对用户语音进行识别;训练模块,用于对声学模型、语言模型进行模型训练;离线语音识别设备包括普通训练模式,当用户语音或语音数据采集量满足设定阈值时,启动训练模块,进行模型训练;所述离线语音识别设备还包括特殊训练模式;通过语音指令触发训练,使设备启动训练模式,进行训练。本发明专利技术可进行本地模型训练,不需联网也可实现语音识别及模型训练。模型训练。模型训练。

【技术实现步骤摘要】
一种支持本地模型训练的离线语音识别设备


[0001]本专利技术涉及一种离线语音识别设备,特别是涉及一种支持本地模型训练的离线语音识别设备。

技术介绍

[0002]现有语音识别设备都是采用语音识别算法实现对用户语言的识别。语音识别算法主要基于深度学习理论实现的语音识别。但深度学习需要基于大量的数据进行训练,现有的技术都是传到云端服务器训练后,再下载更新,导致语音模型在更新时需要联网,对于离线语音识别产品来说,严重限制了语音识别设备的后续识别效果提升。而随着现有语音识别终端产品的计算能力已经大幅提升,对于小场景的小数据可以实现本地化训练,需要配备支持本地模型训练的离线语音识别方法。

技术实现思路

[0003]本专利技术提供了一种支持本地模型训练的离线语音识别设备,以实现在离线情况下对语音的识别及训练。
[0004]本专利技术提供了一种支持本地模型训练的离线语音识别设备,包括:
[0005]声学模型,所述声学模型用于将用户语音并转化为语音数据;
[0006]指令集,所述指令集用于存储命令词;
[0007本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种支持本地模型训练的离线语音识别设备,其特征在于,所述离线语音识别设备包括:声学模型,所述声学模型用于将用户语音并转化为语音数据;指令集,所述指令集用于存储命令词;语言模型,所述语言模型用于对语音数据进行识别,并提取语音数据里的命令词;声音存储模块,所述声音存储模块用于存储采集到的用户语音、语音数据;声音检测模块,所述声音检测模块用于启动声学模型、语言模型,并对用户语音进行识别;训练模块,所述训练模块用于对声学模型、语言模型进行模型训练;离线语音识别设备包括普通训练模式,在普通训练模式下,当用户语音或语音数据采集量满足设定阈值时,启动训练模块,进行模型训练。2.根据权利要求1所述一种支持本地模型训练的离线语音识别设备,其特征在于,所述离线语音识别设备还包括特殊训练模式;在特殊训练模式下,通过语音指令触发训练,使设备启动训练模式,进行训练。3.根据权利要求1所述一种支持本地模型训练的离线语音识别设备,其特征在于,所述普通训练模式的运行过程为:S101.获取语音数据采集量;S102.将语音数据采集量与设定阈值进行比对;S103.若达到设定阈值,则基于当前语音数据采集量对声学模型、语言模型进行模型训练;S104.将训练后的模型作为新的声学模型、语言模型,并更新指令集。4.根据权利要求3所述一种支持本地模型训练的离线语音识别设备,其特征在于,所述普通训练模式的运行过程还包括:S105.对训练后采集的语音数据重新进行语音数据采集量的统计。5.根据权利要求2所述一种支持本地模型训练的离线语音识别设备,其特征在于,所述特殊训练模式的运行过程为:S201.对用户语音进行识别,获取用于训练的控制命令;S202.根据训练命令,对声音存储模块...

【专利技术属性】
技术研发人员:张强
申请(专利权)人:广州读音智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1