语音识别方法、装置、终端、系统、介质及产品制造方法及图纸

技术编号:36900979 阅读:9 留言:0更新日期:2023-03-18 09:21
本申请属于人工智能技术领域,具体提供一种语音识别方法、装置、终端、系统、介质及产品,方法包括:获取目标用户待识别的用户语音数据;将用户语音数据输入AI芯片中训练至收敛的语音识别模型,以生成语音识别结果;其中,语音识别模型为根据用户训练样本和语音识别服务器的通用识别模型训练生成的;语音识别模型与目标用户相匹配;输出语音识别结果。本申请的语音识别方法,通过与用户匹配性较高的语音识别模型对目标用户待识别的用户语音数据进行识别,生成的语音识别结果准确性较高,同时,由于语音识别模型设于AI芯片中,不需要通过网络传输数据至语音识别服务器进行语音识别,语音识别的效率较高。识别的效率较高。识别的效率较高。

【技术实现步骤摘要】
语音识别方法、装置、终端、系统、介质及产品


[0001]本申请涉及人工智能
,尤其涉及一种语音识别方法、装置、终端、系统、介质及产品。

技术介绍

[0002]随着人工智能的不断发展,语音识别逐渐应用在各个领域。目前语音识别应用主要采用通用识别模型,通过大规模采集用户群的声音数据,采用声音数据对通用识别模型进行训练,使该通用识别模型可以识别大多数用户的声音,但与单个用户的匹配性较低。
[0003]同时,该通用识别模型设于语音识别服务器中,当用户终端存在语音识别需求时,将用户语音数据发送至语音识别服务器以进行语音识别,语音识别的效率较低。
[0004]因而,目前的语音识别方式中对用户语音识别的准确性和效率都较低。

技术实现思路

[0005]本申请提供一种语音识别方法、装置、终端、系统、介质及产品,用以解决目前语音识别方式中对用户语音识别的准确性和效率都较低的问题。
[0006]本申请第一方面提供一种语音识别方法,应用于用户终端,所述用户终端包括AI芯片,所述方法包括:
[0007]获取目标用户待识别的用户语音数据;
[0008]将所述用户语音数据输入所述AI芯片中训练至收敛的语音识别模型,以生成语音识别结果;其中,所述语音识别模型为根据用户训练样本和语音识别服务器的通用识别模型训练生成的;所述语音识别模型与所述目标用户相匹配;
[0009]输出所述语音识别结果。
[0010]进一步地,如上所述的方法,所述将所述用户语音数据输入所述AI芯片中训练至收敛的语音识别模型,以生成语音识别结果,包括:
[0011]采用所述语音识别模型对所述用户语音数据进行特征提取,以生成用户语音特征;
[0012]采用所述语音识别模型对所述用户语音特征进行特征识别,以生成语音识别结果。
[0013]进一步地,如上所述的方法,所述获取目标用户待识别的用户语音数据之前,还包括:
[0014]获取目标用户待训练的用户语音数据;
[0015]将所述待训练的用户语音数据发送至语音识别服务器,以生成对应语音识别文本;
[0016]获取并显示所述语音识别文本,以使目标用户对所述语音识别文本进行校验,生成对应的正确语音文本;
[0017]将所述用户语音数据、所述语音识别文本以及所述正确语音文本作为训练样本训
练预设语音识别模型,以生成与目标用户匹配的训练至收敛的语音识别模型。
[0018]进一步地,如上所述的方法,所述获取目标用户待训练的用户语音数据,包括:
[0019]响应于目标用户触发的训练指令,接收目标用户输入的待训练的用户语音数据。
[0020]进一步地,如上所述的方法,所述语音识别服务器包括:通用识别模型;
[0021]所述将所述待训练的用户语音数据发送至语音识别服务器,以生成对应语音识别文本,包括:
[0022]将所述待训练的用户语音数据发送至语音识别服务器,以通过所述通用识别模型对所述用户语音数据进行语音识别,生成对应的语音识别文本。
[0023]进一步地,如上所述的方法,所述获取并显示所述语音识别文本,以使目标用户对所述语音识别文本进行校验,生成对应的正确语音文本,包括:
[0024]接收所述语音识别服务器发送的所述语音识别文本,并进行显示;
[0025]响应于目标用户对所述语音识别文本的校验操作,以生成校验后对应的正确语音文本。
[0026]进一步地,如上所述的方法,所述将所述用户语音数据、所述语音识别文本以及所述正确语音文本作为训练样本训练预设语音识别模型,以生成与目标用户匹配的训练至收敛的语音识别模型,包括:
[0027]将所述用户语音数据、所述语音识别文本以及所述正确语音文本确定为训练样本;
[0028]采用预设语音识别训练算法根据所述训练样本对所述预设语音识别模型进行训练;
[0029]若采用预设损失函数确定所述预设语音识别模型收敛,则将所述预设语音识别模型确定为训练至收敛的语音识别模型。
[0030]进一步地,如上所述的方法,所述方法还包括:
[0031]响应于目标用户触发的模型更新指令,接收目标用户输入的待强化训练的用户语音数据;
[0032]根据所述待强化训练的用户语音数据和预设增强学习训练算法对所述训练至收敛的语音识别模型进行增强训练,以完成模型更新处理。
[0033]本申请第二方面提供一种语音识别装置,位于用户终端,所述用户终端包括AI芯片,所述装置包括:
[0034]获取模块,用于获取目标用户待识别的用户语音数据;
[0035]生成模块,用于将所述用户语音数据输入所述AI芯片中训练至收敛的语音识别模型,以生成语音识别结果;其中,所述语音识别模型为根据用户训练样本和语音识别服务器的通用识别模型训练生成的;所述语音识别模型与所述目标用户相匹配;
[0036]输出模块,用于输出所述语音识别结果。
[0037]进一步地,如上所述的装置,所述生成模块具体用于:
[0038]采用所述语音识别模型对所述用户语音数据进行特征提取,以生成用户语音特征;采用所述语音识别模型对所述用户语音特征进行特征识别,以生成语音识别结果。
[0039]进一步地,如上所述的装置,所述装置还包括:
[0040]训练模块,用于获取目标用户待训练的用户语音数据;将所述待训练的用户语音
数据发送至语音识别服务器,以生成对应语音识别文本;获取并显示所述语音识别文本,以使目标用户对所述语音识别文本进行校验,生成对应的正确语音文本;将所述用户语音数据、所述语音识别文本以及所述正确语音文本作为训练样本训练预设语音识别模型,以生成与目标用户匹配的训练至收敛的语音识别模型。
[0041]进一步地,如上所述的装置,所述训练模块在获取目标用户待训练的用户语音数据时,具体用于:
[0042]响应于目标用户触发的训练指令,接收目标用户输入的待训练的用户语音数据。
[0043]进一步地,如上所述的装置,所述语音识别服务器包括:通用识别模型;
[0044]所述训练模块在将所述待训练的用户语音数据发送至语音识别服务器,以生成对应语音识别文本时,具体用于:
[0045]将所述待训练的用户语音数据发送至语音识别服务器,以通过所述通用识别模型对所述用户语音数据进行语音识别,生成对应的语音识别文本。
[0046]进一步地,如上所述的装置,所述训练模块在获取并显示所述语音识别文本,以使目标用户对所述语音识别文本进行校验,生成对应的正确语音文本时,具体用于:
[0047]接收所述语音识别服务器发送的所述语音识别文本,并进行显示;响应于目标用户对所述语音识别文本的校验操作,以生成校验后对应的正确语音文本。
[0048]进一步地,如上所述的装置,所述训练模块在将所述用户语音数据、所述语音识别文本以及所述正确语音文本作为训练样本训练预设语音识别模型,以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,应用于用户终端,所述用户终端包括AI芯片,所述方法包括:获取目标用户待识别的用户语音数据;将所述用户语音数据输入所述AI芯片中训练至收敛的语音识别模型,以生成语音识别结果;其中,所述语音识别模型为根据用户训练样本和语音识别服务器的通用识别模型训练生成的;所述语音识别模型与所述目标用户相匹配;输出所述语音识别结果。2.根据权利要求1所述的方法,其特征在于,所述将所述用户语音数据输入所述AI芯片中训练至收敛的语音识别模型,以生成语音识别结果,包括:采用所述语音识别模型对所述用户语音数据进行特征提取,以生成用户语音特征;采用所述语音识别模型对所述用户语音特征进行特征识别,以生成语音识别结果。3.根据权利要求1或2所述的方法,其特征在于,所述获取目标用户待识别的用户语音数据之前,还包括:获取目标用户待训练的用户语音数据;将所述待训练的用户语音数据发送至语音识别服务器,以生成对应语音识别文本;获取并显示所述语音识别文本,以使目标用户对所述语音识别文本进行校验,生成对应的正确语音文本;将所述用户语音数据、所述语音识别文本以及所述正确语音文本作为训练样本训练预设语音识别模型,以生成与目标用户匹配的训练至收敛的语音识别模型。4.根据权利要求3所述的方法,其特征在于,所述获取目标用户待训练的用户语音数据,包括:响应于目标用户触发的训练指令,接收目标用户输入的待训练的用户语音数据。5.根据权利要求4所述的方法,其特征在于,所述语音识别服务器包括:通用识别模型;所述将所述待训练的用户语音数据发送至语音识别服务器,以生成对应语音识别文本,包括:将所述待训练的用户语音数据发送至语音识别服务器,以通过所述通用识别模型对所述用户语音数据进行语音识别,生成对应的语音识别文本。6.根据权利要求5所述的方法,其特征在于,所述获取并显示所述语音识别文本,以使目标用户对所述语音识别文本进行校验,生成对应的正确语音文本,包括:接收所述语音识别服务器发送的所述语音识别文本,并进行显示;响应于目标用户对所述语音识别文本的校验操作,以生成校验后对应的正确语音文本。7.根据权利要求6所述的方法,其特征...

【专利技术属性】
技术研发人员:贾平楠刘攀张冬罗涛
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1