车载语音识别方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号:24712312 阅读:25 留言:0更新日期:2020-07-01 00:36
本公开涉及一种车载语音识别方法、装置、可读存储介质及电子设备。方法包括:获取车辆内的音频信息;根据所述音频信息和训练后的语音识别模型,确定与所述音频信息相匹配的文本信息;在对语音识别模型进行训练时,由于是采用车辆内特定场景下的历史音频信息和与该历史音频信息相匹配的文本信息进行训练的,所以,训练后的语音识别模型能够适应车载语音场景,进而在利用该语音识别模型对车辆内的音频信息进行识别时,可以提高语音识别模型的识别率,以使语音识别模型准确地识别出文本信息,提升用户的使用体验。

【技术实现步骤摘要】
车载语音识别方法、装置、可读存储介质及电子设备
本公开涉及语音识别
,具体地,涉及一种车载语音识别方法、装置、可读存储介质及电子设备。
技术介绍
随着语音识别技术的快速发展,人们对车辆的要求越来越高,人们不只是希望能够安全驾驶,在保证安全驾驶的前提下,人们同样希望拥有良好的驾驶体验。因此,越来越多的语音识别装置安装在车辆上(通常称为车载语音识别系统),用户可以通过语音或智能语音设备进行交互,控制智能语音设备执行相应的操作,实现对车辆的自动控制,提升整车高端化、技术化。
技术实现思路
本公开的目的是提供一种车载语音识别方法、装置、可读存储介质及电子设备,以提高车载语音识别的准确率。为了实现上述目的,本公开提供一种车载语音识别方法,包括:获取车辆内的音频信息;根据所述音频信息和训练后的语音识别模型,确定与所述音频信息相匹配的文本信息;其中,所述语音识别模型通过以下训练方式得到:获取所述车辆内特定场景下的历史音频信息以及与所述历史音频信息相匹配的历史文本信息;根据所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,对所述语音识别模型进行训练,以得到训练后的所述语音识别模型。可选地,所述语音识别模型包括在线语音识别模型和离线语音识别模型,所述方法还包括:根据所述在线语音识别模型输出的文本信息,确定所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息;所述根据所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,对所述语音识别模型进行训练,以得到训练后的所述语音识别模型,包括:根据所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,对所述离线语音识别模型进行训练,以得到训练后的所述离线语音识别模型。可选地,每一车辆各自对应不同的在线语音识别模块、离线语音识别模型;所述根据所述在线语音识别模型输出的文本信息,确定所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,包括:针对每一车辆,根据该车辆的在线语音识别模型输出的文本信息,确定该车辆的所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息。可选地,所述根据所述在线语音识别模型输出的文本信息,确定所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,包括:获取所述在线语音识别模型输出的文本信息;确定所述文本信息是否位于预设列表中,所述预设列表中包括所述车辆的车机端能够执行的操作对应的文本信息;若所述文本信息位于预设列表中,则存储所述在线语音识别模型输出的所述文本信息,以及与所述文本信息对应的音频信息;在所存储的音频信息达到预设数值时,将所存储的所述音频信息、所述文本信息分别作为所述历史音频信息、所述历史文本信息。可选地,所述语音识别模型包括声学模型和语言模型;所述根据所述音频信息和预设的语音识别模型,确定与所述音频信息相匹配的文本信息,包括:根据所述音频信息和所述声学模型,确定所述音频信息的发音序列;根据所述发音序列和所述语言模型,确定与所述音频信息相匹配的文本信息。本公开第二方面还提供一种车载语音识别装置,包括:第一获取模块,用于获取车辆内的音频信息;第一确定模块,用于根据所述音频信息和训练后的语音识别模型,确定与所述音频信息相匹配的文本信息;其中,所述装置还包括:第二获取模块,用于获取所述车辆内特定场景下的历史音频信息以及与所述历史音频信息相匹配的历史文本信息;训练模块,用于根据所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,对所述语音识别模型进行训练,以得到训练后的所述语音识别模型。可选地,所述语音识别模型包括在线语音识别模型和离线语音识别模型,所述装置还包括:第二确定模块,用于根据所述在线语音识别模型输出的文本信息,确定所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息;所述训练模块,用于根据所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,对所述离线语音识别模型进行训练,以得到训练后的所述离线语音识别模型。可选地,每一车辆各自对应不同的在线语音识别模块、离线语音识别模型;所述第二确定模块包括:第一确定子模块,用于针对每一车辆,根据该车辆的在线语音识别模型输出的文本信息,确定该车辆的所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息。可选地,所述第二确定模块包括:获取子模块,用于获取所述在线语音识别模型输出的文本信息;第二确定子模块,用于确定所述文本信息是否位于预设列表中,所述预设列表中包括所述车辆的车机端能够执行的操作对应的文本信息;存储子模块,用于若所述文本信息位于预设列表中,则存储所述在线语音识别模型输出的所述文本信息,以及与所述文本信息对应的音频信息;第三确定子模块,用于在所存储的音频信息达到预设数值时,将所存储的所述音频信息、所述文本信息分别作为所述历史音频信息、所述历史文本信息。可选地,所述语音识别模型包括声学模型和语言模型;所述第一确定模块,包括:第四确定子模块,用于根据所述音频信息和所述声学模型,确定所述音频信息的发音序列;第五确定子模块,用于根据所述发音序列和所述语言模型,确定与所述音频信息相匹配的文本信息。本公开第三方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开第一方面所提供的所述方法的步骤。本公开第四方面提供一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现本公开第一方面所提供的所述方法的步骤。通过上述技术方案,在对语音识别模型进行训练时,由于是采用车辆内特定场景下的历史音频信息和与该历史音频信息相匹配的文本信息进行训练的,所以,训练后的语音识别模型能够适应车载语音场景,进而在利用该语音识别模型对车辆内的音频信息进行识别时,可以提高语音识别模型的识别率,以使语音识别模型准确地识别出文本信息,提升用户的使用体验。本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1是根据一示例性实施例示出的一种车载语音识别方法的流程图。图2是根据一示例性实施例示出的一种训练语音识别模型的流程图。图3是根据一示例性实施例示出的一种车载语音识别装置的框图。图4是根据一示例性实施例示出的一种电子设备的框图。具体实施方式以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。在相关技术中,传统的车载语音识别系统可以通过收集大量不同说话人的音频信本文档来自技高网...

【技术保护点】
1.一种车载语音识别方法,其特征在于,包括:/n获取车辆内的音频信息;/n根据所述音频信息和训练后的语音识别模型,确定与所述音频信息相匹配的文本信息;/n其中,所述语音识别模型通过以下训练方式得到:/n获取所述车辆内特定场景下的历史音频信息以及与所述历史音频信息相匹配的历史文本信息;/n根据所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,对所述语音识别模型进行训练,以得到训练后的所述语音识别模型。/n

【技术特征摘要】
1.一种车载语音识别方法,其特征在于,包括:
获取车辆内的音频信息;
根据所述音频信息和训练后的语音识别模型,确定与所述音频信息相匹配的文本信息;
其中,所述语音识别模型通过以下训练方式得到:
获取所述车辆内特定场景下的历史音频信息以及与所述历史音频信息相匹配的历史文本信息;
根据所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,对所述语音识别模型进行训练,以得到训练后的所述语音识别模型。


2.根据权利要求1所述的方法,其特征在于,所述语音识别模型包括在线语音识别模型和离线语音识别模型,所述方法还包括:
根据所述在线语音识别模型输出的文本信息,确定所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息;
所述根据所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,对所述语音识别模型进行训练,以得到训练后的所述语音识别模型,包括:
根据所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,对所述离线语音识别模型进行训练,以得到训练后的所述离线语音识别模型。


3.根据权利要求2所述的方法,其特征在于,每一车辆各自对应不同的在线语音识别模块、离线语音识别模型;所述根据所述在线语音识别模型输出的文本信息,确定所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,包括:
针对每一车辆,根据该车辆的在线语音识别模型输出的文本信息,确定该车辆的所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息。


4.根据权利要求2所述的方法,其特征在于,所述根据所述在线语音识别模型输出的文本信息,确定所述历史音频信息以及与所述历史音频信息相匹配的历史文本信息,包括:
获取所述在线语音识别模型输出的文本信息;
确定所述文本信息是否位于预设列表中,所述预设列表中包括所述车辆的车机端能够执行的操作对应的文本信息;
若所述文本信息位于预设列表中,则存储所述在线语音识别模型输出的所述文本信息,以及与所述文本信息对应的音频信息;
在所存储的音频信息达到预设数值时,将所存储的所述音频信息、所述文本信息分别作为所述历史音频信息、所述历史文本信息...

【专利技术属性】
技术研发人员:莫凡孙珏薛思皓毛丽旦·玉素甫江
申请(专利权)人:镁佳北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1