语音识别方法、装置及车辆制造方法及图纸

技术编号:37981539 阅读:20 留言:0更新日期:2023-06-30 09:56
本申请涉及一种用语音识别方法、装置及车辆。该方法包括:接收车辆座舱内用户发出的语音请求;对待识别的语音请求进行特征提取,生成特征向量;根据输入的特征向量,通过声学模型输出对应的音节概率矩阵;根据音节概率矩阵,输入语音识别系统的语音解码图中进行解码路径搜索,获得语音识别文本并在车载系统的图形用户界面显示;其中,预先在语音解码图的发音词典解码图中的预设节点增加自跳转移弧,自跳转移弧的输入标签为预设占位符,输出标签为空值占位符。本申请提供的方案,能够获得纠正了口误的语音识别文本,便于语音指令的正确响应,提高人机交互的成功率,改善用户体验。改善用户体验。改善用户体验。

【技术实现步骤摘要】
语音识别方法、装置及车辆


[0001]本申请涉及语音识别
,尤其涉及一种语音识别方法、装置及车辆。

技术介绍

[0002]随着智能汽车的发展,其搭载的车载智能设备可以通过语音识别技术(Automatic Speech Recognition,ASR)对用户的语音进行语音识别,获得对应的语音识别文本后,进而通过NLU(Natural Language Understanding,自然语言理解)技术进行语义理解以供车端响应用户的语音指令,使得用户在车内通过语音不仅能够控制导航、音乐等车载软件,还能够控制车窗、空调等车内硬件。
[0003]然而,在用户的实际语音交互中,语音内容可能存在口误、重复等问题。例如,用户的真实意图为“导航去北京”,但在实际口述时,由于思绪停顿或者口吃等因素,表述的语音内容为“导航去北、北京”、“导航去广、北京”等。相应地,根据实际表述内容所获得的语音识别文本会影响NLU的理解结果,继而使车端无法正确响应用户的语音指令,降低语音交互的成功率,影响用户体验。

技术实现思路

[0004]为解决或部分解本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:接收车辆座舱内用户发出的语音请求;对待识别的所述语音请求进行特征提取,生成特征向量;根据输入的所述特征向量,通过声学模型输出对应的音节概率矩阵;根据所述音节概率矩阵,输入语音识别系统的语音解码图中进行解码路径搜索,获得语音识别文本并在车载系统的图形用户界面显示;其中,预先在所述语音解码图的发音词典解码图中的预设节点增加自跳转移弧,所述自跳转移弧的输入标签为预设占位符,输出标签为空值占位符。2.根据权利要求1所述的方法,其特征在于,所述预先在所述语音解码图的发音词典解码图中的预设节点增加自跳转移弧,包括:在所述发音词典解码图的终止节点增加所述自跳转移弧;及在所述发音词典解码图中的指定位置的中间节点增加所述自跳转移弧。3.根据权利要求1所述的方法,其特征在于,所述声学模型通过预先训练获得,其中:将原始训练数据中的原始音频与发音标签进行强制对齐,获得各所述发音标签对应的时间戳;根据各所述发音标签时间戳,将对应的原始音频进行切分,分别获得单个所述发音标签对应的音频片段;选取部分原始音频并分别增加语音噪声,生成对应的更新训练数据;将所述更新训练数据与所述原始训练数据合并作为训练数据对所述声学模型进行训练,获得训练后的声学模型。4.根据权利要求3所述的方法,其特征在于,所述选取部分原始音频并分别增加语音噪声,生成对应的更新训练数据,包括:在所述原始音频中的预设词组之中,插入与预设位置的单字具有相同发音标签的新增音频片段,生成对应的更新音频;及将新增音频片段对应的原始发音标签变更为所述预设占位符;将更新音频及对应的各发音标签作为更新训练数据。5.根据权利要求3所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:张辽
申请(专利权)人:广州小鹏汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1