语音识别装置和方法、语音交互系统和方法制造方法及图纸

技术编号：24012908 阅读：50 留言：0更新日期：2020-05-02 02:21

本发明专利技术涉及一种语音识别装置和方法、语音交互系统和方法。本发明专利技术的语音识别装置能够接收用户的语音输入，并且能够从远端语音识别模块在线接收其对所述语音输入在线处理后输出的第一语音识别结果；所述语音识别装置还包括：本地语音识别模块，其被配置有基于二值化神经网络算法构建的第二声学模型；其中，所述本地语音识别模块至少通过所述第二声学模型对从所述语音输入提取的语音特征进行处理以输出第二语音识别结果。本发明专利技术的语音识别及时、准确，受网络连接状况影响小，用户体验好。

Speech recognition device and method, speech interaction system and method

全部详细技术资料下载

【技术实现步骤摘要】
语音识别装置和方法、语音交互系统和方法
本专利技术属于语音识别
，涉及一种其本地语音识别模块采用使用二值化神经网络（BinaryNeuralNetwork,BNN）算法构建的声学模型的语音识别装置、语音识别方法、使用该语音识别装置的语音交互系统以及相应的一种语音交互方法。
技术介绍
车载语音识别终端等语音识别装置要求快速（即实时性）、准确（即高识别率）地识别用户的语音输入，以提高其在例如语音交互系统中应用时的用户体验。语音识别装置的本地端通常具有基于声学模型和语音模型工作的本地识别引擎，其中，声学模型在对用户的语音输入进行计算处理，计算资源开销通常非常大，因此，对语音识别装置（例如车载语音识别终端）的计算能力要求高。本地识别引擎配置或使用的声学模型例如可以通过、GMM（高斯混合模型，GaussianMixtureModel）-HMM（隐马尔科夫模型）、深度神经网络（DeepNeutralNetwork，DNN）-HMM、深度神经网络（DeepNeutralNetwork，DNN）进行建模并训练形成，它们在使用时...

【技术保护点】
1.一种语音识别装置，其能够接收用户的语音输入，并且能够从远端语音识别模块在线接收其对所述语音输入在线处理后输出的第一语音识别结果；其特征在于，所述语音识别装置包括：/n本地语音识别模块，其被配置有基于二值化神经网络算法构建的第二声学模型；/n其中，所述本地语音识别模块至少通过所述第二声学模型对从所述语音输入提取的语音特征进行处理以输出第二语音识别结果。/n

【技术特征摘要】
1.一种语音识别装置，其能够接收用户的语音输入，并且能够从远端语音识别模块在线接收其对所述语音输入在线处理后输出的第一语音识别结果；其特征在于，所述语音识别装置包括：
本地语音识别模块，其被配置有基于二值化神经网络算法构建的第二声学模型；
其中，所述本地语音识别模块至少通过所述第二声学模型对从所述语音输入提取的语音特征进行处理以输出第二语音识别结果。

2.如权利要求1所述的语音识别装置，其特征在于，还包括：
语音应用模块，其用于在所述第一语音识别结果的接收时间相比所述第二语音识别结果的输出时间晚预定时间阈值时或未收到所述第一语音识别结果时选择使用所述第二语音识别结果，否则选择使用所述第一语音识别结果。

3.如权利要求1所述的语音识别装置，其特征在于，所述本地语音识别模块还配置有第二语言模型，并且还包括解码输出单元；
其中，所述解码输出单元通过所述第二声学模型对所述语音特征进行匹配和比较处理以及通过所述第二语言模型对通过所述第二声学模型处理后的结果进行语言处理以至于解码输出所述第二语音识别结果。

4.如权利要求2所述的语音识别装置，其特征在于，还包括：
语音活动检测单元，其被配置有基于二值化神经网络算法构建的第三声学模型，并且其用于通过所述第三声学模型检测对应所述语音输入的端点信息。

5.如权利要求4所述的语音识别装置，其特征在于，所述端点信息包括语音起始端点和/或语音截止端点。

6.如权利要求4所述的语音识别装置，其特征在于，所述语音活动检测单元还用于基于检测的所述语音输入的端点信息确定用户的每次所述语音输入；
所述远端语音识别模块输出对应所述每次语音输入的第一语音识别结果；
所述本地语音识别模块还用于输出对应所述每次语音输入的第二语音识别结果。

7.如权利要求6所述的语音识别装置，其特征在于，所述语音应用模块包括语音交互处理单元，其用于根据对应每次语音输入的第一语音识别结果或第二语音识别结果生成针对该次语音输入所反馈的语音交互信息。

8.如权利要求4所述的语音识别装置，其特征在于，所述语音活动检测单元还用于：通过所述第三声学模型确定语音特征是对应语音状态还是沉默状态，从而根据语音特征的连续性特点确定对应于一次语音输入的语音起始端点和语音截止端点。

9.如权利要求4所述的语音识别装置，其特征在于，所述语音活动检测单元还用于检测所述语音输入中的唤醒特征语并在检测出所述唤醒特征语的情况下向所述本地语音识别模块输出唤醒信号。

10.如权利要求1所述的语音识别装置，其特征在于，所述语音识别装置为车载语音识别装置并且被应用于车载语音交互系统。

11.一种语音识别方法，其同时使用本地语音识别模块和远端语音识别模块进行语音识别，其特征在于，包括步骤：
发送语音输入至所述远端语音识别模块，以及在线接收所述远端语音识别模块对所述语音输入在线处理后输出的第一语音识别结果；
至少通过所述本地语音识别模块的第二声学模型对从所述语音输入提取的语音特征进行处理以输出第二语音识别结果，其中，所述第二声学模型基于二值化神经网络算法构建；以及
在所述第一语音识别结果的接收时间相比...

【专利技术属性】
技术研发人员：李国庆，孙珏，
申请(专利权)人：蔚来汽车有限公司，
类型：发明
国别省市：中国香港;81

全部详细技术资料下载我是这个专利的主人