一种语音交互方法、装置、设备及存储介质制造方法及图纸

技术编号：21005449 阅读：26 留言：0更新日期：2019-04-30 21:52

本发明专利技术实施例提出一种语音交互方法、装置、设备及存储介质，其中方法包括：判断收音时长是否超时；如果未超时，则对待检测语音信号进行语音识别，得到待检测文本；对所述待检测文本进行初次检测；当所述初次检测结果为未通过时，返回执行所述判断的步骤。本发明专利技术实施例能够降低语音交互过程中对语音信号的误识别率，提高用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音交互方法、装置、设备及存储介质
本专利技术涉及语音交互
，尤其涉及一种语音交互方法、装置、设备及存储介质。
技术介绍
传统的语音交互设备采用一问一答的方式进行。在语音交互时，用户首先需要唤醒设备(一般采用用户说出固定的唤醒词的方式唤醒设备)，然后发出语音指令，设备响应该语音指令。响应的方式包括语音播报、屏幕呈现等方式。完成一轮语音交互之后，如果用户希望开始下一轮语音交互，则需要重新唤醒设备，并发出语音指令。在上述方式中，由于每一次语音交互均需要唤醒设备，造成用户的使用体验不佳。因此，目前出现了支持一次唤醒多次交互的语音交互技术。采用这种技术，在初次语音交互时，用户需要唤醒设备。完成初次语音交互之后，语音交互设备开启计时器。在计时器未超时的情况下，如果用户希望开始下一轮语音交互，则可以直接发出语音指令，而无需重新唤醒设备。可见，这种交互方式更接近于真实的人类对话，能够给用户带来较好的使用体验。但是，这种一次唤醒多次交互的语音交互技术的缺点是容易受到非指令的人声干扰，出现误识别。例如，语音交互设备被唤醒之后，在计时器未超时的情况下，可能接收到语音指令以外...

【技术保护点】
1.一种语音交互方法，其特征在于，包括：判断收音时长是否超时；如果未超时，则对待检测语音信号进行语音识别，得到待检测文本；对所述待检测文本进行初次检测；当所述初次检测结果为未通过时，返回执行所述判断的步骤。

【技术特征摘要】
1.一种语音交互方法，其特征在于，包括：判断收音时长是否超时；如果未超时，则对待检测语音信号进行语音识别，得到待检测文本；对所述待检测文本进行初次检测；当所述初次检测结果为未通过时，返回执行所述判断的步骤。2.根据权利要求1所述的方法，其特征在于，还包括：当所述初次检测结果为通过时，对所述待检测文本进行二次检测；当所述二次检测结果为通过时，响应所述待检测文本，返回执行所述判断的步骤。3.根据权利要求2所述的方法，其特征在于，所述对所述待检测文本进行初次检测，包括：采用预设的初次检测模型对所述待检测文本进行语法和/或语义检测；所述对所述待检测文本进行二次检测，包括：采用预设的二次检测模型对所述待检测文本进行上下文逻辑关系检测。4.根据权利要求3所述的方法，其特征在于，所述初次检测模型的建立方式为：采用多个指令文本及多个非指令文本训练所述初次检测模型；所述指令文本为语音指令对应的文本；所述非指令文本为语音指令以外的其他语音信号对应的文本。5.根据权利要求4所述的方法，其特征在于，所述初次检测包括：将所述待检测文本输入所述初次检测模型；当所述初次检测模型预测出所述待检测文本为指令文本时，初次检测结果为通过；当所述初次检测模型预测出所述待检测文本为非指令文本时，初次检测结果为不通过。6.根据权利要求3所述的方法，其特征在于，所述二次检测模型的建立方式为：采用多组语音交互文本及多组非语音交互文本训练所述二次检测模型；每组所述语音交互文本包括至少两轮语音交互过程中的语音指令对应的文本及针对该文本的响应结果；所述至少两轮语音交互过程为存在上下文逻辑关系的语音交互过程；每组所述非语音交互文本包括至少两条不存在逻辑关系的语音指令对应的文本。7.根据权利要求6所述的方法，其特征在于，所述二次检测包括：将所述待检测文本、所述待检测文本的历史语音指令所对应的历史指令文本以及针对所述历史指令文本的历史响应结果输入所述二次检测模型；当所述二次检测模型预测出所述待检测文本与所述历史指令文本及历史响应结果存在上下文逻辑关系时，二次检测结果为通过；当所述二次检测模型预测出所述待检测文本与所述历史指令文本及历史响应结果不存在上下文逻辑关系时，二次检测结果为不通过。8.一种语音交互装置，其特征在于，包括：判断模块，用于判断收音时长是否超时；识别模块，用于当所述收音时长未超时时，对待检测语音信号进行语音识别，得到待检测文本；初次检测模块，用于对所述待检测文本进行初次检测，...

【专利技术属性】
技术研发人员：张刚，朱凯华，高聪，王丹，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人