语音交互方法、电子设备和存储介质技术

技术编号：36801456 阅读：20 留言：0更新日期：2023-03-08 23:47

本发明专利技术公开一种语音交互方法、电子设备和存储介质。在该方法中，监测对应语音请求过程的说话人音频；当所监测到的说话人音频处于说话保持状态时，获取对应说话保持状态的第一说话人音频的第一语音识别结果，并确定第一语音识别结果所对应的前置语义分析结果；当所监测到的说话人音频从说话保持状态转为说话结束状态时，获取对应说话结束状态的第二说话人音频的第二语音识别结果，并将第二语音识别结果与第一语音识别结果进行比较；如果第一说话人音频和第二说话人音频的语音识别结果一致，则基于前置语义分析结果进行语音反馈操作。由此，从整体上有效节省了语义解析的耗时，能在较大程度上加速语音交互的整体响应效果。较大程度上加速语音交互的整体响应效果。较大程度上加速语音交互的整体响应效果。

全部详细技术资料下载

【技术实现步骤摘要】
语音交互方法、电子设备和存储介质

[0001]本专利技术属于互联网
，尤其涉及一种语音交互方法、电子设备和存储介质。

技术介绍

[0002]随着语音技术的不断发展，各种语音交互设备已经融入到了人们生活中的各个方面，例如语音购票机、语音聊天机器人等等。从设备接收到用户输入语音到反馈输出音频，中间涉及语音交互的全链路系统的各个处理模块，例如，语音采集模块、语音识别模块、语义理解模块和对话管理模块等。
[0003]在对语音交互系统进行性能评估时，对话响应时延是一项重要考核指标，对话响应时延包含各个模块的耗时，例如末帧识别延迟、语义分类解析时间和对话处理时间，等等。目前，为了降低对话响应时延，业内通常会对各个模块的处理耗时进行优化，但不论怎样，各个模块的处理还是存在一定的耗时，尤其是语义分类解析的时间，产品中领域包含越多，或领域内说法越多，语义分类解析耗时越长，导致对话响应时延的优化效果不够显著。
[0004]针对上述问题，目前业界暂时并未提供较佳的解决方案。

技术实现思路

[0005]本专利技术实施例提供一种语音交互方法、电子设备和存储介质，用于至少解决上述技术问题之一。
[0006]第一方面，本专利技术实施例提供一种语音交互方法，包括：监测对应语音请求过程的说话人音频；当所监测到的说话人音频处于说话保持状态时，获取对应说话保持状态的第一说话人音频的第一语音识别结果，并确定所述第一语音识别结果所对应的前置语义分析结果；当所监测到的说话人音频从所述说话保持状态转为说话结束状态时，...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法，包括：监测对应语音请求过程的说话人音频；当所监测到的说话人音频处于说话保持状态时，获取对应说话保持状态的第一说话人音频的第一语音识别结果，并确定所述第一语音识别结果所对应的前置语义分析结果；当所监测到的说话人音频从所述说话保持状态转为说话结束状态时，获取对应说话结束状态的第二说话人音频的第二语音识别结果，并将所述第二语音识别结果与所述第一语音识别结果进行比较；如果所述第一说话人音频和所述第二说话人音频的语音识别结果一致，则基于所述前置语义分析结果进行语音反馈操作。2.根据权利要求1所述的方法，其中，如果所述第一说话人音频和所述第二说话人音频的语音识别结果不一致，则所述方法还包括：确定所述第二语音识别结果所对应的完全语义分析结果；基于所述完全语义分析结果进行语音反馈操作。3.根据权利要求1所述的方法，其中，所述监测对应语音请求过程的说话人音频，包括：获取语音交互请求，并解析所述语音交互请求所对应的说话人音频；基于具有对应预设的第一停顿时长的说话结束条件，识别所监测到的说话人音频是对应说话保持状态的还是对应说话结束状态的。4.根据权利要求3所述的方法，其中，所述基于具有对应预设停顿时长的说话结束条件，识别所监测到的说话人音频是对应说话保持状态的还是对应说话结束状态的，包括：实时检测说话人音频的录入停顿时间；当所述录入停顿时间达到所述第一停顿时长时，确定所监测到的说话人音频是对应说话结束状态的。5.根据权利要求4所述的方法，其中，在实时检测说话人音频的录入停顿时间之后，所述方法还包括：当所述录入停顿时间达到预设的第二停顿时长时，确定所监测到的说话人音频是对应说话保持状态的；其中，所述第二停顿时长小于所述第一停顿时长。6.根据权利要求...

【专利技术属性】
技术研发人员：朱成亚，樊帅，郭奕超，吴旭貌，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人