用于口语对话的实时语义理解方法、系统和电子设备技术方案

技术编号：37459512 阅读：30 留言：0更新日期：2023-05-06 09:32

本发明专利技术实施例提供一种用于口语对话的实时语义理解方法、系统和电子设备。该方法包括：将检测到的用户语音实时的输入至流式语音识别引擎，输出流式的语音识别结果；利用流式语义理解引擎接收流式的语音识别结果，查询流式的语音识别结果内语音请求标识对应的引擎状态；流式语义理解引擎根据引擎状态对流式的语音识别结果进行推理，得到推理语义解析结果，并对引擎状态进行更新；若检测到用户语音结束，将推理语义解析结果确定为用户语音的最终语义解析结果。本发明专利技术实施例利用流式语音解析引擎，无需等待用户说完整句话之后再进行语音识别，也避免了实时语义理解所需的计算量。在不增加计算量的基础上，减少了用户的等待时间，提升了用户体验。提升了用户体验。提升了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
用于口语对话的实时语义理解方法、系统和电子设备

[0001]本专利技术涉及智能语音领域，尤其涉及一种用于口语对话的实时语义理解方法、系统和电子设备。

技术介绍

[0002]为了提升用户的语音交互体验，不但需要提升语音识别的准确度，而且还要能够对识别结果进行准确、高效的进行语义理解。现有的语义理解技术需要输入完整的全量文本，然后解析出该全量文本对应的解析结果。例如，在与用户的口语对话中，检测到用户说完一句话之后得到对应的语音识别结果，再将语音识别结果输入至语义理解引擎中得到对应的语义解析结果。这就导致了，在口语对话中，语音识别和语义理解模块是串行的：用户说完一句话之后，将整句话的语音数据送入语音识别模块进行语音识别，在整句话全部识别后，才会将该整句的识别结果送入语义理解模块进行语义理解，得到整句话的解析结果。
[0003]在实现本专利技术过程中，专利技术人发现相关技术中至少存在如下问题：
[0004]在与用户的口语对话过程中，需要等待用户说完一句完整的话，经过语音识别引擎识别解码出完整的文本后，再进行语义理解，...

【技术保护点】

【技术特征摘要】
1.一种用于口语对话的实时语义理解方法，包括：将检测到的用户语音实时的输入至流式语音识别引擎，输出流式的语音识别结果，其中，所述语音识别结果包括用于判断是否为同一句话的语音请求标识；利用流式语义理解引擎接收所述流式的语音识别结果，查询所述流式的语音识别结果内语音请求标识对应的引擎状态；所述流式语义理解引擎根据所述引擎状态对所述流式的语音识别结果进行推理，得到推理语义解析结果，并对所述引擎状态进行更新；若检测到用户语音结束，将所述推理语义解析结果确定为所述用户语音的最终语义解析结果。2.根据权利要求1所述的方法，其中，若检测到用户语音没有结束，所述方法还包括：持续的将检测到的用户语音实时的输入至流式语音识别引擎，输出流式的语音识别结果；利用流式语义理解引擎接收所述流式的语音识别结果，查询所述流式的语音识别结果内语音请求标识对应的引擎状态；所述流式语义理解引擎根据所述引擎状态对所述流式的语音识别结果进行持续的推理，得到推理语义解析结果，并持续的对所述引擎状态进行更新。3.根据权利要求1所述的方法，其中，所述利用流式语义理解引擎接收所述流式的语音识别结果，查询所述流式的语音识别结果内语音请求标识对应的引擎状态包括：若所述语音请求标识不存在，将所述流式语义理解引擎设置为初始状态；若所述语音请求标识存在，读取所述语音请求标识对应的引擎状态。4.根据权利要求1所述的方法，其中，在所述将所述推理语义解析结果确定为所述用户语音的最终语义解析结果之后，所述方法还包括：将所述最终语义解析结果发送至对话管理引擎，所述对话管理引擎根据所述最终语义解析结果生成用于响应用户的交互对话语音。5.一种用于口语对话的实时语义理解系统，包括：语音识别程序模块，用于将检测到的用户语音实时的输入至流式语音识别引擎，输出流式的语音识别结果，其中，所述语音识别结果包括用于判断是否为同一句话的语音请求标识；...

【专利技术属性】
技术研发人员：樊帅，朱成亚，甘津瑞，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人