语音交互方法及装置制造方法及图纸

技术编号：39713065 阅读：7 留言：0更新日期：2023-12-17 23:21

本申请涉及语音交互领域，提供一种语音交互方法及装置

全部详细技术资料下载

【技术实现步骤摘要】
语音交互方法及装置

[0001]本申请涉及语音交互
，具体涉及一种语音交互方法及装置
。

技术介绍

[0002]目前，随着人工智能行业的迅速发展，语音交互技术被广泛地应用于诸多人机交互系统中，例如智能客服系统，聊天机器人，个人智能助理以及智能家居等
。
[0003]相关技术中，通过优化语音识别
、
语义理解以及语音合成三个模块的调用流程来提升语音交互时的响应速度，由于语义理解模块对识别到的每一帧语音均会重新解析，并输出多个语义理解结果，容易对信息相同的识别结果进行重复解析，造成计算资源浪费，导致语音交互时的响应速度慢
。

技术实现思路

[0004]本申请实施例提供一种语音交互方法及装置，用以解决现有技术在语音交互过程中会对信息相同的语音内容进行重复解析，导致语音解析效率低，语音交互响应慢的技术问题
。
[0005]第一方面，本申请实施例提供一种语音交互方法，包括：
[0006]接收用户语音输入；
[0007]对所述用户语音输入进行语音识别，得到识别文本，所述识别文本包括多个字段；
[0008]基于有向无环图按照句式模板对所述多个字段进行逐字识别，在结束所述有向无环图的字段识别的情况下，得到语义理解结果；
[0009]其中，所述句式模板包括多个槽位，每个槽位对应一类字段，每个槽位包括至少一个关键词，所述有向无环图包括开始节点，多个中间节点和结束节点，每个中间节点关联一个槽位；所述语义理解结果用于供用户进...

【技术保护点】

【技术特征摘要】
1.
一种语音交互方法，其特征在于，包括：接收用户语音输入；对所述用户语音输入进行语音识别，得到识别文本，所述识别文本包括多个字段；基于有向无环图按照句式模板对所述多个字段进行逐字识别，在结束所述有向无环图的字段识别的情况下，得到语义理解结果；其中，所述句式模板包括多个槽位，每个槽位对应一类字段，每个槽位包括至少一个关键词，所述有向无环图包括开始节点，多个中间节点和结束节点，每个中间节点关联一个槽位；所述语义理解结果用于供用户进行业务处理
。2.
根据权利要求1所述的语音交互方法，其特征在于，所述在结束所述有向无环图的字段识别的情况下，得到语义理解结果，包括：在依次遍历所述开始节点
、
所述多个中间节点和所述结束节点的情况下，确认结束所述有向无环图的字段识别；基于被识别的字段，得到语义理解结果
。3.
根据权利要求1所述的语音交互方法，其特征在于，所述在结束所述有向无环图的字段识别的情况下，得到语义理解结果，还包括：在目标字段与对应槽位的关键词不匹配的情况下，确认结束所述有向无环图的字段识别，所述目标字段属于所述多个字段中的任一项；基于深度语义理解模型对所述识别文本进行识别，得到语义理解结果；其中，所述深度语义理解模型基于分层识别技术确定，所述深度语义理解模型包括多个自注意力层和多个全连接层，每个自注意力层连接至少三个全连接层，所述至少三个全连接层分别用于识别所述识别文本的领域信息
、
意图信息和词槽信息
。4.
根据权利要求3所述的语音交互方法，其特征在于，所述至少三个全连接层包括第一全连接层
、
第二全连接层和第三全连接层；所述基于深度语义理解模型对所述识别文本进行识别，得到语义理解结果，包括：基于所述第一全连接层对所述识别文本的领域信息进行识别，得到领域识别结果；基于所述第二全连接层对所述识别文本的意图信息进行识别，得到意图识别结果；基于所述第三全连接层对所述识别文本的词槽信息进行识别，得到词槽识别结果；基于所述领域识别结果
、
所述意图识别结果和所述词槽识别结果得到所述语义理解结果
...

【专利技术属性】
技术研发人员：单权强，晁会勇，康凯凯，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人