一种语音交互的纠错方法及装置制造方法及图纸

技术编号：28116465 阅读：27 留言：0更新日期：2021-04-19 11:14

本发明专利技术公开了一种语音交互的纠错方法及装置，涉及自然语言处理技术领域，提高对语音指令识别的准确性。本发明专利技术的主要技术方案为：当接收到用户发出的第一语音指令时，解析所述第一语音指令包含的语义信息和语调信息；接收第二语音指令，解析所述第二语音指令包含的语义信息和语调信息，所述第二语音指令是与所述第一语音指令互为相邻的语音指令；通过比较所述第二语音指令包含的语调信息和所述第一语音指令包含的语调信息，判断是否对所述第一语音指令执行纠正操作；若是，则根据所述第二语音指令包含的语义信息纠正所述第一语音指令包含的语义信息。本发明专利技术主要应用于在处理输入的语音指令过程中自动地对接收到的相邻语音指令进行纠错。指令进行纠错。指令进行纠错。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音交互的纠错方法及装置

[0001]本专利技术涉及自然语言处理
，尤其涉及一种语音交互的纠错方法及装置。

技术介绍

[0002]随着科技的创新和发展，人与机器用自然语言进行对话的梦想已然成为现实，依赖于自然语言处理技术衍生的智能产品日益普及，比如：智能音箱，它不仅可以执行用户下达的控制指令，还也可以与用户对话聊天，如此智能化服务越来越得到用户的青睐。
[0003]然而，现在市场上销售的智能音箱，被语音唤醒之后，在处理输入的语音指令过程中，是没有办法自动地对接收到的相邻语音指令进行纠错的，比如，例举为苹果手机和天猫精灵家庭版CC接收到的语音指令，“帮我调明天12:00的闹钟，不对不对不是调这个闹钟错了”，机器会自动控制设置闹钟为12点，但是这样操作并不符合用户发出语音指令的真正意图的，所以用户只好再次核对机器的操作是否正确，如果发现不正确，就需要再重新下达语音指令，如此反复操作，降低用户体验。

技术实现思路

[0004]有鉴于此，本专利技术提供一种语音交互的纠错方法及装置，主要目的在在处理输入的语音指令过程中自动地对接收到的相邻语音指令进行纠错，确保输出的控制操作是符合用户真实意图的，提高对语音指令识别的准确性，也提高了用户操作体验。
[0005]为了达到上述目的，本专利技术主要提供如下技术方案：
[0006]第一方面，本专利技术提供了一种语音交互的纠错方法，该方法包括：
[0007]当接收到用户发出的第一语音指令时，解析所述第一语音指令包含的语义信息和语调信...

【技术保护点】

【技术特征摘要】
1.一种语音交互的纠错方法，其特征在于，所述方法包括：当接收到用户发出的第一语音指令时，解析所述第一语音指令包含的语义信息和语调信息；接收第二语音指令，解析所述第二语音指令包含的语义信息和语调信息，所述第二语音指令是与所述第一语音指令互为相邻的语音指令；通过比较所述第二语音指令包含的语调信息和所述第一语音指令包含的语调信息，判断是否对所述第一语音指令执行纠正操作；若是，则根据所述第二语音指令包含的语义信息纠正所述第一语音指令包含的语义信息。2.根据权利要求1所述的方法，其特征在于，在所述接收到用户发出的第一语音指令之前，所述方法还包括：获取所述用户对应的多条历史语音指令；解析每条所述历史语音指令包含的语义信息和语调信息；从多条所述历史语音指令中任意抽取相邻两条语音指令；根据所述相邻两条语音指令分别对应的语义信息，判断所述相邻两条语音指令是否存在逻辑关联；若存在，根据所述逻辑关联，创建标签，得到所述标签与所述逻辑关联之间的映射关系；计算所述相邻两条语音指令分别对应的语调信息之间的差异信息，所述差异信息是在语音高低、语音快慢、语音长短和语音轻重四个维度上衡量语调变化信息；利用所述标签标注所述差异信息，得到所述标签对应的语调变化信息。3.根据权利要求2所述的方法，其特征在于，在所述得到所述标签对应的语调变化信息之后，所述方法还包括：获取每个标签对应的语调变化信息；通过任意抽取两个所述标签，比对两个所述标签对应的语调变化信息之间的相似度；若所述相似度达到第一预设阈值时，整合两个所述标签得到一个上位标签，所述上位标签对应两组语调变化信息。4.根据权利要求2所述的方法，其特征在于，在所述得到所述标签对应的语调变化信息之后，所述方法还包括：解析每个标签的词语含义；通过比较词语的相似性，将所述标签与预设标签模板上记载的标签进行匹配，所述预设标签模板用于规范所述标签；若匹配成功，则利用所述预设标签模板上记载的标签替代所述标签；若经匹配操作之后存在多个相同的标签，则将所述多个相同的标签进行去重处理并保留一个标签，所述标签对应多组语调变化信息。5.根据权利要求2-4中任一项所述的方法，其特征在于，所述通过比较所述第二语音指令包含的语调信息和所述第一语音指令包含的语调信息，判断是否对所述第一语音指令执行纠正操作，包括：在语音高低、语音快慢、语音长短和语音轻重四个维度上，分别计算所述第一语音指令
和所述第二语音指令之间的差异信息；通过将所述差异信息与标签对应的语调变化信息相比较，计算所述差异信息与所述标签对应的语调变化信息之间的相似度是否达到第二预设阈值；若是，则通过查找标签与逻辑关联之间的映射关系，根据所述标签，确定所述第一语音指令和所述第...

【专利技术属性】
技术研发人员：杜国威，
申请(专利权)人：北京安云世纪科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人