语音技能的对话管理器配置方法、人机对话方法及系统技术方案

技术编号：28379774 阅读：22 留言：0更新日期：2021-05-08 00:07

本发明专利技术公开一种语音技能的对话管理器配置方法，包括：接收用户为待创建语音技能所提交的全局常量信息和全局变量信息；检测所述用户为所述待创建语音技能所配置的开始状态节点、多个过程状态节点和结束状态节点；基于所述全局常量信息和所述全局变量信息为所述多个过程状态节点配置执行逻辑；基于所述执行逻辑确定所述开始状态节点、多个过程状态节点和结束状态节点之间的跳转关系，并组织为对话状态机，以实现所述待创建语音技能的不同状态节点之间的跳转管理。基于本发明专利技术的语音技能的对话管理器配置方法，降低了对用户的专业性要求，避免了用户对开发人员的依赖性，简化了用于复杂多轮对话的语音技能的对话管理器的可定制化。

全部详细技术资料下载

【技术实现步骤摘要】
语音技能的对话管理器配置方法、人机对话方法及系统
本专利技术涉及计算机
，尤其涉及一种语音技能的对话管理器配置方法、人机对话方法及系统。
技术介绍
百度DuerOS技能开放平台、阿里AliGenie语音技能开放平台、腾讯云小微语音技能开放平台、科大讯飞iFlyOS技能开放平台、若琪Rokid技能开放平台。上面这些语音技能开放平台都提供了语音对话中的对话管理的规则逻辑制定。用户在开放平台上开发技能制定完成期待的对话规则逻辑后，对话管理器可以根据用户的规则对多轮对话进行管理，从而完成整个技能的多轮对话交互。以上开放平台的技能开发中都存在只能设计简单对话逻辑的缺陷。因为支持的对话逻辑很有限，所以多轮对话主要用途是当用户的说法中slot缺失时，发起询问来达到填充slot的目的。对于某些复杂一些的对话场景，比如游戏问答，信息获取，需要儿童反馈类的教育功能等都无法通过平台定制完成。造成这个缺陷的主要原因是在目前智能语音对话使用场景中主要分为两大类：1、简单的任务型对话；2、复杂的流程型对话。简单的任务型对话主要是满足用户通过语音完成具体操作任务的需求，比如控制智能家居，导航，打电话，听儿歌听诗词等。这种场景下对话按照用户说法中的关键slot值去执行配置的指令(比如command或者发起webhook请求)然后根据执行结果进行播报即可完成整个对话交互。这种场景的对话在上面语音技能开放平台上已经可以很好的支持，用户可以方便的定制完成自己需要的对话管理逻辑。但是对于复杂一些的流程型对话，因为需要用...

【技术保护点】
1.一种语音技能的对话管理器配置方法，包括：/n接收用户为待创建语音技能所提交的全局常量信息和全局变量信息；/n检测所述用户为所述待创建语音技能所配置的开始状态节点、多个过程状态节点和结束状态节点；/n基于所述全局常量信息和所述全局变量信息为所述多个过程状态节点配置执行逻辑；/n基于所述执行逻辑确定所述开始状态节点、多个过程状态节点和结束状态节点之间的跳转关系，并组织为对话状态机，以实现所述待创建语音技能的不同状态节点之间的跳转管理。/n

【技术特征摘要】
1.一种语音技能的对话管理器配置方法，包括：
接收用户为待创建语音技能所提交的全局常量信息和全局变量信息；
检测所述用户为所述待创建语音技能所配置的开始状态节点、多个过程状态节点和结束状态节点；
基于所述全局常量信息和所述全局变量信息为所述多个过程状态节点配置执行逻辑；
基于所述执行逻辑确定所述开始状态节点、多个过程状态节点和结束状态节点之间的跳转关系，并组织为对话状态机，以实现所述待创建语音技能的不同状态节点之间的跳转管理。

2.根据权利要求1所述的方法，其中，所述基于所述全局常量信息和所述全局变量信息为所述多个过程状态节点配置执行逻辑包括：
为所述多个过程状态节点中的每一个过程状态节点配置以下执行逻辑：
在所述待创建语音技能实际使用中判断所接收的用户的语音输入是否满足第一预设条件，以对所述全局变量进行赋值；
判断所述全局变量的当前取值是否满足第二预设条件；
为所述待创建语音技能配置，在满足所述第二预设条件时的输出结果、执行动作和当前过程状态节点应当跳转到的下一个节点。

3.一种人机对话方法，应用于配置有采用权利要求1或2所述的方法所配置的对话管理器的语音技能；所述方法包括：
接收用户的语音输入，并获取对应于所述用户的语音输入的文本信息；
根据所述文本信息确定对应的当前过程状态节点；
执行所述当前过程状态节点所配置的执行逻辑；
根据执行结果确定响应于所述用户的语音输入的输出内容。

4.根据权利要求3所述的方法，其中，所述执行逻辑包括多行逻辑条件；
所述执行所述当前过程状态节点所配置的执行逻辑包括：
逐行执行所述多行逻辑条件；
当执行当前行逻辑条件满足相应的第二预设条件时，执行预先配置的所述输出结果和执行动作。

5.根据权利要求4所述的方法，其中，所述根据执行结果确定响应于所述用户的语音输入的输出内容包括：
将所述输出结果作为响应于所述用户的语音输...

【专利技术属性】
技术研发人员：杨鹏，樊帅，林永楷，朱成亚，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人