语音对话的意图识别方法、系统、设备及存储介质技术方案

技术编号：27772254 阅读：27 留言：0更新日期：2021-03-23 12:53

本发明专利技术提供了语音对话的意图识别方法、系统、设备及存储介质，该方法包括：配置预设的多个单意图与预设的意图识别规则以及各单意图的优先级顺序，基于单意图配置一意图组合，意图组合包括至少两个按照预设顺序排列的单意图；获取目标语句；将目标语句按单意图的优先级顺序进行意图识别，获得目标语句的第一目标单意图；根据目标单意图对应的意图组合中单意图的优先级顺序再次进行意图识别，获得目标语句的第二目标单意图；至少基于第一目标单意图和第二目标单意图获得目标语句的目标意图组合。本发明专利技术能够通过配置文件和代码的分离，简化更新意图识别系统时的操作，便于系统的迁移，可以快速的新增意图或者迁移到新的场景应用。

全部详细技术资料下载

【技术实现步骤摘要】
语音对话的意图识别方法、系统、设备及存储介质
本专利技术涉及意图识别领域，具体地说，涉及语音对话的意图识别方法、系统、设备及存储介质。
技术介绍
语音客服机器人应用场景下，真人与机器人进行交流时，对真人的语音通过语音转写技术转写为文本后，需要对文本进行语义理解，分析出客人的意图，进而让机器人选择合适的对话策略，以做出响应并完成整个对话流程。一方面，口语转写的文本与书面文本语法结构，表达方式等有较大差异，于是产生了口语理解的算法需求。另一方面，在特定场景下，每一个意图会有独特的属性：规则是什么，是否需要结合上下文只在特定的会话状态下起作用，是否存在多意图组合等。而这类属性可以独立于代码，抽象为对象保存，便于维护和管理，于是产生了将意图识别的意图属性和意图识别的代码分离的需求。尤其是在自然对话中，一次会话经常包含多个对话意图，如果只能进行一次意图识别，哪怕识别得再精确，也是漏掉了其他的对话意图，只能通过多轮对话来分别识别出各个意图，增加了对话轮数，大大延长了对话时间，降低了用户体验。目前口语理解主流方法分为两类，一类是基于模板的规则匹配，一类是基于深度学习将其转换为文本分类任务。对于处于冷启动过程的机器人项目，常常难以得到真实场景的对话数据，因此不便于训练基于深度学习的模型，而常选用基于规则匹配的方法，快速建立规则，让系统运行起来再逐步收集对话数据，对系统进行优化。因此，本专利的是基于第一类方法，即基于规则匹配方法开发意图识别引擎。
技术实现思路
针对现有技术中的问题，本专利技...

【技术保护点】
1.一种语音对话的意图识别方法，其特征在于，包括以下步骤：/n配置预设的多个单意图与预设的意图识别规则以及各所述单意图的优先级顺序，基于所述单意图配置一意图组合，所述意图组合包括至少两个按照预设顺序排列的所述单意图；/n获取目标语句；/n将所述目标语句按所述单意图的优先级顺序进行意图识别，获得所述目标语句的第一目标单意图；/n根据所述目标单意图对应的意图组合中所述单意图的优先级顺序再次进行意图识别，获得所述目标语句的第二目标单意图；/n至少基于所述第一目标单意图和第二目标单意图获得所述目标语句的目标意图组合。/n

【技术特征摘要】
1.一种语音对话的意图识别方法，其特征在于，包括以下步骤：
配置预设的多个单意图与预设的意图识别规则以及各所述单意图的优先级顺序，基于所述单意图配置一意图组合，所述意图组合包括至少两个按照预设顺序排列的所述单意图；
获取目标语句；
将所述目标语句按所述单意图的优先级顺序进行意图识别，获得所述目标语句的第一目标单意图；
根据所述目标单意图对应的意图组合中所述单意图的优先级顺序再次进行意图识别，获得所述目标语句的第二目标单意图；
至少基于所述第一目标单意图和第二目标单意图获得所述目标语句的目标意图组合。

2.根据权利要求1所述的语音对话的意图识别方法，其特征在于，所述意图识别规则包括各关键词和/或正则表达式之间的对应关系。

3.根据权利要求1所述的语音对话的意图识别方法，其特征在于，通过语音转换，将对话的音频文件转化为文本化的目标语句。

4.根据权利要求1所述的语音对话的意图识别方法，其特征在于，所述意图识别包括以下步骤：
当所述目标语句及其上一轮的目标语句都满足预设可选属性白名单，或者所述目标语句及其上一轮的目标语句都不满足预设可选属性黑名单时进行意图识别规则的遍历；
当所述目标语句与所述意图识别规则中的意图规则相匹配，且与所述意图识别规则中的非意图规则不匹配时，输出所述目标语句的所述单意图。

5.根据权利要求1所述的语音对话的意图识别方法，其特征在于，所述意图识别规则的遍历包括依次将各所述单意图对应的关键词和/或正则表达式与所述目标语句进行匹配，直至某个单意图对应的关键词和/或正则表达式与所述目标语句匹配成功时，将该单意图作为所述目标语句的目标单意图。

6.根据权利要求5所述的语音对话的意图识别方法，其特征在于，
在所述按所述优先级顺序，依次将各所述意图对应的关键词和/或正则表达式与所述目标语句进行匹配的步骤之后，所述方法还包括：
当各所述意图对应的关键词和/或正则表达式与所述目标语句均不匹配时，通过预先训练的意图分类模型对所述目标语句进行处理，得到所述目标语句的单意图。

7.根据权利要求5所述的语音对话的意图识别方法，其特征在于，所述方法还包括预先通过如下步骤训练所述意图分类模型...

【专利技术属性】
技术研发人员：邓艳江，罗超，邹宇，胡泓，李巍，
申请(专利权)人：携程旅游信息技术上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人