语音对话的意图识别方法、系统、设备及存储介质技术方案

技术编号:27772254 阅读:27 留言:0更新日期:2021-03-23 12:53
本发明专利技术提供了语音对话的意图识别方法、系统、设备及存储介质,该方法包括:配置预设的多个单意图与预设的意图识别规则以及各单意图的优先级顺序,基于单意图配置一意图组合,意图组合包括至少两个按照预设顺序排列的单意图;获取目标语句;将目标语句按单意图的优先级顺序进行意图识别,获得目标语句的第一目标单意图;根据目标单意图对应的意图组合中单意图的优先级顺序再次进行意图识别,获得目标语句的第二目标单意图;至少基于第一目标单意图和第二目标单意图获得目标语句的目标意图组合。本发明专利技术能够通过配置文件和代码的分离,简化更新意图识别系统时的操作,便于系统的迁移,可以快速的新增意图或者迁移到新的场景应用。

【技术实现步骤摘要】
语音对话的意图识别方法、系统、设备及存储介质
本专利技术涉及意图识别领域,具体地说,涉及语音对话的意图识别方法、系统、设备及存储介质。
技术介绍
语音客服机器人应用场景下,真人与机器人进行交流时,对真人的语音通过语音转写技术转写为文本后,需要对文本进行语义理解,分析出客人的意图,进而让机器人选择合适的对话策略,以做出响应并完成整个对话流程。一方面,口语转写的文本与书面文本语法结构,表达方式等有较大差异,于是产生了口语理解的算法需求。另一方面,在特定场景下,每一个意图会有独特的属性:规则是什么,是否需要结合上下文只在特定的会话状态下起作用,是否存在多意图组合等。而这类属性可以独立于代码,抽象为对象保存,便于维护和管理,于是产生了将意图识别的意图属性和意图识别的代码分离的需求。尤其是在自然对话中,一次会话经常包含多个对话意图,如果只能进行一次意图识别,哪怕识别得再精确,也是漏掉了其他的对话意图,只能通过多轮对话来分别识别出各个意图,增加了对话轮数,大大延长了对话时间,降低了用户体验。目前口语理解主流方法分为两类,一类是基于模板的规则匹配,一类是基于深度学习将其转换为文本分类任务。对于处于冷启动过程的机器人项目,常常难以得到真实场景的对话数据,因此不便于训练基于深度学习的模型,而常选用基于规则匹配的方法,快速建立规则,让系统运行起来再逐步收集对话数据,对系统进行优化。因此,本专利的是基于第一类方法,即基于规则匹配方法开发意图识别引擎。
技术实现思路
针对现有技术中的问题,本专利技术的目的在于提供语音对话的意图识别方法、系统、设备及存储介质,克服了现有技术的困难,能够通过配置文件和代码的分离,简化更新意图识别系统时的操作,大大减少意图识别的出错率,更高效,也便于系统的迁移,可以快速的新增意图,或者将整个系统迁移到新的场景应用。本专利技术的实施例提供一种语音对话的意图识别方法,包括以下步骤:配置预设的多个单意图与预设的意图识别规则以及各所述单意图的优先级顺序,基于所述单意图配置一意图组合,所述意图组合包括至少两个按照预设顺序排列的所述单意图;获取目标语句;将所述目标语句按所述单意图的优先级顺序进行意图识别,获得所述目标语句的第一目标单意图;根据所述目标单意图对应的意图组合中所述单意图的优先级顺序再次进行意图识别,获得所述目标语句的第二目标单意图;至少基于所述第一目标单意图和第二目标单意图获得所述目标语句的目标意图组合。优选地,所述意图识别规则包括各关键词和/或正则表达式之间的对应关系。优选地,通过语音转换,将对话的音频文件转化为文本化的目标语句。优选地,所述意图识别包括以下步骤:当所述目标语句及其上一轮的目标语句都满足预设可选属性白名单,或者所述目标语句及其上一轮的目标语句都不满足预设可选属性黑名单时进行意图识别规则的遍历;当所述目标语句与所述意图识别规则中的意图规则相匹配,且与所述意图识别规则中的非意图规则不匹配时,输出所述目标语句的所述单意图。优选地,所述意图识别规则的遍历包括依次将各所述单意图对应的关键词和/或正则表达式与所述目标语句进行匹配,直至某个单意图对应的关键词和/或正则表达式与所述目标语句匹配成功时,将该单意图作为所述目标语句的目标单意图。优选地,在所述按所述优先级顺序,依次将各所述意图对应的关键词和/或正则表达式与所述目标语句进行匹配的步骤之后,所述方法还包括:当各所述意图对应的关键词和/或正则表达式与所述目标语句均不匹配时,通过预先训练的意图分类模型对所述目标语句进行处理,得到所述目标语句的单意图。优选地,所述方法还包括预先通过如下步骤训练所述意图分类模型:采集样本数据集,所述样本数据集包含若干训练语句,各所述训练语句标注有对应的意图标签;按预定比例将所述样本数据集划分为训练集和验证集;基于所述训练集,对所述意图分类模型进行训练;基于所述验证集对训练后的所述意图分类模型进行验证,若验证通过,训练结束;所述意图分类模型为TEXTCNN模型,所述TEXTCNN模型包含嵌入层、卷积层、池化层、全连接层和Softmax分类层;所述通过预先训练的意图分类模型对所述目标语句进行处理的步骤如下:通过所述嵌入层对所述目标语句进行向量化处理,得到所述目标语句的词向量;通过所述卷积层对所述目标语句的词向量进行卷积处理,以提取所述目标语句的特征;通过所述池化层对所述目标语句的特征进行池化处理,得到所述目标语句的降维特征;通过所述全连接层将所述目标语句的降维特征传输至所述Softmax分类层;通过所述Softmax分类层对所述目标语句的降维特征进行分类处理,得到所述目标语句对应的目标意图。本专利技术的实施例还提供一种语音对话的意图识别系统,用于实现上述的语音对话的意图识别方法,所述语音对话的意图识别系统包括:配置预设模块,配置预设的多个单意图与预设的意图识别规则以及各所述单意图的优先级顺序,基于所述单意图配置一意图组合,所述意图组合包括至少两个按照预设顺序排列的所述单意图;语句获取模块,获取目标语句;第一单意获取模块,将所述目标语句按所述单意图的优先级顺序进行意图识别,获得所述目标语句的第一目标单意图;第二单意获取模块,根据所述目标单意图对应的意图组合中所述单意图的优先级顺序再次进行意图识别,获得所述目标语句的第二目标单意图;意图组合模块,至少基于所述第一目标单意图和第二目标单意图获得所述目标语句的目标意图组合。本专利技术的实施例还提供一种语音对话的意图识别设备,包括:处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述语音对话的意图识别方法的步骤。本专利技术的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述语音对话的意图识别方法的步骤。本专利技术的目的在于提供语音对话的意图识别方法、系统、设备及存储介质,能够通过配置文件和代码的分离,简化更新意图识别系统时的操作,大大减少意图识别的出错率,更高效,也便于系统的迁移,可以快速的新增意图,或者将整个系统迁移到新的场景应用。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。图1是本专利技术的语音对话的意图识别方法的流程图。图2是本专利技术的语音对话的意图识别方法的实施过程示意图。图3是本专利技术的语音对话的意图识别方法中意图识别过程的示意图。图4是本专利技术的语音对话的意图识别系统的模块示意图。图5是本专利技术的语音对话的意图识别设备的结构示意图。图6是本专利技术一实施例的计算机可读存储介质的结构示意图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理本文档来自技高网...

【技术保护点】
1.一种语音对话的意图识别方法,其特征在于,包括以下步骤:/n配置预设的多个单意图与预设的意图识别规则以及各所述单意图的优先级顺序,基于所述单意图配置一意图组合,所述意图组合包括至少两个按照预设顺序排列的所述单意图;/n获取目标语句;/n将所述目标语句按所述单意图的优先级顺序进行意图识别,获得所述目标语句的第一目标单意图;/n根据所述目标单意图对应的意图组合中所述单意图的优先级顺序再次进行意图识别,获得所述目标语句的第二目标单意图;/n至少基于所述第一目标单意图和第二目标单意图获得所述目标语句的目标意图组合。/n

【技术特征摘要】
1.一种语音对话的意图识别方法,其特征在于,包括以下步骤:
配置预设的多个单意图与预设的意图识别规则以及各所述单意图的优先级顺序,基于所述单意图配置一意图组合,所述意图组合包括至少两个按照预设顺序排列的所述单意图;
获取目标语句;
将所述目标语句按所述单意图的优先级顺序进行意图识别,获得所述目标语句的第一目标单意图;
根据所述目标单意图对应的意图组合中所述单意图的优先级顺序再次进行意图识别,获得所述目标语句的第二目标单意图;
至少基于所述第一目标单意图和第二目标单意图获得所述目标语句的目标意图组合。


2.根据权利要求1所述的语音对话的意图识别方法,其特征在于,所述意图识别规则包括各关键词和/或正则表达式之间的对应关系。


3.根据权利要求1所述的语音对话的意图识别方法,其特征在于,通过语音转换,将对话的音频文件转化为文本化的目标语句。


4.根据权利要求1所述的语音对话的意图识别方法,其特征在于,所述意图识别包括以下步骤:
当所述目标语句及其上一轮的目标语句都满足预设可选属性白名单,或者所述目标语句及其上一轮的目标语句都不满足预设可选属性黑名单时进行意图识别规则的遍历;
当所述目标语句与所述意图识别规则中的意图规则相匹配,且与所述意图识别规则中的非意图规则不匹配时,输出所述目标语句的所述单意图。


5.根据权利要求1所述的语音对话的意图识别方法,其特征在于,所述意图识别规则的遍历包括依次将各所述单意图对应的关键词和/或正则表达式与所述目标语句进行匹配,直至某个单意图对应的关键词和/或正则表达式与所述目标语句匹配成功时,将该单意图作为所述目标语句的目标单意图。


6.根据权利要求5所述的语音对话的意图识别方法,其特征在于,
在所述按所述优先级顺序,依次将各所述意图对应的关键词和/或正则表达式与所述目标语句进行匹配的步骤之后,所述方法还包括:
当各所述意图对应的关键词和/或正则表达式与所述目标语句均不匹配时,通过预先训练的意图分类模型对所述目标语句进行处理,得到所述目标语句的单意图。


7.根据权利要求5所述的语音对话的意图识别方法,其特征在于,所述方法还包括预先通过如下步骤训练所述意图分类模型...

【专利技术属性】
技术研发人员:邓艳江罗超邹宇胡泓李巍
申请(专利权)人:携程旅游信息技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1