结合上下文的意图识别方法、系统、电子设备和存储介质技术方案

技术编号：27935631 阅读：20 留言：0更新日期：2021-04-02 14:15

本发明专利技术公开了一种结合上下文的意图识别方法、系统、电子设备和存储介质。意图识别方法包括：建立包括多个意图规则的意图规则库，意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系；获取用户端输入的目标用户语音、以及与目标上文话术控制指令；将用户语音转换为对应的目标语音文本；将目标语音文本和目标上文话术控制指令与各意图规则中的正则表达式和上文话术控制指令依次进行匹配，并将匹配成功的意图规则中的意图作为目标用户语音的目标意图识别结果。实现了对目标语音文本意图的自动识别，避免了误识别和无法识别的情形，提高了识别的准确程度，减少了获取、处理历史数据的时间和成本，大大提高了识别的效率。

全部详细技术资料下载

【技术实现步骤摘要】
结合上下文的意图识别方法、系统、电子设备和存储介质
本专利技术涉及意图识别
，特别涉及一种结合上下文的意图识别方法、系统、电子设备和存储介质。
技术介绍
语音客服机器人应用场景下，机器人在与人进行交流时，通过语音转换技术将语音转换为文本后，需要对文本进行语义理解，分析出用户的意图，进而让机器人根据用户的意图选择合适的对话策略，以做出响应并完成整个对话流程。目前意图识别的主要方法是转换为文本分类任务，业界通常采用规则匹配或深度学习进行分类。对于深度学习而言，深度学习往往需要大量的训练样本，在某些领域或场景下，可提供的训练样本比较少，比如在服务机器人领域，机器人处理特定领域业务咨询过程中，涉及的训练样本较少，如果仍使用基于机器学习或者深度学习的方法进行意图识别，可能会由于数据训练样本较少使得训练出来的模型无法准确识别出用户意图，甚至无法识别用户意图，导致无法给用户提供较为准确的业务问答。若采用规则匹配方法，由于口语转换的文本与书面文本在语法结构、表达方式等方面存在较大差异，如口语中单句话往往会伴随省略或指代，因而导致利用基于单句消息的匹配规则进行意图识别时，常常会出现因语音不全导致的误识别和无法识别的问题。如需确保能正确地识别意图，则需要结合上下文(历史消息)进行匹配，但如果完全利用历史消息的文本内容，将导致样本量的急剧增加，因为原来的样本是单句消息，加上历史消息后样本变为多句消息。同时，并非所有的意图识别都需要结合上下文，因此结合上下文文本进行意图识别的代价过大。
技术实现思路
>本专利技术要解决的技术问题是为了克服现有技术中基于单句消息的匹配规则进行意图识别时常出现误识别和无法识别、在结合上下文文本进行意图识别时代价过大的缺陷，提供一种结合上下文的意图识别方法、系统、电子设备和存储介质。本专利技术是通过下述技术方案来解决上述技术问题：本专利技术提供一种结合上下文的意图识别方法，包括：建立包括多个意图规则的意图规则库，所述意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系；获取用户端输入的目标用户语音、以及与所述目标用户语音对应的目标上文话术控制指令；将所述用户语音转换为对应的目标语音文本；将所述目标语音文本和所述目标上文话术控制指令与各意图规则中的正则表达式和上文话术控制指令依次进行匹配，并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果。较佳地，在所述意图规则库中，至少部分所述意图规则配置有黑名单或白名单，所述黑名单或所述白名单中配置有相应的上文话术控制指令。较佳地，所述将所述目标语音文本和所述目标上文话术控制指令与各所述意图规则中的正则表达式和上文话术控制指令依次进行匹配，并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果，包括：从所述意图规则库中获取当前意图规则；判断当前意图规则是否配置有黑名单或白名单；当所述当前意图规则未配置黑名单或白名单、或者所述当前意图规则配置有黑名单但所述目标上文话术控制指令不在所述黑名单内、或者所述当前意图规则配置有白名单且所述目标上文话术控制指令在所述白名单内时，将所述目标语音文本和所述目标上文话术控制指令与所述当前意图规则中的正则表达式和上文话术控制指令进行匹配，若匹配成功，将所述当前意图规则对应的意图作为所述目标意图识别结果，若匹配不成功，则将下一个意图规则作为所述当前意图规则，并返回所述从所述意图规则库中获取当前意图规则的步骤，直至遍历所述意图规则库；当所述当前意图规则配置有黑名单且所述目标上文话术控制指令在所述黑名单内、或者所述当前意图规则配置有白名单但所述目标上文话术控制指令不在所述白名单内时，直接将下一个意图规则作为所述当前意图规则，并返回所述从所述意图规则库中获取当前意图规则的步骤，直至遍历所述意图规则库。较佳地，所述建立包括多个意图规则的意图规则库，包括：获取若干对话样本，各所述对话样本分别包括用户输入的语音样本文本以及与所述语音样本文本对应的上文话术控制指令；获取与各所述语音样本文本对应的正则表达式；获取与各所述语音样本文本对应的意图；建立各所述语音样本文本对应的意图、正则表达式和上文话术控制指令之间的映射关系，以构成意图规则；根据各所述意图规则建立所述意图规则库。较佳地，在将所述用户语音转换为对应的目标语音文本之后，所述方法还包括：对所述目标语音文本进行纠错处理。较佳地，在得到所述目标用户语音的目标意图识别结果之后，所述方法还包括：根据所述目标意图识别结果，获取下一轮次话术控制指令。本专利技术还提供一种结合上下文的意图识别系统，包括：规则库建立模块，用于建立包括多个意图规则的意图规则库，所述意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系；输入获取模块，用于获取用户端输入的目标用户语音、以及与所述目标用户语音对应的目标上文话术控制指令；语音转换模块，用于将所述用户语音转换为对应的目标语音文本；意图识别模块，用于将所述目标语音文本和所述目标上文话术控制指令与各所述意图规则中的正则表达式和上文话术控制指令依次进行匹配，并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果。较佳地，在所述意图规则库中，至少部分所述意图规则配置有黑名单或白名单，所述黑名单或所述白名单中配置有相应的上文话术控制指令。较佳地，所述意图识别模块包括：规则获取单元，用于从所述意图规则库中获取当前意图规则；判断单元，用于判断所述当前意图规则是否配置有黑名单或白名单；第一处理单元，用于当所述当前意图规则未配置黑名单或白名单、或者所述当前意图规则配置有黑名单但所述目标上文话术控制指令不在所述黑名单内、或者所述当前意图规则配置有白名单且所述目标上文话术控制指令在所述白名单内时，将所述目标语音文本和所述目标上文话术控制指令与所述当前意图规则中的正则表达式和上文话术控制指令进行匹配，若匹配成功，将所述当前意图规则对应的意图作为所述目标意图识别结果，若匹配不成功，则将下一个意图规则作为所述当前意图规则，并重新调用所述规则获取单元，直至遍历所述意图规则库；第二处理单元，用于当所述当前意图规则配置有黑名单且所述目标上文话术控制指令在所述黑名单内、或者所述当前意图规则配置有白名单但所述目标上文话术控制指令不在所述白名单内时，直接将下一个意图规则作为所述当前意图规则，并重新调用所述规则获取单元，直至遍历所述意图规则库。较佳地，所述规则库建立模块包括：样本获取单元，用于获取若干对话样本，各所述对话样本分别包括用户输入的语音样本文本以及与所述语音样本文本对应的上文话术控制指令；正则表达式获取单元，用于获取与各所述语音样本文本对应的正则表达式；意图获取单元，用于获取与各所述语音样本文本对应的意图；规则构建单元，用于建立各所述语音样本文本对应的意图、正则本文档来自技高网...

【技术保护点】
1.一种结合上下文的意图识别方法，其特征在于，包括：/n建立包括多个意图规则的意图规则库，所述意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系；/n获取用户端输入的目标用户语音、以及与所述目标用户语音对应的目标上文话术控制指令；/n将所述用户语音转换为对应的目标语音文本；/n将所述目标语音文本和所述目标上文话术控制指令与各意图规则中的正则表达式和上文话术控制指令依次进行匹配，并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果。/n

【技术特征摘要】
1.一种结合上下文的意图识别方法，其特征在于，包括：
建立包括多个意图规则的意图规则库，所述意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系；
获取用户端输入的目标用户语音、以及与所述目标用户语音对应的目标上文话术控制指令；
将所述用户语音转换为对应的目标语音文本；
将所述目标语音文本和所述目标上文话术控制指令与各意图规则中的正则表达式和上文话术控制指令依次进行匹配，并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果。

2.根据权利要求1所述的结合上下文的意图识别方法，其特征在于，在所述意图规则库中，至少部分所述意图规则配置有黑名单或白名单，所述黑名单或所述白名单中配置有相应的上文话术控制指令。

3.根据权利要求2所述的结合上下文的意图识别方法，其特征在于，所述将所述目标语音文本和所述目标上文话术控制指令与各所述意图规则中的正则表达式和上文话术控制指令依次进行匹配，并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果，包括：
从所述意图规则库中获取当前意图规则；
判断当前意图规则是否配置有黑名单或白名单；
当所述当前意图规则未配置黑名单或白名单、或者所述当前意图规则配置有黑名单但所述目标上文话术控制指令不在所述黑名单内、或者所述当前意图规则配置有白名单且所述目标上文话术控制指令在所述白名单内时，将所述目标语音文本和所述目标上文话术控制指令与所述当前意图规则中的正则表达式和上文话术控制指令进行匹配，若匹配成功，将所述当前意图规则对应的意图作为所述目标意图识别结果，若匹配不成功，则将下一个意图规则作为所述当前意图规则，并返回所述从所述意图规则库中获取当前意图规则的步骤，直至遍历所述意图规则库；
当所述当前意图规则配置有黑名单且所述目标上文话术控制指令在所述黑名单内、或者所述当前意图规则配置有白名单但所述目标上文话术控制指令不在所述白名单内时，直接将下一个意图规则作为所述当前意图规则，并返回所述从所述意图规则库中获取当前意图规则的步骤，直至遍历所述意图规则库。

4.根据权利要求1所述的结合上下文的意图识别方法，其特征在于，所述建立包括多个意图规则的意图规则库，包括：
获取若干对话样本，各所述对话样本分别包括用户输入的语音样本文本以及与所述语音样本文本对应的上文话术控制指令；
获取与各所述语音样本文本对应的正则表达式；
获取与各所述语音样本文本对应的意图；
建立各所述语音样本文本对应的意图、正则表达式和上文话术控制指令之间的映射关系，以构成意图规则；
根据各所述意图规则建立所述意图规则库。

5.根据权利要求1所述的结合上下文的意图识别方法，其特征在于，在将所述用户语音转换为对应的目标语音文本之后，所述方法还包括：
对所述目标语音文本进行纠错处理。

6.根据权利要求1所述的结合上下文的意图识别方法，其特征在于，在得到所述目标用户语音的目标意图识别结果之后，所述方法还包括：
根据所述目标意图识别结果，获取下一轮次话术控制指令。

7.一种结合上下文的意图识别系统，其特征在于，包括：
规则库建立模块，用于建立包括多个意图规则的意图规则库，所述意图规则包含意图与相应的正则表达...

【专利技术属性】
技术研发人员：邓艳江，罗超，胡泓，
申请(专利权)人：携程计算机技术上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人