基于断句的多意图识别方法、装置、设备及存储介质制造方法及图纸

技术编号：24996095 阅读：19 留言：0更新日期：2020-07-24 17:58

本发明专利技术涉及人工智能领域，公开了一种基于断句的多意图识别方法、装置、设备及存储介质，通过对目标语句进行细致的分割，再对分割后的目标语句进行意图识别，提高了目标语句意图识别的准确率以及效率，同时也提高了后续语义识别的准确率，本发明专利技术方法包括：获取用户输入的目标语句；利用预置序列模型对所述目标语句进行断句，得到分段语料；在预置意图规则库中，获取所述分段语料中的词向量，所述预置意图规则库是依据业务数据建立的；计算所述词向量与预置词向量之间的匹配率，得到分段意图，并获取到语料识别意图；对所述语料识别意图进行归类，并反馈最终的语料识别意图。

全部详细技术资料下载

【技术实现步骤摘要】
基于断句的多意图识别方法、装置、设备及存储介质
本专利技术涉及人工智能领域，尤其涉及基于断句的多意图识别方法、装置、设备及存储介质。
技术介绍
人机对话——是人工智能领域中的一个重要研究领域。利用计算机理解和运用人类社会的自然语言如汉语、英语等，实现人机之间的自然语言通信，使计算机能够代替人的部分脑力劳动，真正起到延伸人类大脑的作用。在人机对话的过程中，计算机可能要回答一些问题，给定某些参数或确定选择项。在对话过程中，通过对话，用户对计算机的工作给以引导或限定，监督任务的执行。该方式有利于将用户的意图、判断和经验，纳入计算机工作过程，增强计算机应用的灵活性，也便于软件编写。因此，计算机对用户输入语言的理解与处理功能是重中之重，目前，人机对话采用的是批处理，利用一批作业控制卡，按照设定的顺序逐个完成作业。在计算机执行作业的过程中，计算机对用户输入的语言进行意图识别是理解的关键，一般地，计算机将多意图识别问题转化为多标签模型分类问题。这种方式对语料的数量和语料的质量要求很高，且往往在开放域识别准确率不稳定，意图识别的效率低下。
技术实现思路
本专利技术提供一种基于断句的多意图识别方法、装置、设备及存储介质，用于解决计算机在意图识别过程中准确率低下的问题，提高了意图识别的准确率以及效率。为本专利技术实施例的第一方面提供一种基于断句的多意图识别方法，包括：获取用户输入的目标语句；利用预置序列模型对所述目标语句进行断句，得到分段语料；在预置意图规则库中，获取所述分段语料中的词向量，所...

【技术保护点】
1.一种基于断句的多意图识别方法，其特征在于，包括：/n获取用户输入的目标语句；/n利用预置序列模型对所述目标语句进行断句，得到分段语料；/n在预置意图规则库中，获取所述分段语料中的词向量，所述预置意图规则库是依据业务数据建立的；/n计算所述词向量与预置词向量之间的匹配率，得到分段意图，并获取到语料识别意图；/n对所述语料识别意图进行归类，并反馈最终的语料识别意图。/n

【技术特征摘要】
1.一种基于断句的多意图识别方法，其特征在于，包括：
获取用户输入的目标语句；
利用预置序列模型对所述目标语句进行断句，得到分段语料；
在预置意图规则库中，获取所述分段语料中的词向量，所述预置意图规则库是依据业务数据建立的；
计算所述词向量与预置词向量之间的匹配率，得到分段意图，并获取到语料识别意图；
对所述语料识别意图进行归类，并反馈最终的语料识别意图。

2.根据权利要求1所述基于断句的多意图识别方法，其特征在于，所述计算所述词向量与预置词向量之间的匹配率，得到分段意图，并获取到语料识别意图包括：
在预置意图规则库中，提取所述分段语料的词向量；
计算所述词向量与预置词向量之间的匹配率，所述预置词向量是设置在所述预置意图规则库中的，所述预置词向量对应多个所述业务数据的预置意图；
选取匹配率最高的所述预置词向量，将所述预置词向量对应的所述预置意图作为所述分段语料的分段意图，并获取到语料识别意图。

3.根据权利要求2所述基于断句的多意图识别方法，其特征在于，所述选取匹配率最高的所述预置词向量，将所述预置词向量对应的所述预置意图作为所述分段语料的分段意图，并获取到语料识别意图包括：
选取匹配率最高的所述预置词向量，将所述预置词向量对应的所述预置意图作为所述分段语料的分段意图；
判断所述分段意图中是否存在预置语句意图；
若所述分段意图中存在所述预置语句意图，则根据所述预置语句意图将所述分段语料进行切分，得到切分后的分段语料，并重新对所述切分后的分段语料进行判断，直到所述切分后的分段意图中不存在所述预置语句意图，将多个所述切分后的分段意图作为语料识别意图；
若所述分段意图中不存在所述预置语句意图，则将所述分段意图作为语料识别意图。

4.根据权利要求1所述基于断句的多意图识别方法，其特征在于，所述利用预置序列模型对所述目标语句进行断句，得到分段语料包括：
根据所述目标语句中分隔符的位置，对所述目标语句进行分割，得到分段语句；
在所述分段语句中选取字序列的切分序列；
计算切分概率，所述切分概率为所述分段语句按照所述切分序列进行切分的几率；
选取所述切分概率最高的切分序列作为切分结果，得到分段语料。

5.根据权利要求4所述基于断句的多意图识别方法，其特征在于，所述根据所述目标语句中分隔符的位置，对所述目标语句进行分割，得到分段语句包括：

【专利技术属性】
技术研发人员：黄孟缘，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人