基于断句的多意图识别方法、装置、设备及存储介质制造方法及图纸

技术编号:24996095 阅读:19 留言:0更新日期:2020-07-24 17:58
本发明专利技术涉及人工智能领域,公开了一种基于断句的多意图识别方法、装置、设备及存储介质,通过对目标语句进行细致的分割,再对分割后的目标语句进行意图识别,提高了目标语句意图识别的准确率以及效率,同时也提高了后续语义识别的准确率,本发明专利技术方法包括:获取用户输入的目标语句;利用预置序列模型对所述目标语句进行断句,得到分段语料;在预置意图规则库中,获取所述分段语料中的词向量,所述预置意图规则库是依据业务数据建立的;计算所述词向量与预置词向量之间的匹配率,得到分段意图,并获取到语料识别意图;对所述语料识别意图进行归类,并反馈最终的语料识别意图。

【技术实现步骤摘要】
基于断句的多意图识别方法、装置、设备及存储介质
本专利技术涉及人工智能领域,尤其涉及基于断句的多意图识别方法、装置、设备及存储介质。
技术介绍
人机对话——是人工智能领域中的一个重要研究领域。利用计算机理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,使计算机能够代替人的部分脑力劳动,真正起到延伸人类大脑的作用。在人机对话的过程中,计算机可能要回答一些问题,给定某些参数或确定选择项。在对话过程中,通过对话,用户对计算机的工作给以引导或限定,监督任务的执行。该方式有利于将用户的意图、判断和经验,纳入计算机工作过程,增强计算机应用的灵活性,也便于软件编写。因此,计算机对用户输入语言的理解与处理功能是重中之重,目前,人机对话采用的是批处理,利用一批作业控制卡,按照设定的顺序逐个完成作业。在计算机执行作业的过程中,计算机对用户输入的语言进行意图识别是理解的关键,一般地,计算机将多意图识别问题转化为多标签模型分类问题。这种方式对语料的数量和语料的质量要求很高,且往往在开放域识别准确率不稳定,意图识别的效率低下。
技术实现思路
本专利技术提供一种基于断句的多意图识别方法、装置、设备及存储介质,用于解决计算机在意图识别过程中准确率低下的问题,提高了意图识别的准确率以及效率。为本专利技术实施例的第一方面提供一种基于断句的多意图识别方法,包括:获取用户输入的目标语句;利用预置序列模型对所述目标语句进行断句,得到分段语料;在预置意图规则库中,获取所述分段语料中的词向量,所述预置意图规则库是依据业务数据建立的;计算所述词向量与预置词向量之间的匹配率,得到分段意图,并获取到语料识别意图;对所述语料识别意图进行归类,并反馈最终的语料识别意图。可选的,在本专利技术实施例第一方面的第一种实现方式中,在预置意图规则库中,提取所述分段语料的词向量;计算所述词向量与预置词向量之间的匹配率,所述预置词向量是设置在所述预置意图规则库中的,所述预置词向量对应多个所述业务数据的预置意图;选取匹配率最高的所述预置词向量,将所述预置词向量对应的所述预置意图作为所述分段语料的分段意图,并获取到语料识别意图。可选的,在本专利技术实施例第一方面的第二种实现方式中,选取匹配率最高的所述预置词向量,将所述预置词向量对应的所述预置意图作为所述分段语料的分段意图;判断所述分段意图中是否存在预置语句意图;若所述分段意图中存在所述预置语句意图,则根据所述预置语句意图将所述分段语料进行切分,得到切分后的分段语料,并重新对所述切分后的分段语料进行判断,直到所述切分后的分段意图中不存在所述预置语句意图,将多个所述切分后的分段意图作为语料识别意图;若所述分段意图中不存在所述预置语句意图,则将所述分段意图作为语料识别意图。可选的,在本专利技术实施例第一方面的第三种实现方式中,根据所述目标语句中分隔符的位置,对所述目标语句进行分割,得到分段语句;在所述分段语句中选取字序列的切分序列;计算切分概率,所述切分概率为所述分段语句按照所述切分序列进行切分的几率;选取所述切分概率最高的切分序列作为切分结果,得到分段语料。可选的,在本专利技术实施例第一方面的第四种实现方式中,在所述目标语句中,定位分隔符的位置;在所述分隔符的位置两侧,将所述目标语句分割,得到分段语句。可选的,在本专利技术实施例第一方面的第五种实现方式中,提取所述分段语句中的字序列;在所述字序列的首尾分别添加第一特殊字与第二特殊字,得到新的字序列;在所述新的字序列中相邻的所述字节点之间建立有向边,得到合成词组;若所述合成词组是预置词典中的一个词语,则删除所述字节点之间的所述有向边,并在所述字节点的两端建立所述有向边,直至完成整个所述分段语句的切分,得到选取的切分序列。可选的,在本专利技术实施例第一方面的第六种实现方式中,提取所述分段语料的所述语料识别意图;判断所述语料识别意图中是否包括互斥意图,所述互斥意图为在目标语句中同时出现肯定语料识别意图与否定语料识别意图;若语料意图识别中不包括所述互斥意图,则将语料识别意图作为最终的语料识别意图,并反馈所述最终的语料识别意图;若语料意图识别中包括所述互斥意图,则将带有转折意图的语料识别意图作为最终的语料识别意图,并反馈所述最终的语料识别意图。本专利技术实施例的第二方面提供一种基于断句的多意图识别装置,包括:第一获取单元,用于获取用户输入的目标语句;断句单元,用于利用预置序列模型对所述目标语句进行断句,得到分段语料;第二获取单元,用于在预置意图规则库中,获取所述分段语料中的词向量,所述预置意图规则库是依据业务数据建立的;计算单元,用于计算所述词向量与预置词向量之间的匹配率,得到分段意图,并获取到语料识别意图;反馈单元,用于对所述语料识别意图进行归类,并反馈最终的语料识别意图。可选的,在本专利技术实施例第二方面的第一种实现方式中,计算单元具体包括:提取模块,用于在预置意图规则库中,提取所述分段语料的词向量;计算模块,用于计算所述词向量与预置词向量之间的匹配率,所述预置词向量是设置在所述预置意图规则库中的,所述预置词向量对应多个所述业务数据的预置意图;第三选取模块,用于选取匹配率最高的所述预置词向量,将所述预置词向量对应的所述预置意图作为所述分段语料的分段意图,并获取到语料识别意图。可选的,在本专利技术实施例第二方面的第二种实现方式中,选取模块具体用于:选取匹配率最高的所述预置词向量,将所述预置词向量对应的所述预置意图作为所述分段语料的分段意图;判断所述分段意图中是否存在预置语句意图;若所述分段意图中存在所述预置语句意图,则根据所述预置语句意图将所述分段语料进行切分,得到切分后的分段语料,并重新对所述切分后的分段语料进行判断,直到所述切分后的分段意图中不存在所述预置语句意图,将多个所述切分后的分段意图作为语料识别意图;若所述分段意图中不存在所述预置语句意图,则将所述分段意图作为语料识别意图。可选的,在本专利技术实施例第二方面的第三种实现方式中,断句单元具体包括:分割模块,用于根据所述目标语句中分隔符的位置,对所述目标语句进行分割,得到分段语句;第一选取模块,用于在所述分段语句中选取字序列的切分序列;计算模块,用于计算切分概率,所述切分概率为所述分段语句按照所述切分序列进行切分的几率;第二选取模块,用于选取所述切分概率最高的切分序列作为切分结果,得到分段语料。可选的,在本专利技术实施例第二方面的第四种实现方式中,分割模块具体用于:在所述目标语句中,定位分隔符的位置;在所述分隔符的位置两侧,将所述目标语句分割,得到分段语句。可选的,在本专利技术实施例第二方面的第五种实现方式中,第一选取模块具体用于:提取所述分段语句中的字序列;在所述字序列的首尾分别添加第一特殊字与第二特殊字,得到新的字序列;在所述新的字序列中相邻的所述字节点之间建立有向边,得到合成词组;若所述合成词组是预置词典中的一个词语,则删除所述字节点之间的所述有向边,并在所述字节点的两端建立所述有向边,直至完成整个所述分段语句的切分,得到选取的切分序列。可选的,在本专利技术实施例本文档来自技高网...

【技术保护点】
1.一种基于断句的多意图识别方法,其特征在于,包括:/n获取用户输入的目标语句;/n利用预置序列模型对所述目标语句进行断句,得到分段语料;/n在预置意图规则库中,获取所述分段语料中的词向量,所述预置意图规则库是依据业务数据建立的;/n计算所述词向量与预置词向量之间的匹配率,得到分段意图,并获取到语料识别意图;/n对所述语料识别意图进行归类,并反馈最终的语料识别意图。/n

【技术特征摘要】
1.一种基于断句的多意图识别方法,其特征在于,包括:
获取用户输入的目标语句;
利用预置序列模型对所述目标语句进行断句,得到分段语料;
在预置意图规则库中,获取所述分段语料中的词向量,所述预置意图规则库是依据业务数据建立的;
计算所述词向量与预置词向量之间的匹配率,得到分段意图,并获取到语料识别意图;
对所述语料识别意图进行归类,并反馈最终的语料识别意图。


2.根据权利要求1所述基于断句的多意图识别方法,其特征在于,所述计算所述词向量与预置词向量之间的匹配率,得到分段意图,并获取到语料识别意图包括:
在预置意图规则库中,提取所述分段语料的词向量;
计算所述词向量与预置词向量之间的匹配率,所述预置词向量是设置在所述预置意图规则库中的,所述预置词向量对应多个所述业务数据的预置意图;
选取匹配率最高的所述预置词向量,将所述预置词向量对应的所述预置意图作为所述分段语料的分段意图,并获取到语料识别意图。


3.根据权利要求2所述基于断句的多意图识别方法,其特征在于,所述选取匹配率最高的所述预置词向量,将所述预置词向量对应的所述预置意图作为所述分段语料的分段意图,并获取到语料识别意图包括:
选取匹配率最高的所述预置词向量,将所述预置词向量对应的所述预置意图作为所述分段语料的分段意图;
判断所述分段意图中是否存在预置语句意图;
若所述分段意图中存在所述预置语句意图,则根据所述预置语句意图将所述分段语料进行切分,得到切分后的分段语料,并重新对所述切分后的分段语料进行判断,直到所述切分后的分段意图中不存在所述预置语句意图,将多个所述切分后的分段意图作为语料识别意图;
若所述分段意图中不存在所述预置语句意图,则将所述分段意图作为语料识别意图。


4.根据权利要求1所述基于断句的多意图识别方法,其特征在于,所述利用预置序列模型对所述目标语句进行断句,得到分段语料包括:
根据所述目标语句中分隔符的位置,对所述目标语句进行分割,得到分段语句;
在所述分段语句中选取字序列的切分序列;
计算切分概率,所述切分概率为所述分段语句按照所述切分序列进行切分的几率;
选取所述切分概率最高的切分序列作为切分结果,得到分段语料。


5.根据权利要求4所述基于断句的多意图识别方法,其特征在于,所述根据所述目标语句中分隔符的位置,对所述目标语句进行分割,得到分段语句包括:

【专利技术属性】
技术研发人员:黄孟缘
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1