意图识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:30790741 阅读:23 留言:0更新日期:2021-11-16 07:53
本发明专利技术提供一种意图识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别文本;对所述待识别文本进行片段划分,得到多个文本片段;对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合。本发明专利技术通过对待识别文本进行片段划分,使得每个文本片段仅表达一个意图,随后对各个文本片段以及各个文本片段组合分别进行意图识别,实现对每个可能完整表达一个意图的文本单位进行单独的意图识别,提高了意图识别的准确性和全面性,且克服了关键词模型存在的关键词难以枚举、泛化能力较差的缺陷,提高了文本语义分析的准确性。了文本语义分析的准确性。了文本语义分析的准确性。

【技术实现步骤摘要】
意图识别方法、装置、电子设备和存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种意图识别方法、装置、电子设备和存储介质。

技术介绍

[0002]随着互联网的发展,为用户的交互提供了很大便捷。对交互过程中产生的文本进行分析,确定用户表达的语义,从而对交互过程中产生的违规表达进行提醒,成为了提高交互准确性的重要手段。例如在客服场景,对坐席与客户沟通过程中产生的文本进行分析,可以在坐席违规的时候及时发现问题并快速阻断提醒。
[0003]对于待分析的文本,目前通常采用关键词模型对该文本进行分析,根据各个关键词的匹配结果,确定该文本所表达的语义信息,从而判断该文本中是否包含违规表达。然而,由于关键词无法枚举,因此利用关键词模型进行文本语义分析的泛化能力较差,容易遗漏文本中的语义信息,从而漏检违规表达。

技术实现思路

[0004]本专利技术提供一种意图识别方法、装置、电子设备和存储介质,用以解决现有技术中语义分析的泛化能力较差,容易遗漏文本中的语义信息的缺陷。
[0005]本专利技术提供一种意图识别方法,包括:
[0006]确定待识别文本;
[0007]对所述待识别文本进行片段划分,得到多个文本片段;
[0008]对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合。
[0009]根据本专利技术提供的一种意图识别方法,所述对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果,包括:
[0010]对所述各个文本片段以及所述各个文本片段组合分别进行意图识别,得到所述各个文本片段以及所述各个文本片段组合对应的候选意图,以及所述候选意图的得分;
[0011]基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果。
[0012]根据本专利技术提供的一种意图识别方法,所述基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果,包括:
[0013]确定任一文本片段所属文本片段组合对应的候选意图不一致,和/或,任一文本片段所属文本片段组合对应的候选意图与所述任一文本片段对应的候选意图不一致,则确定其中得分最高的候选意图为所述任一文本片段对应的意图;
[0014]基于所述各个文本片段对应的意图,确定所述意图识别结果。
[0015]根据本专利技术提供的一种意图识别方法,所述基于所述各个文本片段以及所述各个
文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果,包括:
[0016]按得分由高到低的顺序遍历各个候选意图;
[0017]确定当前候选意图对应的文本片段或文本片段组合与所述意图识别结果中已有意图对应的文本片段或文本片段组合有重叠,则删除所述当前候选意图;否则,将所述当前候选意图加入到所述意图识别结果中。
[0018]根据本专利技术提供的一种意图识别方法,所述对所述各个文本片段以及所述各个文本片段组合分别进行意图识别,得到所述各个文本片段以及所述各个文本片段组合对应的候选意图,包括:
[0019]将任一文本片段或任一文本片段组合与各个样本意图文本进行匹配,得到所述任一文本片段或所述任一文本片段组合与所述各个样本意图文本的相关程度;
[0020]基于所述任一文本片段或所述任一文本片段组合与所述各个样本意图文本的相关程度,以及所述各个样本意图文本对应的意图,确定所述任一文本片段或所述任一文本片段组合对应的候选意图。
[0021]根据本专利技术提供的一种意图识别方法,所述对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果,之后包括:
[0022]基于所述待识别文本的意图识别结果,对所述待识别文本进行质检,得到所述待识别文本的语义质检结果。
[0023]根据本专利技术提供的一种意图识别方法,所述文本片段组合是两个或三个连续文本片段的组合。
[0024]本专利技术还提供一种意图识别装置,包括:
[0025]文本确定单元,用于确定待识别文本;
[0026]文本划分单元,用于对所述待识别文本进行片段划分,得到多个文本片段;
[0027]意图识别单元,用于对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合。
[0028]本专利技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述意图识别方法的步骤。
[0029]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述意图识别方法的步骤。
[0030]本专利技术提供的意图识别方法、装置、电子设备和存储介质,通过对待识别文本进行片段划分,使得每个文本片段仅表达一个意图,随后对各个文本片段以及各个文本片段组合分别进行意图识别,实现对每个可能完整表达一个意图的文本单位进行单独的意图识别,提高了意图识别的准确性和全面性,此外,利用上述意图识别的方式对待识别文本进行语义分析,克服了关键词模型存在的关键词难以枚举、泛化能力较差的缺陷,提高了文本语义分析的准确性。
附图说明
[0031]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术
描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1为本专利技术提供的意图识别方法的流程示意图;
[0033]图2为本专利技术提供的意图识别结果确定方法的流程示意图;
[0034]图3为本专利技术提供的意图识别冲突解决方法的流程示意图;
[0035]图4为本专利技术提供的候选意图确定方法的流程示意图;
[0036]图5为本专利技术提供的语义质检方法的流程示意图;
[0037]图6为本专利技术提供的意图确定方法的流程示意图;
[0038]图7为本专利技术提供的意图识别装置的结构示意图;
[0039]图8为本专利技术提供的意图识别系统的结构示意图;
[0040]图9为本专利技术提供的电子设备的结构示意图。
具体实施方式
[0041]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0042]对交互过程中产生的文本进行分析,确定用户表达的语义本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:确定待识别文本;对所述待识别文本进行片段划分,得到多个文本片段;对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果;所述文本片段组合是多个连续文本片段的组合。2.根据权利要求1所述的意图识别方法,其特征在于,所述对各个文本片段以及各个文本片段组合分别进行意图识别,得到所述待识别文本的意图识别结果,包括:对所述各个文本片段以及所述各个文本片段组合分别进行意图识别,得到所述各个文本片段以及所述各个文本片段组合对应的候选意图,以及所述候选意图的得分;基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果。3.根据权利要求2所述的意图识别方法,其特征在于,所述基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果,包括:确定任一文本片段所属文本片段组合对应的候选意图不一致,和/或,任一文本片段所属文本片段组合对应的候选意图与所述任一文本片段对应的候选意图不一致,则确定其中得分最高的候选意图为所述任一文本片段对应的意图;基于所述各个文本片段对应的意图,确定所述意图识别结果。4.根据权利要求2所述的意图识别方法,其特征在于,所述基于所述各个文本片段以及所述各个文本片段所属文本片段组合对应的候选意图和所述候选意图的得分,确定所述意图识别结果,包括:按得分由高到低的顺序遍历各个候选意图;确定当前候选意图对应的文本片段或文本片段组合与所述意图识别结果中已有意图对应的文本片段或文本片段组合有重叠,则删除所述当前候选意图;否则,将所述当前候选意图加入到所述意图识别结果中。5.根据权利要...

【专利技术属性】
技术研发人员:田鹏何春江庄纪军胡加学赵乾
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1