意图识别方法、系统、设备及介质技术方案

技术编号:38432608 阅读:6 留言:0更新日期:2023-08-11 14:19
本发明专利技术涉及自然语言处理领域及数字医疗领域,提供一种意图识别方法、系统、设备及介质。方法包括:获取待识别语句;对待识别语句进行分词和前后顺序编码,获得待识别语句的注意力矩阵;根据注意力矩阵,提取待识别语句的语序特征和语义特征,并将语序特征和语义特征进行拼接,获得待识别语句的语序语义特征;计算语序语义特征与预设的多个不同意图标签的相似度,按照预设规则选择一个或多个意图标签作为用户的意图。实现了精确识别用户的多个不同意图。意图。意图。

【技术实现步骤摘要】
意图识别方法、系统、设备及介质


[0001]本专利技术涉及自然语言处理领域及数字医疗领域,特别涉及一种意图识别方法、系统、设备及介质。

技术介绍

[0002]意图识别是通过对用户表述的语言进行识别和处理,从而判断用户所表达的真实意图,并根据用户的真实意图与用户进行交互的过程。当今社会中,随着人工智能技术的不断发展,意图识别可以支持疾病辅助诊断、健康管理、远程会诊、数字问诊等功能。例如当患者使用云平台进行线上问诊时,云平台能够基于患者提供的各项信息,理解患者的主诉,以意图识别的方式,模拟医生真实问诊思路,对患者情况进行智能追问。从而使医生通过云平台快速了解患者病情,提高医患沟通的效率,为患者对症下药。但现有的意图识别方法通常是依据需求为用户提供适当的响应。例如在客服场景的问答系统中,可以根据用户输入的句子识别用户的意图,并为用户提供最合适的回应。
[0003]专利技术人意识到,上述的意图识别方法适用于单一意图识别,一旦用户的表述中有多个意图,则只能识别出其中一个意图,无法实现对用户所有意图的准确识别。此外,在对用户的意图进行识别时,通常使用单一的信息抽取方式,这导致无法兼顾用户输入的句子中各方面的信息,因而不能准确满足用户的搜索需求。

技术实现思路

[0004]本专利技术的目的在于提供一种意图识别方法、系统、设备及介质。以解决现有的意图识别方法仅针对单一意图进行识别,无法满足用户多意图搜索需求,导致意图识别的准确度较低,在医疗问诊环节中,医生无法精确获知患者相关信息的问题。
[0005]第一方面,提供了一种意图识别方法,包括:
[0006]获取待识别语句;
[0007]对所述待识别语句进行分词和前后顺序编码,获得所述待识别语句的注意力矩阵;
[0008]根据所述注意力矩阵,提取所述待识别语句的语序特征和语义特征,并将所述语序特征和语义特征进行拼接,获得所述待识别语句的语序语义特征;
[0009]计算所述语序语义特征与预设的多个不同意图标签的相似度,按照预设规则选择一个或多个意图标签作为用户的意图。
[0010]第二方面,提供了一种意图识别系统,包括:
[0011]语句获取模块,用于获取用户输入的待识别语句;
[0012]编码模块,用于对所述待识别语句进行分词和前后顺序编码,获得所述待识别语句的注意力矩阵;
[0013]解码模块,用于根据所述注意力矩阵,提取所述待识别语句的语序特征和语义特征,并将所述语序特征和语义特征进行拼接,获得所述待识别语句的语序语义特征;
[0014]意图识别模块,用于计算所述语序语义特征与预设的多个不同意图标签的相似度,按照预设规则选择一个或多个意图标签作为用户的意图。
[0015]第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器计算机程序时实现上述意图识别方法的步骤。
[0016]第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器时实现上述意图识别方法的步骤。
[0017]本专利技术的意图识别方法、系统、设备及介质。通过获取待识别语句,并对所述待识别语句进行分词和前后顺序编码,获得所述待识别语句的注意力矩阵。然后根据所述注意力矩阵,提取所述待识别语句的语序特征和语义特征,并将所述语序特征和语义特征进行拼接,获得所述待识别语句的语序语义特征。最后通过计算所述语序语义特征与预设的多个不同意图标签的相似度,按照预设规则选择一个或多个意图标签作为用户的意图。实现了精准识别用户的意图。在本专利技术中,针对现有方式中,仅仅可以识别用户单一意图的问题,通过将根据用户的待识别语句得到的语序语义特征与多个不同的意图标签相匹配,通过计算各自的相似度,即可按照预设规则选择一个或多个意图标签作为用户意图,从而能够识别用户的多个意图,以满足用户更多的需求。针对现有对于信息抽取方式单一的问题,同时抽取待识别语句中的语序特征和语义特征,通过将语序特征和语义特征进行信息聚合,从而能够融合用户待识别语句中各种信息量,减少了单一抽取方式带来的局限性。由于预设的意图标签之间没有相互影响,因此在将意图标签与语序语义特征进行相似度计算时,可使得用户的待识别语句在不同的意图标签下具有更个性的表达能力,以满足用户的多种不同意图,极大提升了意图识别的准确度。从而在医疗问诊场景中,通过对患者自述的病情相关信息进行意图识别,有助于医生快速、准确的了解患者的病情,提升了医生与患者的沟通效率,使得医生能够精准的获知患者的相关信息,有助于为患者对症下药。
附图说明
[0018]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图:
[0019]图1显示为本专利技术一实施例中意图识别方法的一应用环境示意图;
[0020]图2显示为本专利技术一实施例中意图识别方法的流程示意图;
[0021]图3显示为本专利技术一实施例中预处理的流程示意图;
[0022]图4显示为本专利技术一实施例中步骤S200的流程示意图;
[0023]图5显示为本专利技术一实施例中步骤S300的流程示意图;
[0024]图6显示为本专利技术一实施例中步骤S400的流程示意图;
[0025]图7显示为本专利技术一实施例中意图识别系统的结构框图;
[0026]图8是本专利技术一实施例中计算机设备的一结构示意图;
[0027]图9是本专利技术一实施例中计算机设备的另一结构示意图。
具体实施方式
[0028]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0029]本专利技术实施例提供的意图识别方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务端进行通信。服务端可以向客户端发送识别的用户意图,通过获取待识别语句,并对所述待识别语句进行分词和前后顺序编码,获得所述待识别语句的注意力矩阵。然后根据所述注意力矩阵,提取所述待识别语句的语序特征和语义特征,并将所述语序特征和语义特征进行拼接,获得所述待识别语句的语序语义特征。最后通过计算所述语序语义特征与预设的多个不同意图标签的相似度,按照预设规则选择一个或多个意图标签作为用户的意图。实现了精准识别用户的意图。在本专利技术中,针对现有方式中,仅仅可以识别用户单一意图的问题,通过将根据用户的待识别语句得到的语序语义特征与多个不同的意图标签相匹配,通过计算各自的相似度,即可按照预设规则选择一个或多个意图标签作为用户意图,从而能够识别用户的多个意图,以满足用户更多的需求。针对现有对于信息抽取方式单一的问题,同时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:获取待识别语句;对所述待识别语句进行分词和前后顺序编码,获得所述待识别语句的注意力矩阵;根据所述注意力矩阵,提取所述待识别语句的语序特征和语义特征,并将所述语序特征和语义特征进行拼接,获得所述待识别语句的语序语义特征;计算所述语序语义特征与预设的多个不同意图标签的相似度,按照预设规则选择一个或多个意图标签作为用户的意图。2.根据权利要求1所述的意图识别方法,其特征在于,所述获取用户输入的待识别语句之后,还包括:识别所述待识别语句的格式;若为文本格式,则保持所述待识别语句的格式不变;若为音频格式,则将所述待识别语句进行语音

文本转换,以获得文本格式的待识别语句。3.根据权利要求1或2所述的意图识别方法,其特征在于,所述对所述待识别语句进行分词和前后顺序编码,获得待识别语句的注意力矩阵之前,还包括:对所述待识别语句进行预处理,所述预处理包括以下过程;将所述待识别语句进行文本标准化处理,获得标准化待识别语句;其中,所述文本标准化处理包括数字归一化、英文大小写统一化和/或中文繁简体统一化;对所述标准化待识别语句进行文本清洗,去除非文本内容,获得清洗后待识别语句;对所述清洗后待识别语句进行文本纠错,获得预处理后的待识别语句。4.根据权利要求1所述的意图识别方法,其特征在于,所述对所述待识别语句进行分词和前后顺序编码,获得所述待识别语句的注意力矩阵,包括:使用预设的分词器对所述待识别语句进行切分,获取所述待识别语句的多个词汇,生成所述待识别语句的词汇序列;对所述待识别语句的词汇序列进行词嵌入处理,生成所述待识别语句的语义特征矩阵;依据词汇在所述待识别语句的位置将所述语义特征矩阵进行位置编码,获得所述待识别语句的位置编码矩阵;将所述位置编码矩阵与所述语义特征矩阵相加,得到所述待识别语句的特征矩阵;使用预训练的多头自注意力机制网络模型融合所述特征矩阵中的位置信息和语序信息,得到待识别语句的注意力矩阵。5.根据权利要求4所述的意图识别方法,其特征在于,所述使用预训练的多头自注意力机制网络模型融合所述特征矩阵中的位置信息和语序信息,得到待识别语句的注意力矩阵,包括:S2501、选择所述多头自注意力机制网络模型中其中一个注意力头作为当前的注意力头;S2502、将所述特征矩阵分别与当前的注意力头预设的查询向量权重矩阵、键向量权重矩阵和值向量权重矩阵进行点乘,获得查询向量矩阵、键向量矩阵和值向量矩阵;S2503、将查询向量矩阵、...

【专利技术属性】
技术研发人员:夏烽
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1