一种文本语义识别方法、装置、电子终端及存储介质制造方法及图纸

技术编号:36001094 阅读:18 留言:0更新日期:2022-12-17 23:18
本发明专利技术实施例公开了一种文本语义识别方法、装置、电子终端及存储介质,该方法包括:通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;将所述原始文本中与所述至少一个意图标签相关的句子片段依序组成中间文本;获取与所述中间文本相关的至少一个意图标签对应的至少一个原因标签;通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签;根据预测出的所述情感标签,从所述至少一个原因标签中确定目标原因标签。能够实现对长文本进行多意图、多粒度语义的精准识别。语义的精准识别。语义的精准识别。

【技术实现步骤摘要】
一种文本语义识别方法、装置、电子终端及存储介质


[0001]本专利技术实施例涉及自然语言处理技术,尤其涉及一种文本语义识别方法、装置、电子终端及存储介质。

技术介绍

[0002]文本语义识别可广泛应用于金融、通信、电子商务等领域的机器人智能对话服务中。现有技术中,基于模型进行文本语义识别主要涉及短文本的单一意图识别。然而,在实际应用中,往往存在对长文本进行多意图、多粒度语义的精准识别的需求。
[0003]基于现有模型进行文本语义识别,容易出现将长本文直接截断识别的情况,导致语义识别精度低。此外,现有模型也难以实现多意图、多粒度的语义识别。因此,亟需一种文本语义识别方法来解决现有技术中难以对长本文进行多意图、多粒度语义的精准识别的技术问题。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供了一种文本语义识别方法、装置、电子终端及存储介质,能够实现对长文本进行多意图、多粒度语义的精准识别。
[0005]第一方面,本专利技术实施例提供了一种文本语义识别方法,包括:
[0006]通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;
[0007]将所述原始文本中与所述至少一个意图标签相关的句子片段依序组成中间文本;
[0008]获取与所述中间文本相关的至少一个意图标签对应的至少一个原因标签;
[0009]通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签;
[0010]根据预测出的所述情感标签,从所述至少一个原因标签中确定目标原因标签。
[0011]第二方面,本专利技术实施例还提供了一种文本语义识别装置,包括:
[0012]相关意图判断模块,用于通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;
[0013]文本筛选模块,用于将所述原始文本中与所述至少一个意图标签相关的句子片段依序组成中间文本;
[0014]原因标签获取模块,用于获取与所述中间文本相关的至少一个意图标签对应的至少一个原因标签;
[0015]情感标签预测模块,用于通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签;
[0016]目标原因确定模块,用于根据预测出的所述情感标签,从所述至少一个原因标签中确定目标原因标签。
[0017]第三方面,本专利技术实施例还提供了一种电子终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本申请任意实施例提供的文本语义识别方法。
[0018]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请任意实施例提供的文本语义识别方法。
[0019]本专利技术实施例提供的一种文本语义识别方法、装置、电子终端及存储介质,该文本语义识别方法包括:通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;将原始文本中与至少一个意图标签相关的句子片段依序组成中间文本;获取与中间文本相关的至少一个意图标签对应的至少一个原因标签;通过第二阶段模型预测中间文本针对至少一个原因标签的情感标签;根据预测出的情感标签,从至少一个原因标签中确定目标原因标签。
[0020]通过第一阶段模型能够对较长原始文本进行预处理,从原始文本中筛选出与至少一个意图标签相关的中间文本,可压缩文本长度、增强信息效度,避免文本直接截断识别的情况,可提高识别精度。通过第二阶段模型能够对各相关意图标签粒度下更细的原因标签粒度进行识别,预测出各原因标签对应的情感标签,进而可依据情感标签确定出目标原因标签。综上,本专利技术实施例提供的技术方案,可实现对长文本进行多意图、多粒度语义的精准识别。
附图说明
[0021]图1是本专利技术实施例一提供的一种文本语义识别方法的流程示意图;
[0022]图2是本专利技术实施例二提供的一种文本语义识别方法中确定中间文本的流程框图;
[0023]图3是本专利技术实施例二提供的一种文本语义识别方法中第一阶段模型的处理流程框图;
[0024]图4是本专利技术实施例三提供的一种文本语义识别方法中预测情感标签的流程框图;
[0025]图5是本专利技术实施例三提供的一种文本语义识别方法中第二阶段模型的处理流程框图;
[0026]图6是本专利技术实施例四提供的一种文本语义识别方法的流程示意图;
[0027]图7是本专利技术实施例五提供的一种文本语义识别装置的结构示意图;
[0028]图8是本专利技术实施例六提供的一种电子终端的结构示意图。
具体实施方式
[0029]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。
[0030]实施例一
[0031]图1是本专利技术实施例一提供的一种文本语义识别方法的流程示意图。本实施例可
适用于对文本进行多意图、多粒度语义识别的情况,例如可适用于对邮件等长文本进行多意图、多粒度语义识别的情况。该方法可以由本专利技术实施例提供的文本语义识别装置来执行,该装置可采用软件和/或硬件的方式实现,且可配置于电子终端中,例如配置于计算机中。
[0032]参见图1,本实施例提供的文本语义识别方法,可以包括:
[0033]S110、通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关。
[0034]本专利技术实施例中,原始文本可以用S
c
={char1,char2,

,char
c_n
}表示,其中char可表示字符,其下标可表示字符排序,c_n可表示原始文本包含的字符总数;可以通过已有的分词方法(例如jieba分词软件)将原始文本S
c
进行分词,得到原始文本在词维度上的表示S
w
={word1,word2,

,word
w_n
},其中word可表示词语,其下标可表示词语排序,w_n可表示原始文本包含的词语总数;之后可通过已有的分句方法(例如深度学习算法)对S
w
进行分句,得到原始文本在句子维度上的表示S
s
={sent1,sent2,

,sent
s_n
},其中sent可表示句子片段,其下标可表示句子片段的排序,s_n可表示原始文本包含的句子片段的总数。
[0035]本专利技术实施例中,意图标签可以认为是粗粒度的语义标签,可用于描述原始本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本语义识别方法,其特征在于,包括:通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关;将所述原始文本中与所述至少一个意图标签相关的句子片段依序组成中间文本;获取与所述中间文本相关的至少一个意图标签对应的至少一个原因标签;通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签;根据预测出的所述情感标签,从所述至少一个原因标签中确定目标原因标签。2.根据权利要求1所述的方法,其特征在于,所述通过第一阶段模型判断原始文本中的各句子片段是否与至少一个意图标签相关,包括:依次获取原始文本中的各句子片段;将当前获取的句子片段和意图标签组输入第一阶段模型;所述意图标签组中包含至少一个意图标签;通过所述第一阶段模型对所述当前获取的句子片段和所述意图标签组进行处理,输出所述当前获取的句子片段与所述至少一个意图标签是否相关。3.根据权利要求2所述的方法,其特征在于,所述通过所述第一阶段模型对所述当前获取的句子片段和所述意图标签组进行处理,包括:通过所述第一阶段模型,将所述当前获取的句子片段中各词语转化为各第一词向量,以及将所述意图标签组中各意图标签转化为各第二词向量;根据所述各第一词向量确定所述句子片段的句嵌入向量,以及根据所述各第二词向量确定所述意图标签组的标签组嵌入向量;根据所述句嵌入向量和所述标签组嵌入向量,确定所述句子片段与所述意图标签组之间的第一注意力权重;利用所述第一注意力权重对所述句嵌入向量进行处理,确定目标特征向量;根据所述目标特征向量判断所述当前获取的句子片段与所述至少一个意图标签是否相关。4.根据权利要求1所述的方法,其特征在于,所述通过第二阶段模型预测所述中间文本针对所述至少一个原因标签的情感标签,包括:将所述中间文本和所述至少一个原因标签输入第二阶段模型;通过所述第二阶段模型对所述中间文本和所述至少一个原因标签进行处理,输出所述中间文本针对所述至少一个原因标签的情感标签。5.根据权利要求4所述的方法,其特征在于,所述通过所述第二阶段模型对所述中间文本和所述至少一...

【专利技术属性】
技术研发人员:徐义通郭林海张琛万化
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1