文本解释方法、装置、设备和存储介质制造方法及图纸

技术编号:36879949 阅读:5 留言:0更新日期:2023-03-15 21:04
本发明专利技术实施例提供一种文本解释方法、装置、设备和存储介质,该方法包括:根据待解释的样本文本,生成初始词单元集合,初始词单元集合中包括多个词单元;基于初始词单元集合中各个词单元间的交互分数,生成待解释的样本文本的目标多层词单元集合;交互分数用于量化词单元之间的相互作用对词单元解释结果的影响程度;基于目标多层词单元集合,对样本文本进行解释。本发明专利技术实施例的方法通过待解释的样本文本生成初始词单元集合,进而基于初始词单元集合中各个词单元间的交互分数进行词单元的合并,可有效捕捉远距离词单元间的组合语义并对样本文本进行层级解释,使得解释结果准确地反映待解释模型的预测过程,实现了对文本的准确解释。解释。解释。

【技术实现步骤摘要】
文本解释方法、装置、设备和存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种文本解释方法、装置、设备和存储介质。

技术介绍

[0002]归因解释方法可以给出输入当中每个特征对模型的对应的贡献大小,可以在一定程度上解释模型的推理过程,因此在近年来得到了很多的关注。其中,层级解释可以生成分层的词单元集合并为每个词单元提供归因分数。
[0003]相关技术中,基于连接规则进行层级归因解释,但是基于连接规则进行层级归因解释只能先合并相邻的单词,不符合深度神经网络的基础架构和自然语言处理(Natural Language Processing,NPL)任务的推理模式,且使用连接规则作为额外的先验规则会限制层级解释反映模型决策过程的能力。

技术实现思路

[0004]针对现有技术中的问题,本专利技术实施例提供一种文本解释方法、装置、设备和存储介质。
[0005]具体地,本专利技术实施例提供了以下技术方案:
[0006]第一方面,本专利技术实施例提供了一种文本解释方法,包括:
[0007]根据待解释的样本文本,生成初始词单元集合,所述初始词单元集合中包括多个词单元;
[0008]基于所述初始词单元集合中各个词单元间的交互分数,生成所述待解释的样本文本的目标多层词单元集合;所述交互分数用于量化词单元之间的相互作用对词单元解释结果的影响程度;
[0009]基于所述目标多层词单元集合,对所述样本文本进行解释。
[0010]进一步地,所述基于所述初始词单元集合中各个词单元间的交互分数,生成所述待解释的样本文本的目标多层词单元集合,包括:
[0011]步骤a:将初始词单元集合作为样本文本的初始多层词单元集合;
[0012]步骤b:基于初始词单元集合中各个词单元间的交互分数,进行词单元合并,生成目标词单元集合;
[0013]步骤c:基于初始多层词单元集合和所述目标词单元集合,生成所述待解释的样本文本的目标多层词单元集合;
[0014]将所述目标多层词单元集合作为新的初始多层词单元集合,将所述目标词单元集合作为新的初始词单元集合,重复执行步骤b

c,直至所述初始词单元集合中的词单元数量小于第一阈值。
[0015]进一步地,所述基于初始词单元集合中各个词单元间的交互分数,进行词单元合并,生成目标词单元集合,包括:
[0016]确定初始词单元集合中各个词单元间的交互分数,将交互分数最大的两个词单元进行合并,生成目标词单元集合。
[0017]进一步地,所述确定初始词单元集合中各个词单元间的交互分数,包括:
[0018]基于第一量化指标和第二量化指标,确定初始词单元集合中第一词单元和第二词单元间的交互分数;所述第一量化指标用于量化第一词单元对第二词单元的解释结果的影响;所述第二量化指标用于量化第二词单元对第一词单元的解释结果的影响;
[0019]基于初始词单元集合中第一词单元和第二词单元间的交互分数,确定初始词单元集合中各个词单元间的交互分数。
[0020]进一步地,所述确定初始词单元集合中各个词单元间的交互分数,包括:
[0021]利用如下公式确定各个词单元间的交互分数:
[0022][0023]所述表示词单元s
i
与词单元s
j
之间的交互分数;所述S表示初始词单元集合;所述表示在s
j
被边缘化的情况下词单元s
i
的解释分数;所述表示在s
i
被边缘化的情况下词单元s
j
的解释分数;所述表示量化词单元s
j
对解释方法Algo下的词单元s
i
的解释的影响;所述表示量化词单元s
i
对解释方法Algo下的词单元s
j
的解释的影响。
[0024]进一步地,所述根据待解释的样本文本,生成初始词单元集合,包括:
[0025]将所述待解释的样本文本中的各个单词作为各个词单元;
[0026]根据所述各个词单元,生成初始词单元集合。
[0027]第二方面,本专利技术实施例还提供了一种文本解释装置,包括:
[0028]生成模块,用于根据待解释的样本文本,生成初始词单元集合,所述初始词单元集合中包括多个词单元;
[0029]处理模块,用于基于所述初始词单元集合中各个词单元间的交互分数,生成所述待解释的样本文本的目标多层词单元集合;所述交互分数用于量化词单元之间的相互作用对词单元解释结果的影响程度;
[0030]解释模块,用于基于所述目标多层词单元集合,对所述样本文本进行解释。
[0031]第三方面,本专利技术实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述文本解释方法的步骤。
[0032]第四方面,本专利技术实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述文本解释方法的步骤。
[0033]第五方面,本专利技术实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述文本解释方法的步骤。
[0034]本专利技术实施例提供的文本解释方法、装置、设备和存储介质,通过待解释的样本文本生成初始词单元集合,进而基于初始词单元集合中各个词单元间的交互分数进行词单元
的合并,可有效捕捉远距离词单元间的组合语义并对样本文本进行层级解释,使得解释结果准确地反映待解释模型的预测过程,实现了对文本的准确解释。
附图说明
[0035]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0036]图1是本专利技术实施例提供的文本解释方法的流程示意图;
[0037]图2是本专利技术实施例提供的层级解释方法示意图;
[0038]图3a是本专利技术实施例提供的带连接规则的层级解释方法示意图之一;
[0039]图3b是本专利技术实施例提供的带连接规则的层级解释方法示意图之二;
[0040]图4a是本专利技术实施例提供的不带连接规则的层级解释方法示意图之一;
[0041]图4b是本专利技术实施例提供的不带连接规则的层级解释方法示意图之二;
[0042]图5是本专利技术实施例提供的不同解释方法准确性的示意图之一;
[0043]图6是本专利技术实施例提供的不同解释方法准确性的示意图之二;
[0044]图7是本专利技术实施例提供的文本解释装置的结构示意图;
[0045]图8是本专利技术实施例提供的电子设备的结构示意图。
具体实施方式
[0046]为使本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本解释方法,其特征在于,包括:根据待解释的样本文本,生成初始词单元集合,所述初始词单元集合中包括多个词单元;基于所述初始词单元集合中各个词单元间的交互分数,生成所述待解释的样本文本的目标多层词单元集合;所述交互分数用于量化词单元之间的相互作用对词单元解释结果的影响程度;基于所述目标多层词单元集合,对所述样本文本进行解释。2.根据权利要求1所述的文本解释方法,其特征在于,所述基于所述初始词单元集合中各个词单元间的交互分数,生成所述待解释的样本文本的目标多层词单元集合,包括:步骤a:将初始词单元集合作为样本文本的初始多层词单元集合;步骤b:基于初始词单元集合中各个词单元间的交互分数,进行词单元合并,生成目标词单元集合;步骤c:基于初始多层词单元集合和所述目标词单元集合,生成所述待解释的样本文本的目标多层词单元集合;将所述目标多层词单元集合作为新的初始多层词单元集合,将所述目标词单元集合作为新的初始词单元集合,重复执行步骤b

c,直至所述初始词单元集合中的词单元数量小于第一阈值。3.根据权利要求2所述的文本解释方法,其特征在于,所述基于初始词单元集合中各个词单元间的交互分数,进行词单元合并,生成目标词单元集合,包括:确定初始词单元集合中各个词单元间的交互分数,将交互分数最大的两个词单元进行合并,生成目标词单元集合。4.根据权利要求3所述的文本解释方法,其特征在于,所述确定初始词单元集合中各个词单元间的交互分数,包括:基于第一量化指标和第二量化指标,确定初始词单元集合中第一词单元和第二词单元间的交互分数;所述第一量化指标用于量化第一词单元对第二词单元的解释结果的影响;所述第二量化指标用于量化第二词单元对第一词单元的解释结果的影响;基于初始词单元集合中第一词单元和第二词单元间的交互分数,确定初始词单元集合中各个词单元间的交互分数。5.根据权利要求4所述的文本解释方法,其特征在于,所述确定初始词单元集合中各个词单元间的交互分数,包括:利用如下...

【专利技术属性】
技术研发人员:张元哲赵军刘康鞠一鸣
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1