用于对话系统的指代消解方法、装置及存储介质制造方法及图纸

技术编号:34323905 阅读:17 留言:0更新日期:2022-07-31 00:45
本发明专利技术涉及一种用于对话系统的指代消解方法,方法包括:将对话系统接收到的句子进行编码,得到句子的句矩阵;将句矩阵输入第一分类器组,获得句子的先行语的头索引和尾索引;根据先行语的头索引和尾索引获得先行语向量;将先行语向量与句矩阵作点积得到相关向量;将相关向量输入第二分类器组,获得句子的一个或多个照应语的头索引和尾索引;根据先行语的头索引和尾索引从句子中取出先行语,根据一个或多个照应语的头索引和尾索引从句子中取出一个或多个照应语,得到指代消解结果。本发明专利技术可以识别句子中同一个先行语所对应的多个照应语,为后续的对话内容处理提供更加完整的信息。息。息。

Reference resolution method, device and storage medium for dialogue system

【技术实现步骤摘要】
用于对话系统的指代消解方法、装置及存储介质


[0001]本专利技术主要涉及自然语言处理领域,具体地涉及一种用于对话系统的指代消解方法、装置及存储介质。

技术介绍

[0002]指代消解旨在识别句子中同一实体的多种不同表述方式。在智能座舱的对话系统中,用户时常会习惯性的使用代词来指代在前文中提到过的人、物、概念等实体以避免重复的字、词出现在对话中。例如用户在智能座舱中向语音助手询问:“昨天晚上有国足的比赛,他们进了几个球?他们进了几个乌龙球”,该句子中“他们”即是“国足”的代替表达方式。通常我们称句子中的“国足”为先行语(Antecedent),“他们”为照应语(Anaphor)。这种人类的直觉性的表达方式在由计算机解析时常会由于结构不够清晰而产生指代消解问题,造成句子的错误理解,从而导致糟糕的用户体验甚至在驾驶过程中产生危险。
[0003]在一些方案中,将指代消解问题转化为照应语

先行语联合最优解的问题,将照应语

先行语输入联合模型中,求模型的最优解以获得照应语对应的先行语。但是该方案照应语与先行语是一一对应的,无法识别句子中同一个先行语所对应的多个照应语。

技术实现思路

[0004]本专利技术所要解决的技术问题是提供一种用于对话系统的指代消解方法、装置及存储介质,可以识别句子中同一个先行语所对应的多个照应语。
[0005]本专利技术提供一种用于对话系统的指代消解方法,包括:将对话系统接收到的句子进行编码,得到所述句子的句矩阵;将所述句矩阵输入第一分类器组,获得所述句子的先行语的头索引和尾索引;根据所述先行语的头索引和尾索引获得先行语向量;将所述先行语向量与所述句矩阵作点积得到相关向量;将所述相关向量输入第二分类器组,获得所述句子的一个或多个照应语的头索引和尾索引;根据所述先行语的头索引和尾索引从所述句子中取出先行语,根据所述一个或多个照应语的头索引和尾索引从所述句子中取出一个或多个照应语,得到指代消解结果。
[0006]在本专利技术的一实施例中,所述第一分类器组和所述第二分类器组中的分类器为二元分类器。
[0007]在本专利技术的一实施例中,所述第一分类器组内的分类器可表示为:
[0008][0009][0010]其中是句矩阵中第i个位置是先行语的索引的概率,h
i
是句矩阵中的第i个位置的向量,W
ant
是第一权重矩阵,b
ant
是第一偏置,σ是激活函数,softmax是归一化指数函数,softmax函数将的最大值设为1,其余值为0,是指示第i个位置是否为先行语的索引的结果。
[0011]在本专利技术的一实施例中,所述第一分类器组包括第一分类器,用于识别所述句子中的先行语的头索引;第二分类器,用于识别所述句子中的先行语的尾索引。
[0012]在本专利技术的一实施例中,根据所述先行语的头索引和尾索引获得先行语向量的步骤包括:取出所述句矩阵中所述先行语的头索引和尾索引之间的所有向量;将取出的所述所有向量求和得到先行语向量。
[0013]在本专利技术的一实施例中,所述第二分类器组内的分类器可表示为:采用如下公式计算句矩阵中第i个位置是照应语的索引的概率,
[0014][0015]其中是句矩阵中第i个位置是照应语的索引的概率,h

i
是相关向量的第i个位置的向量,W
ana
是第二权重矩阵,b
ana
是第二偏置,σ是激活函数;
[0016]设定第一阈值,将所述照应语的索引的概率大于第一阈值的分类结果设为1,否则,设为0。
[0017]在本专利技术的一实施例中,所述第二分类器组包括:第三分类器,用于识别所述句子中的照应语的头索引;第四分类器,用于识别所述句子中的照应语的尾索引。
[0018]在本专利技术的一实施例中,在根据所述一个或多个照应语的头索引和尾索引从所述句子中取出一个或多个照应语之前,还包括步骤:将所述一个或多个照应语的头索引和尾索引进行一一配对,未出现头索引的尾索引或未出现尾索引的头索引不进行配对,最终得到一个或多个照应语的索引对。
[0019]在本专利技术的一实施例中,通过预训练编码器对所述句子进行编码。
[0020]在本专利技术的一实施例中,所述预训练编码器为具有构建上下文依赖能力的编码器。
[0021]在本专利技术的一实施例中,所述句矩阵的大小为M*N,其中M为编码后每个字向量或词向量的维度,N为句子长度。
[0022]在本专利技术的一实施例中,还包括:对接收到的句子进行预处理,所述预处理包括但不限于分词、词性和去除停用词。
[0023]本专利技术为解决上述技术问题还提供一种用于对话系统的指代消解装置,所述装置包括:存储器,用于存储可由处理器执行的指令;处理器,用于执行所述指令以实现上述方法。
[0024]本专利技术为解决上述技术问题还提供一种存储有计算机程序代码的计算机可读介质,所述计算机程序代码在由处理器执行时实现上述方法。
[0025]相比传统的指代消解方法,本专利技术通过第一分类器组识别先行语的索引对以及通过第二分类器组识别一个或多个照应语的索引对,能够识别出句子中同一个先行语所对应的多个照应语,为后续的对话内容处理提供更加完整的信息,增强了对话系统的自然语言理解能力,为用户提供了更加智能化的座舱体验;本专利技术采用具有构建上下文依赖能力的编码器,在识别先行语和照应语时有了预训练编码器的先验知识的辅助,提高了在依赖距离较长的先行语和照应语间建立正确联系的准确率。
附图说明
[0026]为让本专利技术的上述目的、特征和优点能更明显易懂,以下结合附图对本专利技术的具体实施方式作详细说明,其中:
[0027]图1是本专利技术一实施例的用于对话系统的指代消解方法的示例性流程示意图;
[0028]图2是本专利技术一实施例的对话系统中句子的处理示例性原理图;
[0029]图3是本专利技术一实施例的用于对话系统的指代消解装置的系统框图。
具体实施方式
[0030]为让本专利技术的上述目的、特征和优点能更明显易懂,以下结合附图对本专利技术的具体实施方式作详细说明。
[0031]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是本专利技术还可以采用其它不同于在此描述的其它方式来实施,因此本专利技术不受下面公开的具体实施例的限制。
[0032]如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
[0033]除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于对话系统的指代消解方法,其特征在于,包括:将对话系统接收到的句子进行编码,得到所述句子的句矩阵;将所述句矩阵输入第一分类器组,获得所述句子的先行语的头索引和尾索引;根据所述先行语的头索引和尾索引获得先行语向量;将所述先行语向量与所述句矩阵作点积得到相关向量;将所述相关向量输入第二分类器组,获得所述句子的一个或多个照应语的头索引和尾索引;根据所述先行语的头索引和尾索引从所述句子中取出先行语,根据所述一个或多个照应语的头索引和尾索引从所述句子中取出一个或多个照应语,得到指代消解结果。2.如权利要求1所述的指代消解方法,其特征在于,所述第一分类器组和所述第二分类器组中的分类器为二元分类器。3.如权利要求2所述的指代消解方法,其特征在于,所述第一分类器组内的分类器表示为:为:其中是句矩阵中第i个位置是先行语的索引的概率,h
i
是句矩阵中的第i个位置的向量,W
ant
是第一权重矩阵,b
ant
是第一偏置,σ是激活函数,softmax是归一化指数函数,softmax函数将的最大值设为1,其余值为0,是指示第i个位置是否为先行语的索引的结果。4.如权利要求3所述的指代消解方法,其特征在于,所述第一分类器组包括第一分类器,用于识别所述句子中的先行语的头索引;第二分类器,用于识别所述句子中的先行语的尾索引。5.如权利要求1所述的指代消解方法,其特征在于,根据所述先行语的头索引和尾索引获得先行语向量的步骤包括:取出所述句矩阵中所述先行语的头索引和尾索引之间的所有向量;将取出的所述所有向量求和得到先行语向量。6.如权利要求2所述的指代消解方法,其特征在于,所述第二分类器组内的分类器表示为:采用如下公式计算句矩阵中其第i个位置是照应语的索引的概率,其中是句矩...

【专利技术属性】
技术研发人员:马伯睿朱亚杰王章定魏德山王波
申请(专利权)人:合众新能源汽车有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1