指代消解的方法、装置及电子设备制造方法及图纸

技术编号:29791069 阅读:10 留言:0更新日期:2021-08-24 18:10
本申请适用于人工智能技术领域,提供了一种指代消解的方法及装置,所述方法包括:获取待指代消解的目标文本;获取所述目标文本的词义特征,获取所述目标文本的词性特征,位置特征和知识特征中的至少一个目标特征;将所述词义特征和所述目标特征组成输入矩阵;将所述输入矩阵输入神经网络模型,得到指代消解结果。本申请增加了神经网络模型输入数据的信息种类,从而提高了指代消解结果的准确性。

【技术实现步骤摘要】
指代消解的方法、装置及电子设备
本申请属于自然语言处理
,尤其涉及一种指代消解的方法、装置及电子设备。
技术介绍
自然语言是人类智慧的结晶。虽然自然语言处理是人工智能中最为困难的问题之一,但是对自然语言处理的研究一直都是热点。指代作为一种常见的语言现象,广泛存在于自然语言表达中。然而,指代增加了自然语言处理的难度。指代消解是指明确代词与先行词的指代关系的任务。指代消解对信息抽取、对话系统、机器翻译以及机器阅读理解等自然语言处理的应用场景都有极为重要的支撑作用。例如,指代消解用于对话系统中,可以将代词替换为所对应的先行词,从而提高对话意图识别与要素抽取的准确性。指代消解一般来说包括两种:显性代词消解和零代词消解。显性代词消解是指在表达中确定显式代词指向哪个名词短语。零代词消解是针对零指代现象的一类特殊的消解,零代词消解根据上下文关系推断出省略部分,即零代词,指代前文哪个语言学单位。本申请文件所述指代消解均指显性代词消解。传统的指代消解技术是根据句法分析、词性标注和实体抽取,并结合人工规则集,对代词进行消解,这种方法费时费力,不具有泛化能力。近年来,随着人工智能和深度学习技术的不断突破,很多自然语言处理任务逐渐采用深度学习架构来处理。与传统技术不同的是,深度学习方法是使用神经网络架构,通过大量语料进行训练,学习到词与词之间的语义相关程度,根据相关程度对代词进行消解。
技术实现思路
本申请实施例提供了指代消解的方法及装置,可以解决相关技术中指代消解的准确度不够的问题。第一方面,本申请实施例提供了一种指代消解的方法,该方法包括:获取需要进行指代消解的目标文本后,获取所述目标文本的词义特征,获取所述目标文本的词性特征,位置特征和知识特征中的至少一个;再将获取到的不同种类的特征组成输入矩阵后输入神经网络模型,得到指代消解结果。第一方面的实施例中,输入神经网络模型的信息,除了词义特征外,还增加了词性特征,位置特征和知识特征中的至少一个,增加了神经网络模型输入数据的信息种类,从而提高了指代消解结果的准确度。在第一方面的一种可能的实现方式中,所述词义特征包括所述目标文本对应的词向量矩阵。在第一方面的一种可能的实现方式中,所述获取所述目标文本的词义特征,包括:将每个分词转换成词向量,所述目标文本包括若干个所述分词;将各个所述分词对应的词向量拼接成词向量矩阵。在第一方面的一种可能的实现方式中,获取所述目标文本的词性特征,包括:获取每个分词对应的词性信息,所述目标文本包括若干个所述分词;将每个所述分词对应的所述词性信息,映射成词性特征。在第一方面的一种可能的实现方式中,获取所述目标文本的位置特征,包括:获取每个分词对应的位置信息,所述目标文本包括若干个所述分词;将每个所述分词对应的所述位置信息,映射成位置特征。在第一方面的一种可能的实现方式中,获取所述目标文本的知识特征,包括:获取每个分词对应的知识信息,所述目标文本包括若干个所述分词;将每个所述分词对应的所述知识信息,映射成知识特征。在第一方面的一种可能的实现方式中,所述神经网络模型包括特征抽取器和分类子网络。所述特征抽取器用于提取所述输入矩阵的特征,获得特征矩阵,所述特征矩阵包括各个所述分词对应的特征向量。所述分类子网络用于基于所述特征矩阵获得指代消解结果。作为第一方面的第一个示例,所述分类子网络包括拼接层,全连接神经网络和输出层。所述拼接层用于将每个其余分词对应的特征向量,与代词对应的特征向量进行拼接,获得匹配向量;所述其余分词为所述目标文本包括的若干个分词中,除所述代词外的分词。所述全连接神经网络用于对每个所述匹配向量进行打分。所述输出层输出打分最高的匹配向量对应的指代关系,作为指代消解结果。作为第一方面的第二个示例,所述分类子网络包括残差连接层,拼接层,全连接神经网络和输出层。所述残差连接层用于对所述输入矩阵和所述特征矩阵进行残差连接,得到编码矩阵。所述编码矩阵包括各个所述分词对应的编码向量。所述拼接层用于将每个其余分词对应的编码向量,与代词对应的编码向量进行拼接,获得匹配向量;所述其余分词为所述目标文本包括的若干个分词中,除所述代词外的分词。所述全连接神经网络用于对每个所述匹配向量进行打分。所述输出层输出打分最高的匹配向量对应的指代关系,作为指代消解结果。第二个示例相比于第一个示例,分类子网络增加了残差连接层,通过残差连接层使神经网络模型更快收敛,提高神经网络模型的训练效率。作为第一方面的第三个示例,所述分类子网络包括选择层,拼接层,全连接神经网络和输出层。所述选择层用于从所述特征矩阵中筛选出每个候选先行词对应的特征向量,和代词对应的特征向量。所述拼接层用于将每个所述候选先行词对应的特征向量,与所述代词对应的特征向量进行拼接,获得匹配向量。所述全连接神经网络用于对每个所述匹配向量进行打分。所述输出层输出打分最高的匹配向量对应的指代关系,作为指代消解结果。第三个示例相比于第一个示例,分类子网络增加了选择层,通过选择层过滤掉了明显与指代结果不相关的特征向量,保留了相关度高的特征向量。一方面,减少了计算量,提高方案整体效率;另一方面,提高了指代消解结果的准确性。作为第一方面的第四个示例,所述分类子网络包括残差连接层,选择层,拼接层,全连接神经网络和输出层。所述残差连接层用于对所述输入矩阵和所述特征矩阵进行残差连接,得到编码矩阵。所述编码矩阵包括各个所述分词对应的编码向量。所述选择层用于从所述编码矩阵中筛选出每个候选先行词对应的编码向量,和代词对应的编码向量。所述拼接层用于将每个所述候选先行词对应的编码向量,与所述代词对应的编码向量进行拼接,获得匹配向量。所述全连接神经网络用于对每个所述匹配向量进行打分。所述输出层输出打分最高的匹配向量对应的指代关系,作为指代消解结果。第二方面,本申请实施例提供了一种指代消解的装置,包括:第一获取模块,第二获取模块,组成模块和消解模块。其中,所述第一获取模块,用于获取待指代消解的目标文本;所述第二获取模块,用于获取所述目标文本的词义特征,获取所述目标文本的词性特征,位置特征和知识特征中的至少一个目标特征;所述组成模块,用于将所述词义特征和所述目标特征组成输入矩阵;所述消解模块,用于将所述输入矩阵输入神经网络模型,得到指代消解结果。在第二方面的一种可能的实现方式中,所述词义特征包括所述目标文本对应的词向量矩阵。在第二方面的一种可能的实现方式中,所述第二获取模块包括词义特征获取模块,词性特征获取模块,位置特征获取模块和知识特征获取模块。所述词义特征获取模块,用于获取所述目标文本的词义特征。在第二方面的一种可能的实现方式中,所述词义特征获取模块,具体本文档来自技高网...

【技术保护点】
1.一种指代消解的方法,其特征在于,包括:/n获取待指代消解的目标文本;/n获取所述目标文本的词义特征,获取所述目标文本的词性特征,位置特征和知识特征中的至少一个目标特征;/n将所述词义特征和所述目标特征组成输入矩阵;/n将所述输入矩阵输入神经网络模型,得到指代消解结果。/n

【技术特征摘要】
1.一种指代消解的方法,其特征在于,包括:
获取待指代消解的目标文本;
获取所述目标文本的词义特征,获取所述目标文本的词性特征,位置特征和知识特征中的至少一个目标特征;
将所述词义特征和所述目标特征组成输入矩阵;
将所述输入矩阵输入神经网络模型,得到指代消解结果。


2.如权利要求1所述的方法,其特征在于,所述词义特征包括所述目标文本对应的词向量矩阵。


3.如权利要求1或2所述的方法,其特征在于,所述获取所述目标文本的词义特征,包括:
将每个分词转换成词向量,所述目标文本包括若干个所述分词;
将各个所述分词对应的词向量拼接成词向量矩阵。


4.如权利要求1或2所述的方法,其特征在于,
获取所述目标文本的词性特征,包括:
获取每个分词对应的词性信息,所述目标文本包括若干个所述分词;以及
将每个所述分词对应的所述词性信息,映射成词性特征;
获取所述目标文本的位置特征,包括:
获取每个分词对应的位置信息,所述目标文本包括若干个所述分词;以及
将每个所述分词对应的所述位置信息,映射成位置特征;
获取所述目标文本的知识特征,包括:
获取每个分词对应的知识信息,所述目标文本包括若干个所述分词;以及
将每个所述分词对应的所述知识信息,映射成知识特征。


5.如权利要求1或2所述的方法,其特征在于,所述神经网络模型包括特征抽取器和分类子网络;
所述特征抽取器用于提取所述输入矩阵的特征,获得特征矩阵,所述特征矩阵包括各个所述分词对应的特征向量;
所述分类子网络用于基于所述特征矩阵获得指代消解结果。


6.如权利要求5所述的方法,其特征在于,所述分类子网络包括拼接层,全连接神经网络和输出层;
所述拼接层用于将每个其余分词对应的特征向量,与代词对应的特征向量进行拼接,获得匹配向量;所述其余分词为所述目标文本包括的若干个分词中,除所述代词外的分词;
所述全连接神经网络用于对每个所述匹配向量进行打分;
所述输出层输出打分最高的匹配向量对应的指代关系,作为指代消解结果。


7.如权利要求5所述的方法,其特征在于,所述分类子网络包括选择层,拼接层,全连接神经网络和输出层;
所述选择层用于从所述特征矩阵中筛选出每个候选先行词对应的特征向量,和代词对应的特征向量;
所述拼接层用于将每个所述候选先行词对应的特征向量,与所述代词对应的特征向量进行拼接,获得匹配向量;
所述全连接神经网络用于对每个所述匹配向量进行打分;
所述输出层输出打分最高的匹配向量对应的指代关系,作为指代消解结果。


8.如权利要求6或7所述的方法,其特征在于,所述分类子网络还包括残差连接层;
所述残差连接层用于对所述输入矩阵和所述特征矩阵进行残差连接,得到编码矩阵。


9.一种指代消解的装置,其特征在于,包括:
第一获取模块,用于获取待指代消解的目标文本;
第二获取模块,用于获取所述目标文本的词义特征,获取所述目标文本的词性特征,位置特征和知识特征中的至少一个目标特征;
组成模块,用于将所述词义特征和所述目标特征组成输入矩阵;
消解模块,用于将所述输入矩阵输入神经网络模型,得到指代消解结果。


10.如权利...

【专利技术属性】
技术研发人员:刘通祝官文孟函可
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1