一种融合语义解析的自然语言推断方法和装置制造方法及图纸

技术编号:33274375 阅读:52 留言:0更新日期:2022-04-30 23:32
本发明专利技术提出了一种融合语义解析的自然语言推断方法和装置,该方法包括如下步骤:获取前提T及其对应假设Q;分别对所述前提T和假设Q进行语义解析,获得多个特征;对所述多个特征进行统一化和特征融合,获得融合特征input_i;将所述融合特征input_i输入JudgeNLIModel模型中,输出对应假设的答案。本发明专利技术结合自然语言理解,抽取前提和假设中的特定特征,从而帮助推断前提和假设之间的关系,提高了自然语言推断的正确率,也为之后的自然语言推断方法提供了改进的参考方向。供了改进的参考方向。供了改进的参考方向。

【技术实现步骤摘要】
一种融合语义解析的自然语言推断方法和装置


[0001]本专利技术涉及语言识别
,具体而言,涉及一种融合语义解析的自然语言推断方法和装置。

技术介绍

[0002]自然语言推断(Natural Language Inference,NLI)也被称为文本蕴含识别,是自然语言处理中最重要的问题之一,它需要推断两个给定句子之间的逻辑关系。该任务给出了两个句子,分别称为前提和假设,目标是确定它们之间的逻辑关系是必要的、中立的或矛盾的。
[0003]传统的自然语言推断方法包含文本相似度,文本对齐,逻辑演算,文本转换。文本相似度是计算前提和假设之间的相似度来判断其之间是否构成蕴含关系;文本对齐是把前提和假设相似的部分进行对齐,再使用逻辑回归进行蕴含分析,做冲突检测;逻辑演算是将文本表示成数学逻辑表达式,构成事实集合,然后逻辑推理规则判断是否能根据前提推理出假设;文本转换是将前提和假设都改写成句法树,然后利用背景知识设计推理规则,对前提进行改写,如果前提能够改写成假设的句法树形式则认为存在蕴含关系。
[0004]但是,上述方法严重依赖转换规本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种融合语义解析的自然语言推断方法,其特征在于,包括如下步骤:获取前提T及其对应假设Q;分别对所述前提T和假设Q进行语义解析,获得多个特征;对所述多个特征进行统一化和特征融合,获得融合特征input_i;将所述融合特征input_i输入JudgeNLIModel模型中,输出对应假设的答案。2.根据权利要求1所述的融合语义解析的自然语言推断方法,其特征在于,分别对所述前提T和假设Q进行语义解析,具体为:利用正则表达式规则分别对前提T和假设Q中的字符和单位进行识别,获得多个特征。3.根据权利要求1所述的融合语义解析的自然语言推断方法,其特征在于,对所述多个特征进行特征融合,获得融合特征input_i,具体为:设前提T进行语义解析获得多个特征t1、t2

tn,假设Q进行语义解析获得多个特征q1、q2

qn,进行序列化表示后,融合特征input_i为[CLS] T [SEP] [nlu_t] t1 [SEP] [nlu_t] t2 [SEP]

[nlu_t] tn [SEP] Q [SEP] [nlu_q] q1 [SEP] [nlu_q] q2 [SEP]

[nlu_q] qn [SEP],其中,每个特征均包括起始值num_begin、起始值闭合情况num_begin_interval、结束值num_end、结束值闭合情况num_end_interval、单位特征unit,缺少的内容,用None代替。4.根据权利要求1所述的融合语义解析的自然语言推断方法,其特征在于,所述统一化为将前提T和假设Q中的单位进行统一。5.根据权利要求1所述的融合语义解析的自然语言推断方法,其特征在于,所述JudgeNLIModel模型的构建包括如下步骤:解析文档,采集获得多对前提T和假设Q,生成数据集D;按照预设比例,将所述数据集D划分为训练集、测试集和验证集;分别提取所述训练集、测试集和验证集中前提T和假设Q的特征,获得训练集特征、测试集特征和验证集特征;将所述训练集特征进行统一化和特征融合后,输入初始模型中进行训练;设置初始模型的epoch轮次,每间隔epoch轮次输出一次模型,并保存为JudgeNLIModels模型...

【专利技术属性】
技术研发人员:杜振东
申请(专利权)人:南京云问网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1