当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于连词标记和强化学习的自然语言推理方法技术

技术编号:19277555 阅读:69 留言:0更新日期:2018-10-30 18:04
本发明专利技术提供了一种基于连词标记和强化学习的自然语言推理方法,包括以下步骤:(1)在连词预测任务上训练一个连词预测模型;(2)在自然语言推理模型中,输入前提和猜想文本并使用编码器对其编码,得到表达矩阵;(3)将连词预测模型的编码器嵌入到自然语言推理模型中,将步骤(2)编码过程中得到的前提和猜想的词向量送入预训练好的编码器并输出表达向量;(4)将自然语言推理模型的编码器和嵌入的连词预测模型中的编码器在注意力机制中交互,得到一个注意力向量;(5)将注意力向量转化为概率分布并输出结果。利用本发明专利技术,通过迁移其他监督学习任务所学到的知识,大大提升了在大规模数据集上进行自然语言推理任务的准确率。

A natural language inference method based on conjunctions and reinforcement learning

The invention provides a natural language reasoning method based on conjunction marker and reinforcement learning, which comprises the following steps: (1) training a conjunction prediction model on conjunction prediction task; (2) input premise and conjecture text in the natural language reasoning model and encode it with encoder to obtain expression matrix; (3) generating conjunction. The encoder of the prediction model is embedded in the natural language inference model, and the steps are as follows: (2) putting the preconditions and guessed word vectors into the pre-trained encoder and outputting the expression vectors; (4) interacting the encoder of the natural language inference model with the encoder in the embedded conjunction prediction model in the attention mechanism. Get a attention vector; (5) transform the attention vector into probability distribution and output the result. By transferring the knowledge acquired by other supervised learning tasks, the invention greatly improves the accuracy of natural language reasoning tasks on large-scale data sets.

【技术实现步骤摘要】
一种基于连词标记和强化学习的自然语言推理方法
本专利技术涉及自然语言处理领域,具体涉及一种基于连词标记和强化学习的自然语言推理方法。
技术介绍
一直以来,自然语言推理问题都是自然语言处理中最为热门和棘手的问题之一。在目前最热门的任务中,都是给定两个句子(前提句,猜想句),我们需要去判断这两个句子的逻辑关系是蕴涵、中立或矛盾。一个高效的自然语言推理模型可以在以语义理解为基础的众多领域得到广泛应用,如对话机器人,问答系统和文本生成系统等。早期的自然语言推理任务都是基于小数据集的,所用的方法也都是传统的方法如自然逻辑法和阴影法等。这样的数据集无法支持拥有大规模参数的复杂模型。最近,斯坦福公布了一个大规模的高质量自然语言推理数据集,这激起了学术界和工业界很多优秀方法的涌现。比如2018年发表在国际顶级机器学习理论会议InternationalConferenceonLearningRepresentations上的《NaturalLanguageInferenceOverInteractionSpace》在第4页到第6页公布了一种称为DIIN的注意力机制交互算法;2017年发表在国际顶级人工本文档来自技高网...

【技术保护点】
1.一种基于连词标记和强化学习的自然语言推理方法,其特征在于,包括以下步骤:(1)在连词预测任务上训练一个连词预测模型;(2)在自然语言推理模型中,输入前提句和猜想句并使用一个编码器对其编码,得到表达矩阵;(3)将连词预测模型的编码器嵌入到自然语言推理模型中,将步骤(2)过程中的前提句和猜想句送进嵌入的编码器并输出表达向量;(4)将自然语言推理模型的编码器结果和嵌入的连词预测模型中的编码器结果在注意力机制中交互,得到一个注意力向量;(5)将注意力向量转化为概率分布并输出结果。

【技术特征摘要】
1.一种基于连词标记和强化学习的自然语言推理方法,其特征在于,包括以下步骤:(1)在连词预测任务上训练一个连词预测模型;(2)在自然语言推理模型中,输入前提句和猜想句并使用一个编码器对其编码,得到表达矩阵;(3)将连词预测模型的编码器嵌入到自然语言推理模型中,将步骤(2)过程中的前提句和猜想句送进嵌入的编码器并输出表达向量;(4)将自然语言推理模型的编码器结果和嵌入的连词预测模型中的编码器结果在注意力机制中交互,得到一个注意力向量;(5)将注意力向量转化为概率分布并输出结果。2.根据权利要求1所述的基于连词标记和强化学习的自然语言推理方法,其特征在于,步骤(1)的具体步骤为:(1-1)对BookCorpus数据集进行预处理,得到连词预测任务的训练集;(1-2)从训练集中选择样本,用词向量Glove来对句子做词嵌入,之后送入一个编码器中,得到每个句子的最终表达向量;(1-3)用一个线性运算来将两个句子的表答向量整合;(1-4)将整合后的向量通过线性变换投射到连词的种类的向量上并用softmax函数计算出每个连词的概率分布,通过最大化真实连词标签的概率分布来优化整个模型。3.根据权利要求1所述的基于连词标记和强化学习的自然语言推理方法,其特征在于,步骤(2)中,所述编码的具体步骤为:(2-1)使用词向量Glove对输入的前提句和猜想句进行词向量嵌入;(2-2)用卷积神经网络进行字母的字符嵌入以处理特殊单词;(2-3)使用词性标注和实体命名识...

【专利技术属性】
技术研发人员:潘博远蔡登赵洲何晓飞
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1