句子交互方法和装置制造方法及图纸

技术编号:19098573 阅读:41 留言:0更新日期:2018-10-03 02:39
本发明专利技术公开一种句子交互方法和装置,该方法包括:向量化步骤,将要进行交互的句子向量化;处理步骤,使用双向长短期记忆网络对向量化后的句子进行处理,得到包含上下文信息的句子表示;交互步骤,在注意力机制中使用多个不同的可学习变量对句子表示进行交互,得到多个具有不同视角的交互结果;拼接步骤,对交互结果进行拼接,得到句子的具有相互感知的全视角表示;其中,使用线性分类器对可学习变量进行分类,使得各个可学习变量互不相同。

【技术实现步骤摘要】
句子交互方法和装置
本专利技术涉及自然语言处理领域,具体地说,涉及一种句子交互方法和装置。
技术介绍
句子交互是自然语言处理任务中一项基本的需求,其在像机器阅读理解,文本蕴涵,答案选取,语义相似度计算等任务中有着极为重要的作用。句子交互的目的是为了获取句子间的语义异同信息,进行信息融合,得到多个句子的统一表示,方便后续的处理。如何更好地进行句子间的交互,一直是现有技术的研究热点,像文本蕴涵,答案选取,句子相似度计算等基于句子交互的特定任务的相关技术层出不穷。现有的句子交互方法大概可以分为两类,单次交互和多次交互。句子间单次交互方式顾名思义两个句子只交互一次,这类交互由于其实现起来简单有效因此最为常见。现有技术中,在自然语言推理任务中通过在交互前通过特别设计的编码层将句子表示投射到特定的空间后,再在此空间进行一次交互,最后再对交互得到的表示进行深层次的特征提取来分类。基多次交互的方法的特点是通过多次应用设计得较为简单的单次交互,来达到语义的更高级别抽象或关注角度的多样性的目的。现有技术中,通过句子矩阵max_pooling和avg_pooling等四种降维操作,得到句子的四种向量表示,本文档来自技高网...

【技术保护点】
1.一种句子交互方法,其特征在于,包括:向量化步骤,将要进行交互的句子向量化;处理步骤,使用双向长短期记忆网络对向量化后的所述句子进行处理,得到包含上下文信息的句子表示;交互步骤,在注意力机制中使用多个不同的可学习变量对所述句子表示进行交互,得到多个具有不同视角的交互结果;拼接步骤,对所述交互结果进行拼接,得到所述句子的具有相互感知的全视角表示;其中,使用线性分类器对所述可学习变量进行分类,使得各个所述可学习变量互不相同。

【技术特征摘要】
1.一种句子交互方法,其特征在于,包括:向量化步骤,将要进行交互的句子向量化;处理步骤,使用双向长短期记忆网络对向量化后的所述句子进行处理,得到包含上下文信息的句子表示;交互步骤,在注意力机制中使用多个不同的可学习变量对所述句子表示进行交互,得到多个具有不同视角的交互结果;拼接步骤,对所述交互结果进行拼接,得到所述句子的具有相互感知的全视角表示;其中,使用线性分类器对所述可学习变量进行分类,使得各个所述可学习变量互不相同。2.根据权利要求1所述的句子交互方法,其特征在于,所述交互结果为:Pk=AkQ其中,所述句子表示分别为P∈Rn×h和Q∈Rm×h,注意力程度Ak=softmax(PWkQ),K个所述可学习变量为W1,W2,...,WK∈Rh×h。3.根据权利要求2所述的句子交互方法,其特征在于,所述全视角表示为:G=[P1;P2;...;Pk]E,E∈Rt×h,t=K×h其中,E是可学习的参数,[;]表示向量的拼接操作。4.根据权利要求1-3任一项所述的句子交互方法,其特征在于,所述线性分类器为:F(X)=XV,X∈Rh×h,V∈Rh×K其中,V是可学习参数,P(Y=k|X)表示将X分为第k类的概率,当输入的是第k个所述可学习变量Wk的时候,需要使得预测得到的第k类的概率P(Y=k|X=Wk)最大。5.一种句子交互装置,其特征在于,包括:向量化模块,用于将要进行交互的句子向量化;处理模块,用于使用双向长短期记忆网络对向量化后的所述句子进行处理,得到包含上下文信息的句子表示;交互模块,用于在注意力机制中使用多个不同的可学习变量对所述句子表示进行交互,得到多个具有不同视角的交互结果;拼接模块,用于对所述交互结果进行拼接,得到所述句子的具有相互感知的全视角表示;其中,使用线性分类器对所述可学习变量进行分类,使得各个所述可学习变量互不相同。6.根据权利要求5所述的句子交互装置,其特征在于,所述交互结果为:Pk=AkQ其中,所述句子表示分别为P∈R...

【专利技术属性】
技术研发人员:贺樑邓勇杨燕
申请(专利权)人:华东师范大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1