The invention provides a system including structured attention mechanism answer selection system and method based on processing module, processing module based on tree LSTM for processing the input sentence, the sentence semantic representation; the first computing module, calculation module for the sentence according to the semantic representation, calculation of attention weights between the question and answer; second calculation module, second calculation module is used to calculate the final weights according to the attention that the answer. The invention can better solve the problem of answer selection, and achieves good effect on the WikiQA data set.
【技术实现步骤摘要】
本专利技术涉及计算机程序基于组件对象的软件工程
,特别涉及一种基于结构化注意力机制的答案选择系统及方法。
技术介绍
答案选择(Answerselection)是问答系统中非常重要的一个子问题。在过去几年中,answerselection被广泛关注。其中,用深度学习的解决answerselection工作取得了很好的效果。其中端到端的注意力机制,在该问题上取得了最好的结果。端到端的attention计算了答案和问题之间的词语权重。然而,端到端的注意力机制,把整个语句看作一个有序的字符串,依次处理来生成句子的表示,这种表示方式没有考虑到句子之间的句法信息,以及句子之间的更复杂的联系。
技术实现思路
本专利技术旨在至少解决上述技术问题之一。为此,本专利技术的一个目的在于提出一种基于结构化注意力机制的答案选择系统,该系统能够更好地解决答案选择问题,在WikiQA数据集上取得了很好的效果。本专利技术的第二个目的在于提出一种基于结构化注意力机制的答案选择方法。为了实现上述目的,本专利技术第一方面的实施例提出了一种基于结构化注意力机制的答案选择系统,包括:处理模块,所述处理模块用于根据treeLSTM处理输入的句子,以生成所述句子的语义表示;第一计算模块,所述第一计算模块用于根据所述句子的语义表示,计算问题和答案之间的注意力权重;第二计算模块,所述第二计算模块用于根据所述注意力权重计算出所述答案的最终表示。另外,根据本专利技术上述实施例的基于结构化注意力机制的答案选择系统还可以具有如下附加的技术特征:在一些示例中,所述treeLSTM的计算过程如下式:在一些示例中, ...
【技术保护点】
一种基于结构化注意力机制的答案选择系统,其特征在于,包括:处理模块,所述处理模块用于根据tree LSTM处理输入的句子,以生成所述句子的语义表示;第一计算模块,所述第一计算模块用于根据所述句子的语义表示,计算问题和答案之间的注意力权重;第二计算模块,所述第二计算模块用于根据所述注意力权重计算出所述答案的最终表示。
【技术特征摘要】
1.一种基于结构化注意力机制的答案选择系统,其特征在于,包括:处理模块,所述处理模块用于根据treeLSTM处理输入的句子,以生成所述句子的语义表示;第一计算模块,所述第一计算模块用于根据所述句子的语义表示,计算问题和答案之间的注意力权重;第二计算模块,所述第二计算模块用于根据所述注意力权重计算出所述答案的最终表示。2.根据权利要求1所述的基于结构化注意力机制的答案选择系统,其特征在于,所述treeLSTM的计算过程如下式:fjt=σ(W(f)xj+U(f)hk+b(f)),hj=oj⊙tanh(cj)。3.根据权利要求1所述的基于结构化注意力机制的答案选择系统,其特征在于,所述第二计算模块用于:利用averagepooling计算出问题的表示Oq:其中,Oq,i表示Oq的第i个元素,hqt,i表示,hqt的第i个元素;在得到问题的表示之后,根据注意力机制计算答案的最终表示如下:Maq(t)=Wamha(r)+WqmOq,4.根据权利要求3所述的基于结构化注意力机制的答案选择系统,其特征在于,所述第二计算模块还用于:根据余弦相似度计算Oq和Oa之间的得分:S(Oq,Oa)=Oq.Oa。5.根据权利要求4所述的基于结构化注意力机制的答案选择系统,其特征在于,所述第二计算模块还用于:将hingeloss作为神经网络的目标函数,定义如下:其中,N表示所有负例答案的集合,M表示边界,s表示计算得分的函数,...
【专利技术属性】
技术研发人员:徐华,贺星伟,邓俊辉,孙晓民,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。