当前位置: 首页 > 专利查询>苏州大学专利>正文

一种问句复述识别方法、装置、设备及可读存储介质制造方法及图纸

技术编号:20681271 阅读:34 留言:0更新日期:2019-03-27 18:59
本发明专利技术公开了一种问句复述识别方法,该方法通过多个卷积神经网络对第一问句和第二问句的向量分别进行了优化处理,得到了第一问句对应的拼接向量和第二问句对应拼接向量,并将这两个拼接向量融合为交互向量,从而解决了问句的向量优化问题以及两个句子之间的低粒度交互问题,更好地捕获了影响识别结果的重要特征,提高了问句复述识别的准确性。相应地,本发明专利技术公开的一种问句复述识别装置、设备及可读存储介质,也同样具有上述技术效果。

【技术实现步骤摘要】
一种问句复述识别方法、装置、设备及可读存储介质
本专利技术涉及语言识别
,更具体地说,涉及一种问句复述识别方法、装置、设备及可读存储介质。
技术介绍
问句复述识别在自动问答、检索等领域起着重要作用。问句复述识别的定义如下:对于给定的两个自然问句,判别二者是否语义一致;若语义一致,则表明两个自然问句互为复述;否则,不互为复述。在问句复述识别任务中,给定的两句自然问句通常比较相近,在问句组成上只是少量的短语或单词的不同,甚至只是一些单词上的语序不同。现有的问句复述识别方法可以分为以下两类:第一类方法为:基于问句编码模型,将两个自然问句通过相同的网络架构进行编码映射成向量表示,然后通过两个句子向量表示之间的计算进行句子关系之间的衡量,例如孪生卷积网络(Siamese-CNN)和孪生循环神经网络(Siamese-LSTM),都是利用相同的编码网络(CNN或LSTM)将句子编码成句子向量;通过两个问句的句子向量计算得出最终结果。其中,在编码过程中,忽略了两个句子之间一些低粒度上的交互特征,而且也没有更好地捕获影响结果的重要特征,从而导致识别结果不够准确。第二类方法为:基于问句之间匹配聚合本文档来自技高网...

【技术保护点】
1.一种问句复述识别方法,其特征在于,包括:获取表示第一问句的第一向量,以及表示第二问句的第二向量;将所述第一向量和所述第二向量分别作为目标向量,执行目标向量优化步骤,以获得所述第一问句对应的拼接向量和所述第二问句对应的拼接向量;其中,所述目标向量优化步骤包括:将所述目标向量输入预设数量个卷积神经网络,得到预设数量个子向量,将任意一个子向量作为目标子向量,并通过激活函数将所述目标子向量激活为权重值,按照优化公式优化所述目标向量,得到优化向量;所述优化公式为:Y=(1‑G)×X+G×(X1+...+Xi),其中,Y表示所述优化向量,G表示所述权重值,X表示所述目标向量,X1...Xi表示除所述目...

【技术特征摘要】
1.一种问句复述识别方法,其特征在于,包括:获取表示第一问句的第一向量,以及表示第二问句的第二向量;将所述第一向量和所述第二向量分别作为目标向量,执行目标向量优化步骤,以获得所述第一问句对应的拼接向量和所述第二问句对应的拼接向量;其中,所述目标向量优化步骤包括:将所述目标向量输入预设数量个卷积神经网络,得到预设数量个子向量,将任意一个子向量作为目标子向量,并通过激活函数将所述目标子向量激活为权重值,按照优化公式优化所述目标向量,得到优化向量;所述优化公式为:Y=(1-G)×X+G×(X1+...+Xi),其中,Y表示所述优化向量,G表示所述权重值,X表示所述目标向量,X1...Xi表示除所述目标子向量之外的其他子向量;对所述优化向量分别进行最大池化操作和平均池化操作后,将所述最大池化操作得到的向量和所述平均池化操作得到的向量进行拼接,得到拼接向量;将所述第一问句对应的拼接向量和所述第二问句对应的拼接向量融合为交互向量,并利用归一化指数函数对所述交互向量进行处理,当输出的第一目标值不大于输出的第二目标值时,确定所述第一问句和所述第二问句互为复述。2.根据权利要求1所述的问句复述识别方法,其特征在于,所述获取表示第一问句的第一向量,以及表示第二问句的第二向量,包括:获取所述第一问句和所述第二问句,并对所述第一问句和所述第二问句分别进行词干还原;计算所述第一问句的字符串和所述第二问句的字符串的编辑距离,并判断所述编辑距离是否为0;若否,则对所述第一问句和所述第二问句分别进行向量化,得到所述第一向量和所述第二向量。3.根据权利要求2所述的问句复述识别方法,其特征在于,所述对所述第一问句和所述第二问句分别进行向量化,包括:将所述第一问句和所述第二问句分别作为目标问句,执行下述步骤进行向量化:通过Glove词向量、位置向量和特征向量分别表示所述目标问句,得到用所述Glove词向量、所述位置向量和所述特征向量分别表示的三个表示向量,将所述三个表示向量进行拼接,得到中间向量;通过高速网络对所述中间向量进行融合,得到所述目标问句的融合向量;其中,所述特征向量为问句的二元特征表示,以单词是否均出现在所述第一问句和所述第二问句中为特征进行表示。4.根据权利要求3所述的问句复述识别方法,其特征在于,所述通过高速网络对所述中间向量进行融合,得到所述目标问句的融合向量,包括:采用第一融合公式计算所述中间向量对应的第一子中间向量;采用第二融合公式计算所述中间向量对应的第二子中间向量;基于所述第一子中间向量、所述第二子中间向量以及调整公式对所述中间向量进行融合,得到所述目标问句的融合向量;其中,所述第一融合公式为Q=Sigmoid(W1×S+b1),Q表示所述第一子中间向量,Sigmoid为激活函...

【专利技术属性】
技术研发人员:陈鑫洪宇
申请(专利权)人:苏州大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1