多模型联合学习的问题匹配方法及系统技术方案

技术编号：25637186 阅读：16 留言：0更新日期：2020-09-15 21:29

本发明专利技术实施例提供一种多模型联合学习的问题匹配方法。该方法包括：建立基于编码的第一模型；建立基于交互的第二模型；建立第三模型，所述第三模型包括编码器、交互层、融合单元和分类器，其中，所述第三模型的编码器、交互层和分类器与所述第二模型的编码器、交互层和分类器相同且共享参数，所述融合单元对分别来自所述编码器和所述交互层的输出进行融合，融合时以所述交互层的输出为主，以所述编码器的输出为辅；对所述第一模型、所述第二模型、所述第三模型进行联合学习；利用学习后的所述第三模型对问题对进行匹配度预测。本发明专利技术实施例还提供一种多模型联合学习的问题匹配系统。本发明专利技术实施例提高预测准确度的同时，保持预测速度。

全部详细技术资料下载

【技术实现步骤摘要】
多模型联合学习的问题匹配方法及系统
本专利技术涉及问题匹配领域，尤其涉及一种多模型联合学习的问题匹配方法及系统。
技术介绍
问题匹配是基于检索的问答系统中的一项基本任务，也被称为语义匹配任务或释义识别任务，该任务的目的是从现有数据库中搜索意图与输入问题相似的问题。一般的，给定一对句子，要求问题匹配模型判断两个句子是否表达相同的含义，输出匹配或不匹配的概率。例如，输入问句一：“怎么样才可以提高信用额度呀”和问句二：“信用额度要怎样才可以增加”，问题匹配模型需要判断两个问题是否具有相同的含义，如果有相同的含义，则可以给两个问题回复相同的答案。因此，在基于检索的问答系统中，如果在问答库中存在和用户问题相匹配的问题时，就可以返回该问题答案来回答用户问题。根据是否使用交叉句子特征，一般可以将问题匹配模型分为两类：(1)基于编码的模型，它直接通过编码获得的句子向量计算句子对的相似度。这种类型的模型通常比较简单，而且容易将其推广到其它自然语言处理任务中。(2)基于交互的模型，该类模型在句子编码向量的基础上，考虑了单词对齐和句子对之间的交互。相比于基于编码的模型，基于交互的模型通常表现出更好的准确度。但是，为了获得更好的性能，基于交互的模型通常包含多个对齐层以维持其中间状态来逐渐完善其预测准确度，但是这些较深的模型结构通常更难训练，而且预测速度较慢，难以在真实场景中应用。在实现本专利技术过程中，专利技术人发现相关技术中至少存在如下问题：当前准确的较高的模型通常是基于交互的模型，其通常包含多个对齐层，模型较为复杂，预测...

【技术保护点】
1.一种多模型联合学习的问题匹配方法，包括：/n建立基于编码的第一模型，所述第一模型包括编码器和分类器；/n建立基于交互的第二模型，所述第二模型包括编码器、交互层和分类器，其中所述交互层使用单层的多头注意力机制对句子对进行交互，所述第二模型的编码器和分类器与所述第一模型的编码器和分类器相同且共享参数；/n建立第三模型，所述第三模型包括编码器、交互层、融合单元和分类器，其中，所述第三模型的编码器、交互层和分类器与所述第二模型的编码器、交互层和分类器相同且共享参数，所述融合单元对分别来自所述编码器和所述交互层的输出进行融合，融合时以所述交互层的输出为主，以所述编码器的输出为辅；/n对所述第一模型、所述第二模型、所述第三模型进行联合学习；/n利用学习后的所述第三模型对问题对进行匹配度预测。/n

【技术特征摘要】
1.一种多模型联合学习的问题匹配方法，包括：
建立基于编码的第一模型，所述第一模型包括编码器和分类器；
建立基于交互的第二模型，所述第二模型包括编码器、交互层和分类器，其中所述交互层使用单层的多头注意力机制对句子对进行交互，所述第二模型的编码器和分类器与所述第一模型的编码器和分类器相同且共享参数；
建立第三模型，所述第三模型包括编码器、交互层、融合单元和分类器，其中，所述第三模型的编码器、交互层和分类器与所述第二模型的编码器、交互层和分类器相同且共享参数，所述融合单元对分别来自所述编码器和所述交互层的输出进行融合，融合时以所述交互层的输出为主，以所述编码器的输出为辅；
对所述第一模型、所述第二模型、所述第三模型进行联合学习；
利用学习后的所述第三模型对问题对进行匹配度预测。

2.根据权利要求1所述的方法，其中，所述利用学习后的所述第三模型对问题对进行匹配度预测包括：
通过所述编码器确定所述问题对中问题语句的编码向量；
将所述问题对中问题语句的编码向量输入至所述交互层，确定所述问题对中问题语句的交互向量；
基于所述融合单元对所述问题对中问题语句的第一权重的编码向量以及第二权重的交互向量进行融合，生成所述问题对中问题语句的融合向量，其中，第二权重大于第一权重；
将所述问题对中问题语句的融合向量输入至所述分类器，确定所述问题对中问题语句的匹配度。

3.根据权利要求2所述的方法，其中，所述问题对包括第一问题语句和第二问题语句，其中，所述第一问题语句来自用户的输入，所述第二问题语句来自问答系统的问答题库；
当所述匹配度达到预设阈值时，从所述问答题库获取所述第二问题语句的回复答案，对用户输入的所述第一问题语句进行反馈。

4.根据权利要求2所述的方法，其中，在所述基于所述融合单元对所述问题对中问题语句的第一权重的编码向量以及第二权重的交互向量进行融合之前，所述方法还包括：
对所述问题对中问题语句的编码向量进行非线性变换。

5.根据权利要求1所述的方法，其中，所述编码器包括基于卷积神经网络的编码器，所述分类器包括基于两层前馈神经网络的分类器。

6.一种多模型联合学习的问题匹配系统...

【专利技术属性】
技术研发人员：吴仁守，缪庆亮，俞凯，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人