基于排序学习的深度文本匹配方法及装置制造方法及图纸

技术编号：21628972 阅读：16 留言：0更新日期：2019-07-17 11:06

本申请提供了一种基于排序学习的深度文本匹配方法及装置，具体的，首先，获取由假设语句、推理语句组成的句子对，其中，推理语句包括正推理语句和多个负推理语句，假设语句与正推理语句的语义相关、与负推理语句的语义不相关；然后，将句子对中的语句进行相应的处理后，形成语句向量，再根据各语句向量之间的匹配程度值，计算预设损失函数的损失值，并根据该损失值，调整深度匹配模型的参数；最后，利用参数调整最终得到的深度匹配模型，对输入的语句进行文本匹配。本申请将输入句子对由两个句子对扩展为句子序列，并且包含正例和负例两种类型的数据，由于扩展模型的输入数量和类型，进而使得模型的拟合速度加快，有助于提高模型的匹配精度。

Deep Text Matching Method and Device Based on Ranking Learning

全部详细技术资料下载

【技术实现步骤摘要】
基于排序学习的深度文本匹配方法及装置
本申请涉及自然语言处理
，尤其涉及一种基于排序学习的深度文本匹配方法及装置。
技术介绍
文本匹配是自然语言处理中一个重要的基础问题，自然语言处理中的许多任务都可以抽象为文本匹配任务。例如，网页搜索可抽象为网页同用户搜索Query的一个相关性匹配问题，自动问答可抽象为候选答案与问题的满足度匹配问题，文本去重可以抽象为文本与文本的相似度匹配问题。传统的文本匹配技术(例如信息检索中的向量空间模型算法)，主要解决词汇层面的匹配问题。而实际上，基于词汇重合度的匹配算法有很大的局限性，无法解决很多问题，如语言的多义同义问题、语言的组合结构问题(例如「从北京到上海高铁」和「从上海到北京高铁」)以及匹配的非对称问题(例如网页搜索任务中query端的语言表述形式和网页端往往具有很大的差别)。深度学习技术兴起后，基于神经网络训练出的WordEmbedding(词嵌入向量)来进行文本匹配计算引起了广泛的兴趣。WordEmbedding的训练方式更加简洁，而且所得的词语向量表示的语义可计算性进一步加强。但是，只利用无标注数据训练得到的WordEmbedding在匹配度计算的实用效果上和主题模型技术相差不大，它们本质上都是基于共现信息的训练。另外，WordEmbedding本身没有解决短语、句子的语义表示问题，也没有解决匹配的非对称性问题。基于上述问题，目前提出了有监督的神经网络深度匹配模型，以提升语义匹配计算的效果，例如DSSM(DeepStructuredSemanticModels，深度语义匹配模型)、CDSSM(Convoluti...

【技术保护点】
1.一种基于排序学习的深度文本匹配方法，应用于深度匹配模型，其特征在于，所述方法包括：获取由假设语句、推理语句组成的句子对，其中，所述推理语句包括正推理语句和多个负推理语句，所述假设语句与正推理语句的语义相关、与负推理语句的语义不相关；将所述句子对中的语句分别用词向量表示，得到所述句子对中各语句的词向量矩阵；利用各所述词向量矩阵所对应的相似度矩阵，生成所述句子对中的语句彼此相似性加权后的语句向量；根据各所述语句向量之间的匹配程度值，计算预设损失函数的损失值；根据所述损失值，调整所述深度匹配模型的参数；利用参数调整所最终得到的深度匹配模型，对输入的语句进行文本匹配。

【技术特征摘要】
1.一种基于排序学习的深度文本匹配方法，应用于深度匹配模型，其特征在于，所述方法包括：获取由假设语句、推理语句组成的句子对，其中，所述推理语句包括正推理语句和多个负推理语句，所述假设语句与正推理语句的语义相关、与负推理语句的语义不相关；将所述句子对中的语句分别用词向量表示，得到所述句子对中各语句的词向量矩阵；利用各所述词向量矩阵所对应的相似度矩阵，生成所述句子对中的语句彼此相似性加权后的语句向量；根据各所述语句向量之间的匹配程度值，计算预设损失函数的损失值；根据所述损失值，调整所述深度匹配模型的参数；利用参数调整所最终得到的深度匹配模型，对输入的语句进行文本匹配。2.根据权利要求1所述的方法，其特征在于，根据各所述语句向量之间匹配程度值，计算预设损失函数的损失值，包括：分别计算所述假设语句与正推理语句、以及各负推理语句所对应的语句向量之间的匹配程度值；利用Pointwise损失函数和Listwise损失函数组成的联合损失函数，计算各所述语句向量匹配程度值与标准值之间的损失值。3.根据权利要求2所述的方法，其特征在于，所述联合损失函数loss的计算公式为：loss＝Lp+Ll+L2Regularization，其中：Lp为Pointwise损失函数，Lp＝max(0,m-s(rh；rp+)+s(rh；rp-))；Ll为Listwise损失函数，rh为假设语句的语句向量表示，rp+和rp-是分别为正推理语句和负推理语句的语句向量表示，s(rh；rp+)为假设语句和正推理语所对应的语句向量的余弦相似度，s(rh；rp)为假设语句和推理语所对应的语句向量的余弦相似度，m为预设的判定正负推理语句的阈值，n为由正推理语句和负推理语句组成的样本个数。4.根据权利要求1所述的方法，其特征在于，获取由假设语句、推理语句组成的句子对，包括：选取被作为假设语句和正推理语句、且语义相关的两个正例语句；选取被作为负推理语句的、且与所述正例语句的语义不相关的多个负例语句；将两个所述正例语句以及各所述负例语句组成句子对。5.根据权利要求1所述的方法，其特征在于，将所述句子对中的语句分别用词向量表示，得到所述句子对中各语句的词向量矩阵，包括：将所述句子对中的语句分别...

【专利技术属性】
技术研发人员：李健铨，刘小康，刘子博，晋耀红，
申请(专利权)人：北京神州泰岳软件股份有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人