一种语义匹配的方法、模型的学习方法及服务器技术

技术编号:19647154 阅读:33 留言:0更新日期:2018-12-05 20:33
本申请实施例公开了一种语义匹配的方法。本申请实施例方法包括:接收待匹配的第一语句;将所述第一语句作为分词模型的输入,通过所述分词模型输出对所述第一语句进行分词后的第一词序列;将所述第一词序列转换成第一词向量序列;将所述第一词向量序列按照正向序列和反向序列输入到孪生双向长短期记忆LSTM网络,通过所述孪生双向LSTM网络输出与所述第一语句相匹配的第二语句。本申请实施例还提供了一种语义匹配服务器,用于提高语义匹配的准确率。

A Semantic Matching Method, Model Learning Method and Server

The embodiment of this application discloses a method of semantic matching. The method of the embodiment of the present application includes: receiving the first sentence to be matched; taking the first sentence as input of the word segmentation model and outputting the first word sequence after word segmentation of the first sentence through the word segmentation model; converting the first word sequence into the first word vector sequence; and according to the first word vector sequence, translating the first word vector sequence into the first word vector sequence. The forward sequence and the reverse sequence are input into the twin bidirectional long-term and short-term memory LSTM network, and the second statement matching the first statement is output through the twin bidirectional LSTM network. The embodiment of this application also provides a semantic matching server for improving the accuracy of semantic matching.

【技术实现步骤摘要】
一种语义匹配的方法、模型的学习方法及服务器
本申请涉及计算机应用领域,尤其涉及一种语义匹配的方法、模型的学习方法及服务器。
技术介绍
随着移动终端的迅猛发展,移动互联网逐渐成为互联网中一个重大的组成部分。用户对信息的获取方式也在不断的变化,例如问答系统,用户可以通过问答系统获取需要的信息。问答系统也是自然语言处理领域的重要部分。当前问答系统可以主要包括问句理解部分和答案生成部分,其中,问句理解部分主要是负责分析和理解用户提出的问题,产生一些候选查询项从而协助后续的各个模块。理解用户意图是关键,也是问答系统区别于传统信息检索引擎的核心,它需要将用户表述的自然语言形式的信息转化为机器可识别的形式,传入到系统后续的模块中进行处理。答案生成模块需要从相关文本中生成候选答案集合,然后从中提取出正确答案。答案提取是将问题与现有的候选答案进行语义上的进一步验证,从而保证返回给用户最相关的结果。当前,在自然语言处理领域引入深度学习模型,循环神经网络(RecurrentNeuralNetwork,RNN)、卷积神经网络(ConvolutionNeuralNetwork,CNN)、递归神经网络(RecursiveNeuralNetwork,RNN)等被应用到自然语言处理中的各个任务中。当前技术中,学习模型接收输入的问句的序列,处理这一时刻的输入数据时只收到当前输入词和此时刻前输入词的影响,而日常生活中人们所说的语句中存在前后关联,造成与输入的序列匹配不准确,从而输出的答句与问句的匹配度降低。
技术实现思路
本申请实施例提供了一种语义匹配的方法、模型的学习方法及服务器,用于提高语义匹配的准确率。第一方面,本申请实施例提供了一种语义匹配的方法,包括:接收待匹配的第一语句;将所述第一语句作为分词模型的输入,通过所述分词模型输出对所述第一语句进行分词后的第一词序列;将所述第一词序列转换成第一词向量序列;将所述第一词向量序列按照正向序列和反向序列输入到孪生双向长短期记忆LSTM网络,通过所述孪生双向LSTM网络输出与所述第一语句相匹配的第二语句。第二方面,本申请实施例提供了一种语义匹配模型的学习方法,包括:获取语句训练样本集,所述语句训练样本集包括多个样本语句对;将语句训练样本集输入到分词模型,通过分词模型对语句训练样本集中的每个样本语句进行分词,得到每个样本语句的词序列;将每个词序列转换成词向量序列;将每个语句对所对应的词向量序列按照正向序列和反向序列输入到孪生双向LSTM网络进行学习训练,得到语义匹配模型。第三方面,本申请实施例中提供了一种语义匹配服务器,包括:接收模块,用于接收待匹配的第一语句;分词模块,用于将所述接收模块接收的所述第一语句作为分词模型的输入,通过所述分词模型输出对所述第一语句对进行分词后的第一词序列;转换模块,用于将所述分词模块分词后的第一词序列转换成第一词向量序列;匹配模块,用于将所述转换模块转换的第一词向量序列按照正向序列和反向序列输入到孪生双向长短期记忆LSTM网络,通过所述孪生双向LSTM网络输出与所述第一语句相匹配的第二语句。第四方面,本申请实施例中提供了一种语义匹配服务器,包括:获取语句训练样本集,所述语句训练样本集包括多个样本语句对;将语句训练样本集输入到分词模型,通过分词模型对语句训练样本集中的每个样本语句进行分词,得到每个样本语句的词序列;将每个词序列转换成词向量序列;将每个语句对所对应的词向量序列按照正向序列和反向序列输入到孪生双向LSTM网络进行学习训练,得到语义匹配模型。第五方面,本申请实施例提供了一种语义匹配服务器,包括:存储器,用于存储计算机可执行程序代码;网络接口,以及处理器,与所述存储器和所述网络接口耦合;其中所述程序代码包括指令,当所述处理器执行所述指令时,所述指令使所述语义匹配服务器执行上述第一方面或第二方面所述的方法。第六方面,本申请实施例提供了一种计算机存储介质,用于储存语义匹配服务器所用的计算机软件指令,其包含用于执行上述第一方面或第二方面所述的方法。从以上技术方案可以看出,本申请实施例具有以下优点:本申请实施例中,语义匹配服务器接收待匹配的第一语句;将所述第一语句作为分词模型的输入,通过所述分词模型输出对所述第一语句进行分词后的第一词序列;将所述第一词序列转换成第一词向量序列;将所述第一词向量序列按照正向序列和反向序列输入到孪生双向长短期记忆LSTM网络,通过所述孪生双向LSTM网络输出与所述第一语句相匹配的第二语句。本申请实施例中孪生双向LSTM网络可以获取到第一语句的词向量的正向序列和反向序列的信息,也就说可以获取到前文的信息,也可以获取到后文的信息,通过双向LSTM可以提高语义匹配的准确率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,还可以根据这些附图获得其他的附图。图1为本申请实施例中孪生双向LSTM网络的框架示意图;图2为本申请实施例中一种语义匹配的系统的架构示意图;图3为本申请实施例中语义匹配模型构建的步骤流程示意图;图4为本申请实施例中语义匹配模型的框架示意图;图5为本申请实施例中双向LSTM模型的结构示意图;图6为本申请实施例中一种语义匹配的方法的一个实施例的步骤流程示意图;图7为本申请实施例中本终端显示第一语句与第二语句的场景示意图;图8为本申请实施例中本终端显示第一语句与第二语句的场景示意图;图9为本申请实施例中一种匹配服务器的一个实施例的结构示意图;图10为本申请实施例中一种匹配服务器的另一个实施例的结构示意图;图11为本申请实施例中一种匹配服务器的另一个实施例的结构示意图;图12为本申请实施例中一种匹配服务器的另一个实施例的结构示意图;图13为本申请实施例中一种匹配服务器的另一个实施例的结构示意图。具体实施方式本申请实施例提供了一种语义匹配的方法、模型的学习方法及服务器,用于提高语义匹配的准确率。为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请保护的范围。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。为了方便理解本申请,下面对本申请实施例中涉及的词语进行说明。孪生双向长短期记忆(LongShort-TermMemory,LSTM)网络:请结合图1进行理解,图1为孪生双向LSTM网络的框架示意图。孪生双向LSTM网络包含至本文档来自技高网
...

【技术保护点】
1.一种语义匹配的方法,其特征在于,包括:接收待匹配的第一语句;将所述第一语句作为分词模型的输入,通过所述分词模型输出对所述第一语句进行分词后的第一词序列;将所述第一词序列转换成第一词向量序列;将所述第一词向量序列按照正向序列和反向序列输入到孪生双向长短期记忆LSTM网络,通过所述孪生双向LSTM网络输出与所述第一语句相匹配的第二语句。

【技术特征摘要】
1.一种语义匹配的方法,其特征在于,包括:接收待匹配的第一语句;将所述第一语句作为分词模型的输入,通过所述分词模型输出对所述第一语句进行分词后的第一词序列;将所述第一词序列转换成第一词向量序列;将所述第一词向量序列按照正向序列和反向序列输入到孪生双向长短期记忆LSTM网络,通过所述孪生双向LSTM网络输出与所述第一语句相匹配的第二语句。2.根据权利要求1所述的方法,其特征在于,所述分词模型为隐马尔可夫模型HMM和条件随机场模型CRF,所述将所述第一语句作为分词模型的输入,通过所述分词模型输出对所述第一语句进行分词后的第一词序列,包括:将所述第一语句输入到HMM模型,通过所述HMM模型输出所述第一语句分词后的词序列;将所述第一语句分词后的词序列输入到CRF模型,通过所述CRF模型输出校准后的第一词序列。3.根据权利要求1所述的方法,其特征在于,所述将所述第一词向量序列输入到孪生双向长短期记忆LSTM网络,通过所述孪生双向LSTM网络输出与所述第一语句相匹配的第二语句,包括:将所述第一词向量序列输入到孪生双向LSTM网络,通过所述孪生双向LSTM网络确定第一语句与目标语句集中每个目标语句的余弦距离;根据余弦距离和对比损失函数确定所述目标语句集中与第一语句相匹配的第二语句。4.根据权利要求3所述的方法,其特征在于,所述将所述第一词向量序列输入到孪生双向LSTM网络,通过所述孪生双向LSTM网络确定第一语句与目标语句集中每个目标语句的余弦距离,包括:通过注意力机制对所述第一词向量序列中当前时刻输出的目标词向量计算注意力概率,所述注意力概率用于指示所述目标词向量在第一语句中语义的重要程度;根据注意力概率大于门限的词向量的语义确定所述第一语句与第二语句之间的余弦距离。5.一种语义匹配模型的学习方法,其特征在于,包括:获取语句训练样本集,所述语句训练样本集包括多个样本语句对;将语句训练样本集输入到分词模型,通过分词模型对语句训练样本集中的每个样本语句进行分词,得到每个样本语句的词序列;将每个词序列转换成词向量序列;将每个语句对所对应的词向量序列按照正向序列和反向序列输入到孪生双向LSTM网络进行学习训练,得到语义匹配模型。6.根据权利要求5所述的语义匹配模型的学习方法,其特征在于,所述将每个语句对所对应的词向量序列按照正向序列和反向序列输入到孪生双向LSTM网络进行学习训练,得到语义匹配模型,包括:将每个样本语句对所对应的词向量序列按照正向序列和反向序列输入到孪生双向LSTM网络;计算每个样本语句对的余弦距离;根据每个样本语句对的余弦距离及对比损失函数迭代训练所述孪生双向LSTM网络,得到所述语义匹配模型。7.根据权利要求5所述的语义匹配模型的学习方法,其特征在于,所述通过分词模型对语句训练样本集中的每个样本语句进行分词,得到每个样本语句的词序列之前,所述方法还包括:采用word2vec机制训练词向量,得到词向量的查询表,所述查询表包括所述语句对应的语言中每一个词映射成的固定长度的表示向量。8.根据权利要求7所述的语义匹配模型的学习方法...

【专利技术属性】
技术研发人员:晁阳
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1