The embodiment of this application discloses a method of semantic matching. The method of the embodiment of the present application includes: receiving the first sentence to be matched; taking the first sentence as input of the word segmentation model and outputting the first word sequence after word segmentation of the first sentence through the word segmentation model; converting the first word sequence into the first word vector sequence; and according to the first word vector sequence, translating the first word vector sequence into the first word vector sequence. The forward sequence and the reverse sequence are input into the twin bidirectional long-term and short-term memory LSTM network, and the second statement matching the first statement is output through the twin bidirectional LSTM network. The embodiment of this application also provides a semantic matching server for improving the accuracy of semantic matching.
【技术实现步骤摘要】
一种语义匹配的方法、模型的学习方法及服务器
本申请涉及计算机应用领域,尤其涉及一种语义匹配的方法、模型的学习方法及服务器。
技术介绍
随着移动终端的迅猛发展,移动互联网逐渐成为互联网中一个重大的组成部分。用户对信息的获取方式也在不断的变化,例如问答系统,用户可以通过问答系统获取需要的信息。问答系统也是自然语言处理领域的重要部分。当前问答系统可以主要包括问句理解部分和答案生成部分,其中,问句理解部分主要是负责分析和理解用户提出的问题,产生一些候选查询项从而协助后续的各个模块。理解用户意图是关键,也是问答系统区别于传统信息检索引擎的核心,它需要将用户表述的自然语言形式的信息转化为机器可识别的形式,传入到系统后续的模块中进行处理。答案生成模块需要从相关文本中生成候选答案集合,然后从中提取出正确答案。答案提取是将问题与现有的候选答案进行语义上的进一步验证,从而保证返回给用户最相关的结果。当前,在自然语言处理领域引入深度学习模型,循环神经网络(RecurrentNeuralNetwork,RNN)、卷积神经网络(ConvolutionNeuralNetwork,CNN)、递归神经网络(RecursiveNeuralNetwork,RNN)等被应用到自然语言处理中的各个任务中。当前技术中,学习模型接收输入的问句的序列,处理这一时刻的输入数据时只收到当前输入词和此时刻前输入词的影响,而日常生活中人们所说的语句中存在前后关联,造成与输入的序列匹配不准确,从而输出的答句与问句的匹配度降低。
技术实现思路
本申请实施例提供了一种语义匹配的方法、模型的学习方法及服务器,用于提高语义 ...
【技术保护点】
1.一种语义匹配的方法,其特征在于,包括:接收待匹配的第一语句;将所述第一语句作为分词模型的输入,通过所述分词模型输出对所述第一语句进行分词后的第一词序列;将所述第一词序列转换成第一词向量序列;将所述第一词向量序列按照正向序列和反向序列输入到孪生双向长短期记忆LSTM网络,通过所述孪生双向LSTM网络输出与所述第一语句相匹配的第二语句。
【技术特征摘要】
1.一种语义匹配的方法,其特征在于,包括:接收待匹配的第一语句;将所述第一语句作为分词模型的输入,通过所述分词模型输出对所述第一语句进行分词后的第一词序列;将所述第一词序列转换成第一词向量序列;将所述第一词向量序列按照正向序列和反向序列输入到孪生双向长短期记忆LSTM网络,通过所述孪生双向LSTM网络输出与所述第一语句相匹配的第二语句。2.根据权利要求1所述的方法,其特征在于,所述分词模型为隐马尔可夫模型HMM和条件随机场模型CRF,所述将所述第一语句作为分词模型的输入,通过所述分词模型输出对所述第一语句进行分词后的第一词序列,包括:将所述第一语句输入到HMM模型,通过所述HMM模型输出所述第一语句分词后的词序列;将所述第一语句分词后的词序列输入到CRF模型,通过所述CRF模型输出校准后的第一词序列。3.根据权利要求1所述的方法,其特征在于,所述将所述第一词向量序列输入到孪生双向长短期记忆LSTM网络,通过所述孪生双向LSTM网络输出与所述第一语句相匹配的第二语句,包括:将所述第一词向量序列输入到孪生双向LSTM网络,通过所述孪生双向LSTM网络确定第一语句与目标语句集中每个目标语句的余弦距离;根据余弦距离和对比损失函数确定所述目标语句集中与第一语句相匹配的第二语句。4.根据权利要求3所述的方法,其特征在于,所述将所述第一词向量序列输入到孪生双向LSTM网络,通过所述孪生双向LSTM网络确定第一语句与目标语句集中每个目标语句的余弦距离,包括:通过注意力机制对所述第一词向量序列中当前时刻输出的目标词向量计算注意力概率,所述注意力概率用于指示所述目标词向量在第一语句中语义的重要程度;根据注意力概率大于门限的词向量的语义确定所述第一语句与第二语句之间的余弦距离。5.一种语义匹配模型的学习方法,其特征在于,包括:获取语句训练样本集,所述语句训练样本集包括多个样本语句对;将语句训练样本集输入到分词模型,通过分词模型对语句训练样本集中的每个样本语句进行分词,得到每个样本语句的词序列;将每个词序列转换成词向量序列;将每个语句对所对应的词向量序列按照正向序列和反向序列输入到孪生双向LSTM网络进行学习训练,得到语义匹配模型。6.根据权利要求5所述的语义匹配模型的学习方法,其特征在于,所述将每个语句对所对应的词向量序列按照正向序列和反向序列输入到孪生双向LSTM网络进行学习训练,得到语义匹配模型,包括:将每个样本语句对所对应的词向量序列按照正向序列和反向序列输入到孪生双向LSTM网络;计算每个样本语句对的余弦距离;根据每个样本语句对的余弦距离及对比损失函数迭代训练所述孪生双向LSTM网络,得到所述语义匹配模型。7.根据权利要求5所述的语义匹配模型的学习方法,其特征在于,所述通过分词模型对语句训练样本集中的每个样本语句进行分词,得到每个样本语句的词序列之前,所述方法还包括:采用word2vec机制训练词向量,得到词向量的查询表,所述查询表包括所述语句对应的语言中每一个词映射成的固定长度的表示向量。8.根据权利要求7所述的语义匹配模型的学习方法...
【专利技术属性】
技术研发人员:晁阳,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。