【技术实现步骤摘要】
用于生成语义匹配模型的方法和装置
本公开的实施例涉及计算机
,具体涉及用于生成语义匹配模型的方法和装置。
技术介绍
对很多行业来说,建设一个自动问答系统是一个非常热门的主题,在自动问答系统中一个关键的问题是,从自动问答知识库中检索出一个给定问题的最相似问题,这可以被重新定义为一个语义句子匹配问题。现有的技术方案主要分为两种,一种是基于词或者同义词的文本相似度对句子进行相关性计算,这种方法只能计算句子的文本相似度,并不能理解句子的语义。另外一种则是,基于自由文本语料和语言模型去获取近似的句子语义表示,但是这种近似的方式会造成句子语义表示发生偏差,导致效果不好。
技术实现思路
本公开的实施例提出了用于生成语义匹配模型的方法和装置。第一方面,本公开的实施例提供了一种用于生成语义匹配模型的方法,包括:获取样本集,其中,样本集中的样本包括第一语句、与第一语句语义匹配的第二语句、与第一语句语义不匹配的第三语句;从样本集中选取样本,以及执行以下训练步骤:将选取的样本的第一语句、第二语句、第三语句分 ...
【技术保护点】
1.一种用于生成语义匹配模型的方法,包括:/n获取样本集,其中,所述样本集中的样本包括第一语句、与第一语句语义匹配的第二语句、与第一语句语义不匹配的第三语句;/n从所述样本集中选取样本,以及执行以下训练步骤:将选取的样本的第一语句、第二语句、第三语句分别进行分词,得到第一词序列、第二词序列和第三词序列;将所述第一词序列、所述第二词序列和所述第三词序列输入到孪生神经网络,得到损失值;根据所述损失值确定孪生神经网络是否训练完成;响应于确定所述孪生神经网络训练完成,将所述孪生神经网络作为语义匹配模型。/n
【技术特征摘要】
1.一种用于生成语义匹配模型的方法,包括:
获取样本集,其中,所述样本集中的样本包括第一语句、与第一语句语义匹配的第二语句、与第一语句语义不匹配的第三语句;
从所述样本集中选取样本,以及执行以下训练步骤:将选取的样本的第一语句、第二语句、第三语句分别进行分词,得到第一词序列、第二词序列和第三词序列;将所述第一词序列、所述第二词序列和所述第三词序列输入到孪生神经网络,得到损失值;根据所述损失值确定孪生神经网络是否训练完成;响应于确定所述孪生神经网络训练完成,将所述孪生神经网络作为语义匹配模型。
2.根据权利要求1所述的方法,其中,所述将所述第一词序列、所述第二词序列和所述第三词序列输入到孪生神经网络,得到损失值,包括:
将所述第一词序列、所述第二词序列和所述第三词序列分别转换成第一词向量序列、第二词向量序列和第三词向量序列;
将所述第一词向量序列、所述第二词向量序列和所述第三词向量序列分别转换成第一语句向量、第二语句向量和第三语句向量;
确定所述第一语句向量与所述第二语句向量之间的第一余弦相似度和所述第一语句向量与所述第三语句向量之间的第二余弦相似度;
根据第一余弦相似度、第二余弦相似度和损失函数确定损失值。
3.根据权利要求1所述的方法,其中,所述第一语句为用户搜索的语句、所述第二语句为用户点击查看的语句、第三语句为用户未点击查看的语句。
4.根据权利要求1所述的方法,其中,一个样本中第三语句的数量大于等于1。
5.根据权利要求1所述的方法,其中,所述孪生神经网络包括第一子网络和至少一个第二子网络,所述第一子网络的输出结果为第一语句向量和第二语句向量的余弦相似度的sigmoid函数值,所述第二子网络的输出结果为1减去第一语句和第三语句的余弦相似度的sigmoid函数值。
6.根据权利要求1-5之一所述的方法,其中,所述方法还包括:
响应于确定出所述孪生神经网络未训练完成,调整所述孪生神经网络中的相关参数,以及从所述样本集中重新选取样本,使用调整后的孪生神经网络继续执行所述训练步骤。
7.一种用于输出信息的方法,包括:
接收待匹配的第一目标语句和第二目标语句;
将所述第一目标语句和所述第二目标语句分别进行切词转换成第一目标词序列、第二目标词序列;
将所述第一目标词序列、所述第二目标词序列输入如权利要求1-6之一所述的方法生成的语义匹配模型中,生成所述第一目标语句和所述第二目标语句的语义匹配结果。
8.一种用于生成语义匹配模型的装置,包括:
获取单元,被配置成获取样本集,其中,所述样本集中的样本包括第一语句、与第一语句语义匹配的第二语句、与第一语句语义不匹配的第三语句;
训练单元,被配...
【专利技术属性】
技术研发人员:黄强,卜建辉,陈林,吴伟佳,谢炜坚,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。