相似句匹配方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:27685565 阅读:95 留言:0更新日期:2021-03-17 03:52
本发明专利技术实施例公开了一种相似句匹配方法、装置、计算机设备及存储介质,涉及人工智能技术领域,可应用于智慧科技中以推动智慧城市的建设。该方法包括:通过预设的词向量训练工具分别将第一待测句子以及第二待测句子转换为第一向量以及第二向量;通过多层编码器对第一向量进行编码得到第三向量,通过多层编码器对第二向量进行编码得到第四向量;通过多层推理模块对所述第三向量及第四向量进行信息交互处理得到第五向量;计算第五向量的全局平局值;对全局平局值进行归一化处理得到概率值;根据概率值判断第一待测句子与第二待测句子的匹配结果。该方法通过对第三向量和第四向量进行信息交互处理以及计算第五向量的全局平局值,提高了匹配的准确率。

【技术实现步骤摘要】
相似句匹配方法、装置、计算机设备及存储介质
本专利技术涉及人工智能
,尤其涉及一种相似句匹配方法、装置、计算机设备及存储介质。
技术介绍
自然语言领域目前已经从自然语言处理发展到自然语言理解的过程,而对于自然语言理解,很重要的就是能对一句话的深层意思理解到位。相似句匹配问题在多个领域都起到很重要的作用,比如问答以及阅读理解等。语言的表达千变万化,如何能正确的判断两个句子是否表达的是同一个意思至关重要。传统的方法大多停留在判断文字本身的相似度上,比如使用编辑距离等方式判断两个句子的相似度,但是这种方法的准确率非常低,因为语言表达千变万化,有时两个句子只有一个字不一样,可能表达的意思就天差地别了。最近几年随着深度学习的流行,人们开始使用深度学习实现相似句匹配。虽然深度学习完美的解决了之前规则不准的问题,但是准确率较低。
技术实现思路
本专利技术实施例提供了一种相似句匹配方法、装置、计算机设备及存储介质,旨在解决现有相似句匹配方法准确率较低的问题。第一方面,本专利技术实施例提供了一种相似句匹配方法,孪生网络模型包括多层编码器和多层推理模块,所述相似句匹配方法包括:通过预设的词向量训练工具分别将第一待测句子以及第二待测句子转换为第一向量以及第二向量;通过所述多层编码器对所述第一向量进行编码得到第三向量,通过所述多层编码器对所述第二向量进行编码得到第四向量;通过所述多层推理模块对所述第三向量及第四向量进行信息交互处理从而得到第五向量;计算所述第五向量的全局平局值;对所述全局平局值进行归一化处理得到概率值;根据所述概率值判断所述第一待测句子与第二待测句子的匹配结果。第二方面,本专利技术实施例还提供了一种相似句匹配装置,孪生网络模型包括多层编码器和多层推理模块,所述相似句匹配装置包括:转换单元,用于通过预设的词向量训练工具分别将第一待测句子以及第二待测句子转换为第一向量以及第二向量;第一编码单元,用于通过所述多层编码器对所述第一向量进行编码得到第三向量,用于通过所述多层编码器对所述第二向量进行编码得到第四向量;交互处理单元,用于通过所述多层推理模块对所述第三向量及第四向量进行信息交互处理从而得到第五向量;计算单元,用于计算所述第五向量的全局平局值;归一化处理单元,用于对所述全局平局值进行归一化处理得到概率值;判断单元,用于根据所述概率值判断所述第一待测句子与第二待测句子的匹配结果。第三方面,本专利技术实施例还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时实现上述方法。本专利技术实施例提供了一种相似句匹配方法、装置、计算机设备及存储介质,其中所述方法包括:通过预设的词向量训练工具分别将第一待测句子以及第二待测句子转换为第一向量以及第二向量;通过所述多层编码器对所述第一向量进行编码得到第三向量,通过所述多层编码器对所述第二向量进行编码得到第四向量;通过所述多层推理模块对所述第三向量及第四向量进行信息交互处理从而得到第五向量;计算所述第五向量的全局平局值;对所述全局平局值进行归一化处理得到概率值;根据所述概率值判断所述第一待测句子与第二待测句子的匹配结果。该方法通过对第三向量和第四向量进行信息交互处理以及计算第五向量的全局平局值,充分的利用句子的信息,提高了相似句匹配的准确率。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种孪生网络模型的示意框图;图2为本专利技术实施例提供的一种相似句匹配方法流程示意图;图3为本专利技术另一实施例提供的一种相似句匹配方法流程示意图;图4为本专利技术实施例提供的一种相似句匹配方法的子流程示意图;图5为本专利技术实施例提供的一种相似句匹配装置的示意性框图;图6为本专利技术实施例提供的一种计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。本专利技术实施例提出的技术方案可应用于智慧科技中以推动智慧城市的建设。请参阅图1,图1是本专利技术实施例提供的一种孪生网络模型200的示意框图。如图所示,该孪生网络模型200包括两个多层编码器201和两个多层推理模块202,其中两个多层编码器201为并行的关系,两个多层推理模块202之间进行信息交互。参阅图2,图2是本专利技术实施例提供的相似句匹配方法的流程示意图。如图2所示,该方法包括以下步骤S1-S6。S1,通过预设的词向量训练工具分别将第一待测句子以及第二待测句子转换为第一向量以及第二向量。自然语言理解的问题要转化为机器学习的问题,第一步需要要把句子数学化。词向量就是用来将语言中的词进行数学化的一种方式,顾名思义,词向量就是把一个词表示成一个向量。具体实施中,采用word2vec作为词向量训练工具,并通过word2vec对所述第二分词序列中的单词进行词向量训练以得到输入词向量序列。word2vec是一种词向量训练工具,其作用就是将自然语言中的字词转为计算机可以理解的词向量。传统的词向量训练工具容易受维数灾难的困扰,且任意两个词之间都是孤立的,不能体现词和词之间的关系,因此本实施例采用word2vec来训练词向量,其可通过计算向量之间的距离来体现词与词之间的相似性。例如,在一实施例中,第一待测句子为:春天/花/真本文档来自技高网...

【技术保护点】
1.一种相似句匹配方法,其特征在于,孪生网络模型包括多层编码器和多层推理模块,所述相似句匹配方法包括:/n通过预设的词向量训练工具分别将第一待测句子以及第二待测句子转换为第一向量以及第二向量;/n通过所述多层编码器对所述第一向量进行编码得到第三向量,通过所述多层编码器对所述第二向量进行编码得到第四向量;/n通过所述多层推理模块对所述第三向量及第四向量进行信息交互处理从而得到第五向量;/n计算所述第五向量的全局平局值;/n对所述全局平局值进行归一化处理得到概率值;/n根据所述概率值判断所述第一待测句子与第二待测句子的匹配结果。/n

【技术特征摘要】
1.一种相似句匹配方法,其特征在于,孪生网络模型包括多层编码器和多层推理模块,所述相似句匹配方法包括:
通过预设的词向量训练工具分别将第一待测句子以及第二待测句子转换为第一向量以及第二向量;
通过所述多层编码器对所述第一向量进行编码得到第三向量,通过所述多层编码器对所述第二向量进行编码得到第四向量;
通过所述多层推理模块对所述第三向量及第四向量进行信息交互处理从而得到第五向量;
计算所述第五向量的全局平局值;
对所述全局平局值进行归一化处理得到概率值;
根据所述概率值判断所述第一待测句子与第二待测句子的匹配结果。


2.根据权利要求1所述的相似句匹配方法,其特征在于,所述通过所述多层编码器对所述第一向量进行编码得到第三向量,通过所述多层编码器对所述第二向量进行编码得到第四向量,包括:
通过方程计算所述第一向量的自注意力值从而得到第三向量,其中MQ为第一待测句子的查询向量矩阵,MK为第一待测句子的键向量矩阵,MV为第一待测句子的值向量矩阵,M为第一待测句子,d1为多层编码器网络层的维度;
通过方程计算所述第二向量的自注意力值从而得到第四向量,其中NQ为第二待测句子的查询向量矩阵,NK为第二待测句子的键向量矩阵,NV为第二待测句子的值向量矩阵,N为第二待测句子,d1为多层编码器网络层的维度。


3.根据权利要求1所述的相似句匹配方法,其特征在于,所述通过所述多层推理模块对所述第三向量及第四向量进行信息交互处理从而得到第五向量,包括:
通过方程计算所述第三向量与第四向量信息交互的注意力值从而得到第五向量,
其中MQ为第一待测句子的查询向量矩阵,NK为第二待测句子的键向量矩阵,NV为第二待测句子的值向量矩阵,M为第一待测句子,N为第二待测句子,d2为多层推理模块网络层的维度。


4.根据权利要求3所述的相似句匹配方法,其特征在于,所述多层推理模块包括多层推理网络,各层所述推理网络均计算所述第三向量与第四向量信息交互的注意力值,所述计算所述第五向量的全局平局值,包括:
根据各层所述推理网络计算的第三向量与第四向量信息交互的注意力值,计算第三向量与第四向量信息交互的注意力值的总和;
对第三向量与第四向量信息交互的注意力值的总和求取平均值从而得到第五向量的全局平局值。


5.根据权利要求1所述的相似句匹配方法,其特征在于...

【专利技术属性】
技术研发人员:宋青原王健宗吴天博
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1