语义匹配方法、装置、电子设备及存储介质制造方法及图纸

技术编号:30070200 阅读:12 留言:0更新日期:2021-09-18 08:22
本申请提供了一种语义匹配方法、装置、电子设备及存储介质,所述方法包括:获取第一文本以及待与所述第一文本进行匹配的至少两个第二文本;基于文本语义,将所述第一文本向各所述第二文本进行命中,得到第一命中结果;基于文本语义,将所述第二文本分别向所述第一文本进行命中,得到第二命中结果;基于所述第一命中结果以及所述第二命中结果,确定与所述第一文本所匹配的第二文本。本申请实施例能够提高语义匹配的准确度。高语义匹配的准确度。高语义匹配的准确度。

【技术实现步骤摘要】
语义匹配方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能领域,具体涉及一种语义匹配方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网技术的发展,在方方面面的互联网应用中常常会涉及到语义匹配。语义匹配的准确度直接或间接决定着应用所提供服务质量的高低。现有技术中,由于在进行语义匹配时未能细致地将文本之间的相关性进行表达,从而导致语义匹配的准确度较低。

技术实现思路

[0003]本申请的一个目的在于提出一种语义匹配方法、装置、电子设备及存储介质,能够提高语义匹配的准确度。
[0004]根据本申请实施例的一方面,公开了一种语义匹配方法,所述方法包括:
[0005]获取第一文本以及待与所述第一文本进行匹配的至少两个第二文本;
[0006]基于文本语义,将所述第一文本向各所述第二文本进行命中,得到第一命中结果;
[0007]基于文本语义,将所述第二文本分别向所述第一文本进行命中,得到第二命中结果;
[0008]基于所述第一命中结果以及所述第二命中结果,确定与所述第一文本所匹配的第二文本。
[0009]根据本申请实施例的一方面,公开了一种语义匹配装置,所述装置包括:
[0010]获取模块,配置为获取第一文本以及待与所述第一文本进行匹配的至少两个第二文本;
[0011]第一命中模块,配置为基于文本语义,将所述第一文本向各所述第二文本进行命中,得到第一命中结果;
[0012]第二命中模块,配置为基于文本语义,将所述第二文本分别向所述第一文本进行命中,得到第二命中结果;
[0013]匹配模块,配置为基于所述第一命中结果以及所述第二命中结果,确定与所述第一文本所匹配的第二文本。
[0014]在本申请的一示例性实施例中,所述装置配置为:
[0015]获取所述第一文本与各所述第二文本的相似度;
[0016]建立以所述相似度为矩阵元素的相似度矩阵;
[0017]基于对所述相似度矩阵的变换处理,将所述第一文本向各所述第二文本进行命中的同时,将所述第二文本分别向所述第一文本进行命中,同时得到所述第一命中结果以及所述第二命中结果。
[0018]在本申请的一示例性实施例中,所述装置配置为:
[0019]采用预设的高斯核对所述相似度矩阵进行池化处理,得到池化后矩阵;
[0020]基于所述池化后矩阵的列向量集合以及行向量集合,得到所述第一命中结果以及所述第二命中结果。
[0021]在本申请的一示例性实施例中,所述装置配置为:
[0022]将所述第一文本以及目标第二文本进行分词,得到所述第一文本所包含的第一关键词以及所述目标第二文本所包含的第二关键词;
[0023]确定所述第一关键词与所述第二关键词的并集;
[0024]将所述并集中关键词的数目除以所述第一关键词的数目,得到所述第一命中结果;
[0025]将所述并集中关键词的数目除以所述第二关键词的数目,得到所述第二命中结果。
[0026]在本申请的一示例性实施例中,所述装置配置为:
[0027]将所述第一文本以及所述第二文本输入预设的机器学习模型;
[0028]通过所述机器学习模型将所述第一文本向各所述第二文本进行命中,得到所述第一命中结果;
[0029]通过所述机器学习模型将所述第二文本分别向所述第一文本进行命中,得到所述第二命中结果;
[0030]通过所述机器学习模型基于所述第一命中结果以及所述第二命中结果,确定与所述第一文本所匹配的第二文本。
[0031]在本申请的一示例性实施例中,所述装置配置为:
[0032]对作为输入的所述第一文本以及所述第二文本进行编码,得到所述第一文本对应的第一编码以及所述第二文本分别对应的第二编码;
[0033]将所述第一编码向各所述第二编码进行命中,得到所述第一命中结果;
[0034]将所述第二编码分别向所述第一编码进行命中,得到所述第二命中结果;
[0035]基于所述第一命中结果以及所述第二命中结果,确定与所述第一文本所匹配的第二文本。
[0036]在本申请的一示例性实施例中,所述装置配置为:采用BERT作为所述编码器层。
[0037]根据本申请实施例的一方面,公开了一种电子设备,包括:存储器,存储有计算机可读指令;处理器,读取存储器存储的计算机可读指令,以执行以上权利要求中的任一个所述的方法。
[0038]根据本申请实施例的一方面,公开了一种计算机程序介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行以上权利要求中的任一个所述的方法。
[0039]根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
[0040]本申请实施例中,对于被匹配的第一文本以及与第一文本进行匹配的第二文本,以第一文本与第二文本相互地、双向地进行命中的处理过程为基础,确定与第一文本所匹配的第二文本。通过这种方法,避免了单向语义匹配所导致的匹配偏差,提高了文本之间的
相关性表达,从而提高了语义匹配的准确度。
[0041]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0042]应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
[0043]通过参考附图详细描述其示例实施例,本申请的上述和其它目标、特征及优点将变得更加显而易见。
[0044]图1示出了根据本申请一个实施例的语义匹配的系统架构图。
[0045]图2示出了根据本申请一实施例的语义匹配方法的流程图。
[0046]图3示出了根据本申请一实施例的机器学习模型结构示意图。
[0047]图4示出了根据本申请一实施例的语义匹配装置的框图。
[0048]图5示出了根据本申请一实施例的电子设备的硬件图。
具体实施方式
[0049]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些示例实施方式使得本申请的描述将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本申请的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
[0050]此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多示例实施方式中。在下面的描述中,提供许多具体细节从而给出对本申请的示例实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而省略所述特定细节中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语义匹配方法,其特征在于,所述方法包括:获取第一文本以及待与所述第一文本进行匹配的至少两个第二文本;基于文本语义,将所述第一文本向各所述第二文本进行命中,得到第一命中结果;基于文本语义,将所述第二文本分别向所述第一文本进行命中,得到第二命中结果;基于所述第一命中结果以及所述第二命中结果,确定与所述第一文本所匹配的第二文本。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述第一文本与各所述第二文本的相似度;建立以所述相似度为矩阵元素的相似度矩阵;基于对所述相似度矩阵的变换处理,将所述第一文本向各所述第二文本进行命中的同时,将所述第二文本分别向所述第一文本进行命中,同时得到所述第一命中结果以及所述第二命中结果。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:采用预设的高斯核对所述相似度矩阵进行池化处理,得到池化后矩阵;基于所述池化后矩阵的列向量集合以及行向量集合,得到所述第一命中结果以及所述第二命中结果。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述第一文本以及目标第二文本进行分词,得到所述第一文本所包含的第一关键词以及所述目标第二文本所包含的第二关键词;确定所述第一关键词与所述第二关键词的并集;将所述并集中关键词的数目除以所述第一关键词的数目,得到所述第一命中结果;将所述并集中关键词的数目除以所述第二关键词的数目,得到所述第二命中结果。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述第一文本以及所述第二文本输入预设的机器学习模型;通过所述机器学习模型将所述第一文本向各所述第二文本进行命中,得到所述第一命中结果;通过所述机器学习模型将所述第二文本分别向所述第一文本进行命中,得到所...

【专利技术属性】
技术研发人员:毛铁峥赵子元颜强
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1