文本匹配方法、装置、存储介质和程序产品制造方法及图纸

技术编号:32965759 阅读:11 留言:0更新日期:2022-04-09 11:21
本申请提供了一种文本匹配方法、装置、存储介质和程序产品,涉及人工智能技术领域,可以应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景,包括:获取目标矩阵结构和待匹配文本的待匹配文本特征;目标矩阵结构包括多个具有相同节点数的矩阵层,单层矩阵层中包括多个节点,单个节点对应若干个候选文本;针对目标矩阵结构中的各矩阵层,通过目标文本匹配模型对待匹配文本特征进行概率分布预测处理,得到各矩阵层对应的概率分布结果;基于概率分布结果分别对各矩阵层中的节点进行筛选处理,得到待匹配文本特征在各矩阵层中对应的目标节点;将目标节点对应的候选文本确定为与待匹配文本匹配的目标文本。本申请能够有效提高文本匹配的匹配效率。匹配的匹配效率。匹配的匹配效率。

【技术实现步骤摘要】
文本匹配方法、装置、存储介质和程序产品


[0001]本申请涉及人工智能
,尤其涉及一种文本匹配方法、装置、存储介质和程序产品。

技术介绍

[0002]随着人工智能技术的发展,人工智能技术被广泛应用于信息推荐、信息检索、舆论分析和信息挖掘等场景,文本匹配是上述各种场景中最基础的任务之一。现有的文本匹配方法通常是先获取文本间的语义相似度,如向量空间距离或夹角等,然后根据语义相似度排序确定匹配的文本,或者利用预训练模型进行文本匹配。然而,通过语义相似度计算的方法进行文本匹配,表达能力非常局限,得到的相似度结果准确性差,且计算量较大,不适用于大规模文本匹配;预训练模型存在参数量庞大的自限性,导致其预测性能较差,同样不适合大规模文本匹配。因此,需要提供一种改进的文本匹配方案,以解决上述问题。

技术实现思路

[0003]本申请提供了一种文本匹配方法、装置和存储介质,可以有效提高文本匹配的准确率和匹配效率,优化后续任务的应用效果。
[0004]一方面,本申请提供了一种文本匹配方法,所述方法包括:
[0005]获取目标矩阵结构和待匹配文本的待匹配文本特征;其中,所述目标矩阵结构包括多个具有相同节点数的矩阵层,单层矩阵层中包括多个节点,单个节点对应若干个候选文本;
[0006]针对所述目标矩阵结构中的各矩阵层,通过目标文本匹配模型对所述待匹配文本特征进行概率分布预测处理,得到所述各矩阵层对应的概率分布结果;所述概率分布结果表征所述待匹配文本特征针对单个矩阵层中各节点的概率分布;
[0007]基于所述概率分布结果分别对所述各矩阵层中的节点进行节点筛选处理,得到所述待匹配文本特征在所述各矩阵层中对应的目标节点;
[0008]将所述目标节点对应的候选文本确定为与所述待匹配文本匹配的目标文本;
[0009]其中,所述目标文本匹配模型是以候选文本作为训练样本,根据无监督学习方法对基于所述目标矩阵结构构建的初始预测模型,进行针对目标矩阵结构的各矩阵层的概率分布预测和所述候选文本的节点表示更新的迭代训练得到的。
[0010]另一方面提供了一种文本匹配装置,所述装置包括:
[0011]文本特征获取模块:用于获取目标矩阵结构和待匹配文本的待匹配文本特征;其中,所述目标矩阵结构包括多个具有相同节点数的矩阵层,单层矩阵层中包括多个节点,单个节点对应若干个候选文本;
[0012]概率分布预测模块:用于针对所述目标矩阵结构中的各矩阵层,通过目标文本匹配模型对所述待匹配文本特征进行概率分布预测处理,得到所述各矩阵层对应的概率分布结果;所述概率分布结果表征所述待匹配文本特征针对单个矩阵层中各节点的概率分布;
[0013]目标节点筛选模块:用于基于所述概率分布结果分别对所述各矩阵层中的节点进行节点筛选处理,得到所述待匹配文本特征在所述各矩阵层中对应的目标节点;
[0014]目标文本确定模块:用于将所述目标节点对应的候选文本确定为与所述待匹配文本匹配的目标文本;
[0015]其中,所述目标文本匹配模型是以候选文本作为训练样本,根据无监督学习方法对基于所述目标矩阵结构构建的初始预测模型,进行针对目标矩阵结构的各矩阵层的概率分布预测和所述候选文本的节点表示更新的迭代训练得到的。
[0016]另一方面提供了一种计算机设备,所述设备包括处理器和存储器,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的文本匹配方法。
[0017]另一方面提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述的文本匹配方法。
[0018]另一方面提供了一种服务器,所述服务器包括处理器和存储器,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的文本匹配方法。
[0019]另一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令被处理器执行时实现如上述的文本匹配方法。
[0020]本申请提供的文本匹配方法、装置、设备、存储介质、服务器和计算机程序产品,具有如下技术效果:
[0021]本申请的技术方案获取目标矩阵结构和待匹配文本的待匹配文本特征;其中,目标矩阵结构包括多个具有相同节点数的矩阵层,单层矩阵层中包括多个节点,单个节点对应若干个候选文本;并针对目标矩阵结构中的各矩阵层,通过目标文本匹配模型对待匹配文本特征进行概率分布预测处理,得到各矩阵层对应的概率分布结果;其中,概率分布结果表征待匹配文本特征针对单个矩阵层中各节点的概率分布;然后,基于概率分布结果分别对各矩阵层中的节点进行筛选处理,得到待匹配文本特征在各矩阵层中对应的目标节点;进而将目标节点对应的候选文本确定为与待匹配文本匹配的目标文本;通过引入矩阵结构和基于矩阵结构构建的文本匹配模型进行概率分布预测,来筛选节点和确定匹配文本,无需进行文本间的文本向量相似度计算,有效提高文本匹配的匹配效率和准确率,能够支持大规模海量文本的匹配任务。并且,引入矩阵结构能够支持多种类型的文本匹配模型,针对不同应用场景可以灵活配置模型种类,在文本匹配模型的训练过程中,是进行针对目标矩阵结构的各矩阵层的概率分布预测和候选文本的节点表示更新的迭代训练,同样无需计算文本向量相似度,有效提高模型训练效率。
附图说明
[0022]为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0023]图1是本申请实施例提供的一种应用环境的示意图;
[0024]图2是本申请实施例提供的一种文本匹配方法的流程示意图;
[0025]图3是本申请实施例提供的一个目标矩阵结构的示意图;
[0026]图4是基于图3中的目标矩阵结构和对应的目标文本匹配模型对待匹配文本特征embedding(x)的概率分布预测处理过程示意图;
[0027]图5是本申请实施例提供的一个目标矩阵结构的文本路径示意图;
[0028]图6是本申请实施例提供另一种文本匹配方法的流程示意图;
[0029]图7是本申请实施例提供的另一种文本匹配方法的流程示意图;
[0030]图8是本申请实施例提供一种文本匹配装置的框架示意图;
[0031]图9是本申请实施例提供的一种文本匹配方法的电子设备的硬件结构框图;
[0032]图10是本申请实施例提供的一个区块链系统的结构示意图。
具体实施方式
[0033]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本匹配方法,其特征在于,所述方法包括:获取目标矩阵结构和待匹配文本的待匹配文本特征;其中,所述目标矩阵结构包括多个具有相同节点数的矩阵层,单层矩阵层中包括多个节点,单个节点对应若干个候选文本;针对所述目标矩阵结构中的各矩阵层,通过目标文本匹配模型对所述待匹配文本特征进行概率分布预测处理,得到所述各矩阵层对应的概率分布结果;其中,所述概率分布结果表征所述待匹配文本特征针对单个矩阵层中各节点的概率分布;基于所述概率分布结果分别对所述各矩阵层中的节点进行节点筛选处理,得到所述待匹配文本特征在所述各矩阵层中对应的目标节点;将所述目标节点对应的候选文本确定为与所述待匹配文本匹配的目标文本;其中,所述目标文本匹配模型是以候选文本作为训练样本,根据无监督学习方法对基于所述目标矩阵结构构建的初始预测模型,进行针对目标矩阵结构的各矩阵层的概率分布预测和所述候选文本的节点表示更新的迭代训练得到的。2.根据权利要求1所述的方法,其特征在于,所述目标文本匹配模型包括多个匹配子模型,所述匹配子模型与所述矩阵层一一对应;所述针对所述目标矩阵结构中的各矩阵层,通过目标文本匹配模型对所述待匹配文本特征进行概率分布预测处理,得到所述各矩阵层对应的概率分布结果包括:将所述待匹配文本特征作为所述目标矩阵结构的第一层矩阵层对应的匹配子模型的输入,以进行所述待匹配文本特征的概率分布预测处理,得到所述第一层矩阵层对应的概率分布值和概率分布特征;将所述第一层矩阵层对应的概率分布特征与所述待匹配文本特征进行拼接处理,得到第一拼接特征;以所述第一拼接特征作为第二层矩阵层对应的匹配子模型的输入,以进行所述第一拼接特征的概率分布预测处理,得到所述第二层矩阵层对应的概率分布值和概率分布特征;重复执行将输入当前层矩阵层对应的匹配子模型的拼接特征,与所述当前矩阵层对应的匹配子模型输出的概率分布特征进行拼接处理,得到更新的拼接特征,以及以更新的拼接特征作为下一层矩阵层对应的匹配子模型的输入,以进行所述更新的拼接特征的概率分布预测处理,得到所述下一层矩阵层对应的概率分布值和概率分布特征的步骤,至得到所述目标矩阵结构的最后一层矩阵层对应的概率分布值和概率分布特征。3.根据权利要求2所述的方法,其特征在于,所述基于所述概率分布结果分别对所述各矩阵层中的节点进行节点筛选处理,得到所述待匹配文本特征在所述各矩阵层中对应的目标节点包括:基于各矩阵层对应的概率分布值,分别对所述各矩阵层各自的节点进行节点概率排序;基于所述节点概率排序,分别从所述各矩阵层各自的节点中筛选出预设数量的节点,得到所述各矩阵层各自对应的目标节点。4.根据权利要求1所述的方法,其特征在于,在所述获取目标矩阵结构和待匹配文本的待匹配文本特征之前,所述方法还包括:构建具有预设的矩阵长度和矩阵宽度的矩阵,得到所述目标矩阵结构;所述预设宽度为所述目标矩阵结构包括的矩阵层数;
获取多个候选文本;初始化所述多个候选文本在所述目标矩阵结构的各矩阵层中的节点表示,得到所述多个候选文本中每个候选文本在各矩阵层中的节点表示。5.根据权利要求4所述的方法,其特征在于,所述初始化所述多个候选文本在所述目标矩阵结构的各矩阵层中的节点表示包括:针对所述目标矩阵结构的每层矩阵层,基于预设分配方式将所述多个候选文本分配至所述矩阵层中的各节点,得到所述多个候选文本中每个候选文本在在各矩阵层中的节点表示。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:构建所述目标矩阵结构的各矩阵层各自对应的预测子模型;建立各预测子模型间的连接关系,得到所述初始预测模型。7.根据权利要求4

6中任一项所述的方法,其特征在于,在所述针对所述目标矩阵结构中的各矩阵层,通过目标文本匹配模型对所述待匹配文本特征进行概率分布预测处理,得到所述各矩阵层对应的概率分布结果之前,所述方法还包括:将多个参考候选文本各自的...

【专利技术属性】
技术研发人员:石志林
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1