【技术实现步骤摘要】
文本匹配方法、装置、存储介质和程序产品
[0001]本申请涉及人工智能
,尤其涉及一种文本匹配方法、装置、存储介质和程序产品。
技术介绍
[0002]随着人工智能技术的发展,人工智能技术被广泛应用于信息推荐、信息检索、舆论分析和信息挖掘等场景,文本匹配是上述各种场景中最基础的任务之一。现有的文本匹配方法通常是先获取文本间的语义相似度,如向量空间距离或夹角等,然后根据语义相似度排序确定匹配的文本,或者利用预训练模型进行文本匹配。然而,通过语义相似度计算的方法进行文本匹配,表达能力非常局限,得到的相似度结果准确性差,且计算量较大,不适用于大规模文本匹配;预训练模型存在参数量庞大的自限性,导致其预测性能较差,同样不适合大规模文本匹配。因此,需要提供一种改进的文本匹配方案,以解决上述问题。
技术实现思路
[0003]本申请提供了一种文本匹配方法、装置和存储介质,可以有效提高文本匹配的准确率和匹配效率,优化后续任务的应用效果。
[0004]一方面,本申请提供了一种文本匹配方法,所述方法包括:
[0005]获取目标矩阵结构和待匹配文本的待匹配文本特征;其中,所述目标矩阵结构包括多个具有相同节点数的矩阵层,单层矩阵层中包括多个节点,单个节点对应若干个候选文本;
[0006]针对所述目标矩阵结构中的各矩阵层,通过目标文本匹配模型对所述待匹配文本特征进行概率分布预测处理,得到所述各矩阵层对应的概率分布结果;所述概率分布结果表征所述待匹配文本特征针对单个矩阵层中各节点的概率分布;
[ ...
【技术保护点】
【技术特征摘要】
1.一种文本匹配方法,其特征在于,所述方法包括:获取目标矩阵结构和待匹配文本的待匹配文本特征;其中,所述目标矩阵结构包括多个具有相同节点数的矩阵层,单层矩阵层中包括多个节点,单个节点对应若干个候选文本;针对所述目标矩阵结构中的各矩阵层,通过目标文本匹配模型对所述待匹配文本特征进行概率分布预测处理,得到所述各矩阵层对应的概率分布结果;其中,所述概率分布结果表征所述待匹配文本特征针对单个矩阵层中各节点的概率分布;基于所述概率分布结果分别对所述各矩阵层中的节点进行节点筛选处理,得到所述待匹配文本特征在所述各矩阵层中对应的目标节点;将所述目标节点对应的候选文本确定为与所述待匹配文本匹配的目标文本;其中,所述目标文本匹配模型是以候选文本作为训练样本,根据无监督学习方法对基于所述目标矩阵结构构建的初始预测模型,进行针对目标矩阵结构的各矩阵层的概率分布预测和所述候选文本的节点表示更新的迭代训练得到的。2.根据权利要求1所述的方法,其特征在于,所述目标文本匹配模型包括多个匹配子模型,所述匹配子模型与所述矩阵层一一对应;所述针对所述目标矩阵结构中的各矩阵层,通过目标文本匹配模型对所述待匹配文本特征进行概率分布预测处理,得到所述各矩阵层对应的概率分布结果包括:将所述待匹配文本特征作为所述目标矩阵结构的第一层矩阵层对应的匹配子模型的输入,以进行所述待匹配文本特征的概率分布预测处理,得到所述第一层矩阵层对应的概率分布值和概率分布特征;将所述第一层矩阵层对应的概率分布特征与所述待匹配文本特征进行拼接处理,得到第一拼接特征;以所述第一拼接特征作为第二层矩阵层对应的匹配子模型的输入,以进行所述第一拼接特征的概率分布预测处理,得到所述第二层矩阵层对应的概率分布值和概率分布特征;重复执行将输入当前层矩阵层对应的匹配子模型的拼接特征,与所述当前矩阵层对应的匹配子模型输出的概率分布特征进行拼接处理,得到更新的拼接特征,以及以更新的拼接特征作为下一层矩阵层对应的匹配子模型的输入,以进行所述更新的拼接特征的概率分布预测处理,得到所述下一层矩阵层对应的概率分布值和概率分布特征的步骤,至得到所述目标矩阵结构的最后一层矩阵层对应的概率分布值和概率分布特征。3.根据权利要求2所述的方法,其特征在于,所述基于所述概率分布结果分别对所述各矩阵层中的节点进行节点筛选处理,得到所述待匹配文本特征在所述各矩阵层中对应的目标节点包括:基于各矩阵层对应的概率分布值,分别对所述各矩阵层各自的节点进行节点概率排序;基于所述节点概率排序,分别从所述各矩阵层各自的节点中筛选出预设数量的节点,得到所述各矩阵层各自对应的目标节点。4.根据权利要求1所述的方法,其特征在于,在所述获取目标矩阵结构和待匹配文本的待匹配文本特征之前,所述方法还包括:构建具有预设的矩阵长度和矩阵宽度的矩阵,得到所述目标矩阵结构;所述预设宽度为所述目标矩阵结构包括的矩阵层数;
获取多个候选文本;初始化所述多个候选文本在所述目标矩阵结构的各矩阵层中的节点表示,得到所述多个候选文本中每个候选文本在各矩阵层中的节点表示。5.根据权利要求4所述的方法,其特征在于,所述初始化所述多个候选文本在所述目标矩阵结构的各矩阵层中的节点表示包括:针对所述目标矩阵结构的每层矩阵层,基于预设分配方式将所述多个候选文本分配至所述矩阵层中的各节点,得到所述多个候选文本中每个候选文本在在各矩阵层中的节点表示。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:构建所述目标矩阵结构的各矩阵层各自对应的预测子模型;建立各预测子模型间的连接关系,得到所述初始预测模型。7.根据权利要求4
‑
6中任一项所述的方法,其特征在于,在所述针对所述目标矩阵结构中的各矩阵层,通过目标文本匹配模型对所述待匹配文本特征进行概率分布预测处理,得到所述各矩阵层对应的概率分布结果之前,所述方法还包括:将多个参考候选文本各自的...
【专利技术属性】
技术研发人员:石志林,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。