文本匹配方法、装置、计算机可读存储介质和计算机设备制造方法及图纸

技术编号：24456180 阅读：25 留言：0更新日期：2020-06-10 15:37

本申请涉及一种文本匹配方法、装置、计算机可读存储介质和计算机设备，所述方法包括：获取第一文本和第二文本，第一文本长度大于第二文本长度；确定第一文本对应的第一文本向量，并确定第二文本对应的第二文本向量；将第一文本向量和第二文本向量匹配，得到第一文本和第二文本的文本匹配结果，其中，基于第一文本中的各个分句的文本向量得到所述第一文本向量，根据第一文本中的各个分句的初始向量与第二文本向量之间的相似度来确定第一文本中的各个分句的文本向量。本申请提供的方案可以实现提高文本匹配的准确性。

Text matching method, device, computer-readable storage medium and computer equipment

全部详细技术资料下载

【技术实现步骤摘要】
文本匹配方法、装置、计算机可读存储介质和计算机设备
本申请涉及互联网
，特别是涉及一种文本匹配方法、装置、计算机可读存储介质和计算机设备。
技术介绍
随着自然语言处理技术的发展，文本匹配在很多实际应用场景中都被广泛应用。比如，根据用户搜索语查找对应的文章。现有的文本匹配方法主要是基于词汇重合度的匹配算法来确定两个文本之间是否匹配。然而这种方法只是对词汇进行重合度的匹配，并未对文本的语义进行深入理解并匹配，存在文本匹配准确性低的问题
技术实现思路
基于此，有必要针对文本匹配准确性低的技术问题，提供一种文本匹配方法、装置、计算机可读存储介质和计算机设备。一种文本匹配方法，包括：获取第一文本和第二文本，第一文本长度大于第二文本长度；确定第一文本对应的第一文本向量，并确定第二文本对应的第二文本向量；将第一文本向量和第二文本向量匹配，得到第一文本和第二文本的文本匹配结果，其中，基于第一文本中的各个分句的文本向量得到所述第一文本向量，根据第一文本中的各个分句的初始向量与第...

【技术保护点】
1.一种文本匹配方法，包括：/n获取第一文本和第二文本，所述第一文本长度大于所述第二文本长度；/n确定所述第一文本对应的第一文本向量，并确定所述第二文本对应的第二文本向量；/n将所述第一文本向量和所述第二文本向量匹配，得到所述第一文本和第二文本的文本匹配结果，/n其中，基于所述第一文本中的各个分句的文本向量得到所述第一文本向量，根据所述第一文本中的各个分句的初始向量与所述第二文本向量之间的相似度来确定所述第一文本中的各个分句的文本向量。/n

【技术特征摘要】
1.一种文本匹配方法，包括：
获取第一文本和第二文本，所述第一文本长度大于所述第二文本长度；
确定所述第一文本对应的第一文本向量，并确定所述第二文本对应的第二文本向量；
将所述第一文本向量和所述第二文本向量匹配，得到所述第一文本和第二文本的文本匹配结果，
其中，基于所述第一文本中的各个分句的文本向量得到所述第一文本向量，根据所述第一文本中的各个分句的初始向量与所述第二文本向量之间的相似度来确定所述第一文本中的各个分句的文本向量。

2.根据权利要求1所述的方法，其特征在于，所述文本匹配结果是通过文本匹配模型得到的，所述文本匹配模型包括文本向量化网络、相似度计算网络和文本匹配输出层网络；
所述文本向量化网络用于确定所述第一文本中的各个分句的初始向量和所述第二文本对应的第二文本向量，所述相似度计算网络用于计算所述各个分句的初始向量与所述第二文本向量之间的相似度，根据所述相似度确定所述各个分句的文本向量，基于所述各个分句的文本向量得到所述第一文本向量，所述文本匹配输出层网络用于将所述第一文本向量和所述第二文本向量匹配，得到所述第一文本和第二文本的文本匹配结果。

3.根据权利要求2所述的方法，其特征在于，所述确定所述第一文本中的各个分句的初始向量和所述第二文本对应的第二文本向量，包括：
对所述第一文本进行分句，得到各个分句；
分别对所述各个分句进行分词，得到所述各个分句对应的分句词；
获取所述分句词对应的分句词向量，将所述分句词向量输入到所述文本向量化网络中，得到所述各个分句的初始向量；
对所述第二文本进行分词，得到各个第二文本分词；
获取所述各个第二文本分词对应的第二文本分词向量，将所述各个第二文本分词向量输入到所述文本向量化网络中，得到所述第二文本对应的第二文本向量。

4.根据权利要求2所述的方法，其特征在于，所述计算所述各个分句的初始向量与所述第二文本向量之间的相似度，根据所述相似度确定所述各个分句的文本向量，包括：
通过相似度计算网络计算所述各个分句的初始向量与所述第二文本向量的相似度，根据所述相似度确定所述各个分句的初始向量对应的权重信息；
根据所述各个分句的初始向量与对应的权重信息计算所述各个分句的文本向量。

5.根据权利要求4所述的方法，其特征在于，所述根据所述各个分句的初始向量与对应的权重信息计算所述各个分句的文本向量，包括：
获取第一分句的初始向量中各个向量元素，计算所述各个向量元素与所述第一分句的初始向量对应权重信息的乘积，得到各个修正向量元素；
根据所述各个修正向量元素得到所述第一分句的文本向量。

6.根据权利要求1所述的方法，其特征在于，基于所述第一文本中的各个分句的文本向量得到所述第一文本向量，包括：
计算所述各个分句的文本向量的和，得到所述第一文本向量。

7.根据权利要求6所述的方法，其特征在于，计算所述各个分句的文本向量的和，得到所述第一文本向量，包括：
获取所述各个分句的文本向量中的向量元素和向量元素位置，将相同向量元素位置对应的各个向量元素进行相加，得到所述各个向量元素位置对应的目标向量元素；
根据所述各个目标向量元素得到第一文本向量。

8.根据权利要求2所述的方法，其特征在于，所述将所述第一文本向量和所述第二文本向量匹配，得到所述第一文本和所述第二文本的文本匹配结果，包括：
将所述第一文本向量和所述第二文本向量输入到所述文本匹配输出层网络中，得到输出的文本匹配概率；
根据所述文本匹配概率得到所述第一文本...

【专利技术属性】
技术研发人员：李振阳，梁涛，李超，张晗，马连洋，衡阵，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人