文本匹配方法及装置、计算机可读存储介质、终端制造方法及图纸

技术编号：37233222 阅读：15 留言：0更新日期：2023-04-20 23:15

一种文本匹配方法及装置、计算机可读存储介质、终端，所述方法包括：获取待匹配文本，所述待匹配文本包括：第一文本和第二文本；构建多个句袋，其中，每个句袋包括所述语义相似的多个句子，所述多个句子来自所述第一文本和/或第二文本，且不同句袋表征的语义不同或者不相似；根据各个句袋的权重值对所述多个句袋各自的语义向量进行融合，得到聚合向量，其中，每个句袋的权重值用于表征该句袋和其他句袋之间的关联程度；根据所述聚合向量，计算所述第一文本和所述第二文本的匹配结果。通过本申请提供的方案，能够提高文本匹配的准确度。能够提高文本匹配的准确度。能够提高文本匹配的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
文本匹配方法及装置、计算机可读存储介质、终端

[0001]本申请涉及自然语言处理
，尤其涉及一种文本匹配方法及装置、计算机可读存储介质、终端。

技术介绍

[0002]随着人工智能技术的发展，自然语言处理(Nature Language Processing，NLP)技术在各个领域的应用愈加广泛，文本匹配技术应运而生。其中，文本匹配是用于衡量文本之间的相似性或关联性的技术。现有技术中，文本匹配的准确度仍然有待提高，尤其是当文本的长度较长时，匹配的准确度明显降低。
[0003]因此，亟需一种能够提高匹配准确度的文本匹配方法。

技术实现思路

[0004]本申请解决的技术问题是如何提高文本匹配的准确度。
[0005]为解决上述技术问题，本申请实施例提供一种文本匹配方法，所述方法包括：获取待匹配文本，所述待匹配文本包括：第一文本和第二文本；构建多个句袋，其中，每个句袋包括语义相似的多个句子，所述多个句子来自所述第一文本和/或第二文本，且不同句袋表征的语义不同或者不相似；根据各个句袋的权重值对所述多个句袋各自的语义向量进行融合，得到聚合向量，其中，每个句袋的权重值用于表征该句袋和其他句袋之间的关联程度；根据所述聚合向量，计算所述第一文本和所述第二文本的匹配结果。
[0006]可选的，构建多个句袋包括：对所述待匹配文本进行关键词提取，得到关键词集合，所述关键词集合包括多个关键词；构建每个关键词对应的句袋，其中，每个关键词对应的句袋包括：所述第一文本中包括该关键词的句子和所述第二文本中包...

【技术保护点】

【技术特征摘要】
1.一种文本匹配方法，其特征在于，所述方法包括：获取待匹配文本，所述待匹配文本包括：第一文本和第二文本；构建多个句袋，其中，每个句袋包括语义相似的多个句子，所述多个句子来自所述第一文本和/或第二文本，且不同句袋表征的语义不同或者不相似；根据各个句袋的权重值对所述多个句袋各自的语义向量进行融合，得到聚合向量，其中，每个句袋的权重值用于表征该句袋和其他句袋之间的关联程度；根据所述聚合向量，计算所述第一文本和所述第二文本的匹配结果。2.根据权利要求1所述的文本匹配方法，其特征在于，构建多个句袋包括：对所述待匹配文本进行关键词提取，得到关键词集合，所述关键词集合包括多个关键词；构建每个关键词对应的句袋，其中，每个关键词对应的句袋包括：所述第一文本中包括该关键词的句子和所述第二文本中包括该关键词的句子。3.根据权利要求2所述的文本匹配方法，其特征在于，构建每个关键词对应的句袋包括：在所述第一文本中包含所述关键词的句子均被添加至所述句袋之后，再向所述句袋添加所述第二文本中包含所述关键词的句子；或者，在所述第二文本中包含所述关键词的句子均被添加至所述句袋之后，再向所述句袋添加所述第一文本中包含所述关键词的句子。4.根据权利要求1所述的文本匹配方法，其特征在于，根据各个句袋的权重值对所述多个句袋的语义向量进行融合之前，所述方法还包括：在每个句袋中添加指示标签，所述指示标签用于区分来自不同文本的句子。5.根据权利要求1所述的文本匹配方法，其特征在于，每个句袋中属于同一个文本的多个句子在该句袋中的相对顺序与所述多个句子在所属文本中的相对顺序相同。6.根据权利要求1所述的文本匹配方法，其特征在于，根据各个句袋的权重值对所述多个句袋各自的语义向量进行融合，得到聚合向量包括：计算各个句袋的语义向量；采用自注意力机制对所述多个句袋的语义向量进行计算，得到各个句袋的权重值；根据各个句袋的权重值，对所述多个句袋各自的语义向量进行融合，得到所述聚合向量。7.根据权利要求6所述的文本匹配方法，其特征在于，所述聚合向量由预先训练得到的神经网络模...

【专利技术属性】
技术研发人员：蔡华，胡景熙，
申请(专利权)人：华院计算技术上海股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人