文本匹配方法、装置、设备及介质制造方法及图纸

技术编号:40701878 阅读:10 留言:0更新日期:2024-03-22 11:00
本申请实施例公开了一种文本匹配方法、装置、设备及介质,应用于数据处理技术领域。其中方法包括:获取待匹配的第一文本和第二文本,并确定第一文本和第二文本之间的文本相似度;获取第一文本关联的第一文本分词集以及第二文本关联的第二文本分词集;分别确定各个第一文本分词在第一文本中的词权重以及各个第二文本分词在第二文本中的词权重;基于各个第一文本分词的词权重以及各个第二文本分词的词权重确定第一文本分词集与第二文本分词集之间的分词相似度;通过文本相似度以及分词相似度确定第一文本和第二文本之间的文本匹配度。采用本申请实施例,可以提高文本匹配的准确性。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种文本匹配方法、装置、设备及介质


技术介绍

1、文本匹配是个非常典型的任务,如搜索中常见的搜索召回和排序、检索式问答等任务,本质上都属于文本匹配的任务,即给定一段文本作为查询文本,然后匹配出最为相关的文档或答案然后返回给用户。因此,如何确定两个文本之间的匹配度是一个重要任务。现有匹配方式在于通过提取文本特征来确定两段文本的相似度,由最终的相似度值可以得知两段文本的内容是否属于相似的描述。该种文本匹配方式存在准确性不足的问题。因此,如何提高文本匹配的准确性成为一个亟待解决的问题。


技术实现思路

1、本申请实施例提供了一种文本匹配方法、装置、设备及介质,可以提高文本匹配的准确性。

2、一方面,本申请实施例提供了一种文本匹配方法,该方法包括:

3、获取待匹配的第一文本和第二文本,并确定第一文本和第二文本之间的文本相似度;

4、获取第一文本关联的第一文本分词集以及第二文本关联的第二文本分词集;第一文本分词集包括至少一个第一文本分词,第二文本分词集包括本文档来自技高网...

【技术保护点】

1.一种文本匹配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,确定所述第一文本和所述第二文本之间的文本相似度,包括:

3.根据权利要求1所述的方法,其特征在于,所述分别确定所述第一文本分词集中的各个第一文本分词在所述第一文本中的词权重,包括:

4.根据权利要求1所述的方法,其特征在于,基于所述各个第一文本分词的词权重以及所述各个第二文本分词的词权重确定所述第一文本分词集与所述第二文本分词集之间的分词相似度,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述各个第一文本分词的分词特征向量和所述各个第二...

【技术特征摘要】

1.一种文本匹配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,确定所述第一文本和所述第二文本之间的文本相似度,包括:

3.根据权利要求1所述的方法,其特征在于,所述分别确定所述第一文本分词集中的各个第一文本分词在所述第一文本中的词权重,包括:

4.根据权利要求1所述的方法,其特征在于,基于所述各个第一文本分词的词权重以及所述各个第二文本分词的词权重确定所述第一文本分词集与所述第二文本分词集之间的分词相似度,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述各个第一文本分词的分词特征向量和所述各个第二文本分词的分词特征向量确定所述第一文本分词集与所述第二文本分词集之间的分词相似度,包括:

6.根据权利要求5所...

【专利技术属性】
技术研发人员:李军伟
申请(专利权)人:小红书科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1