基于知识锚点的检索方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32462840 阅读:45 留言:0更新日期:2022-02-26 08:55
本申请实施例提供了一种基于知识锚点的检索方法、装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取知识锚点数据;通过对知识锚点数据进行实体特征改写,得到知识锚点语句;根据预设的关键字和字典树对知识锚点语句进行召回处理,得到检索语句集合;通过预设的检索模型对知识锚点语句进行检索处理,得到检索特征数据;对检索特征数据和检索语句集合进行融合处理,得到检索文本;根据预设的聚类标签对检索文本进行聚类处理,得到聚类文本集;对聚类文本集进行过滤处理,得到目标检索文本集。本申请实施例能够提高检索的准确性。确性。确性。

【技术实现步骤摘要】
基于知识锚点的检索方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种基于知识锚点的检索方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,在短文本理解中通常将起映射在一个语义空间上的隐性向量,然后通过计算向量的相似度来进行内容召回。有时面对两个结构相似、但实体不同的句子,却会判定为两个句子相似、向用户返回错误句子的答案信息,使得信息检索的准确性较低。因此,如何提供一种基于知识锚点的检索方法,能够提高检索的准确性,成为了亟待解决的技术问题。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种基于知识锚点的检索方法、装置、电子设备及存储介质,旨在提高检索的准确性。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种基于知识锚点的检索方法,所述方法包括:
[0005]获取知识锚点数据;
[0006]通过对所述知识锚点数据进行实体特征改写,得到知识锚点语句;
[0007]根据预设的关键字和字典树对所述知识锚点语句进行召回处理,得到检索语句集合;
[0008]通过预设的检索模型对所述知识锚点语句进行检索处理,得到检索特征数据;
[0009]对所述检索特征数据和所述检索语句集合进行融合处理,得到检索文本;
[0010]根据预设的聚类标签对所述检索文本进行聚类处理,得到聚类文本集;
[0011]对所述聚类文本集进行过滤处理,得到目标检索文本集。
[0012]在一些实施例,所述通过对所述知识锚点数据进行实体特征改写,得到知识锚点语句的步骤,包括:
[0013]对所述知识锚点数据进行特征提取,得到实体锚点特征;
[0014]利用预设的字典树遍历所述实体锚点特征,以通过所述字典树对所述知识锚点数据进行扩充处理,得到目标锚点数据;
[0015]对所述目标锚点数据进行实体特征改写,得到候选锚点语句;
[0016]对所述候选锚点语句进行筛选处理,得到知识锚点语句。
[0017]在一些实施例,所述根据预设的关键字对所述知识锚点语句进行召回处理,得到检索语句集合的步骤,包括:
[0018]通过预设的序列分类器对所述知识锚点语句进行分类处理,得到标注锚点语句;
[0019]对所述标注锚点语句进行卷积处理,得到标注锚点特征;
[0020]根据所述关键字对所述字典树中的所述标注锚点特征进行关键字召回处理,得到检索语句集合。
[0021]在一些实施例,所述通过预设的检索模型对所述知识锚点语句进行检索处理,得到检索特征数据的步骤,包括:
[0022]对所述知识锚点语句进行词向量化处理得到锚点语句词向量,并对预设的参考语句进行词向量化处理,得到参考语句词向量;
[0023]对所述锚点语句词向量和所述参考语句词向量进行特征提取,得到锚点语句特征和参考语句特征;
[0024]对所述锚点语句特征和所述参考语句特征进行差异性计算,得到锚点局部特征值和参考局部特征值;
[0025]对所述锚点局部特征值和所述参考局部特征值进行池化处理,得到池化特征值;
[0026]通过预设的第一函数对所述池化特征值进行激活处理,得到检索特征数据。
[0027]在一些实施例,所述根据预设的聚类标签对所述检索文本进行聚类处理,得到聚类文本集的步骤,包括:
[0028]通过预设的第二函数对检索文本进行文本分数计算,得到每一检索文本的文本分值;
[0029]根据预设的聚类标签、所述文本分值对所述检索文本进行聚类处理,得到聚类文本集。
[0030]在一些实施例,所述对所述聚类文本集进行过滤处理,得到目标检索文本集的步骤,包括:
[0031]获取过滤优先级序列;
[0032]根据所述过滤优先级序列依次对所述聚类文本集进行过滤处理,得到目标检索文本集。
[0033]在一些实施例,在所述对所述聚类文本集进行过滤处理,得到目标检索文本集的步骤之前,所述方法还包括:
[0034]根据所述聚类标签,获取所述聚类文本集的过滤类型;
[0035]对所述过滤类型进行优先级排序,生成所述过滤优先级序列。
[0036]为实现上述目的,本申请实施例的第二方面提出了一种基于知识锚点的检索装置,所述装置包括:
[0037]数据获取模块,用于获取知识锚点数据;
[0038]数据预处理模块,用于通过对知识锚点数据进行实体特征改写,得到知识锚点语句;
[0039]关键字召回模块,用于根据预设的关键字和字典树对所述知识锚点语句进行召回处理,得到检索语句集合;
[0040]检索模块,用于通过预设的检索模型对所述知识锚点语句进行检索处理,得到检索特征数据;
[0041]融合模块,用于对所述检索特征数据和所述检索语句集合进行融合处理,得到检索文本;
[0042]聚类模块,用于根据预设的聚类标签对所述检索文本进行聚类处理,得到聚类文本集;
[0043]过滤模块,用于对所述聚类文本集进行过滤处理,得到目标检索文本集。
[0044]为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现上述第一方面所述的方法。
[0045]为实现上述目的,本申请实施例的第四方面提出了一种存储介质,所述存储介质为计算机可读存储介质,用于计算机可读存储,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面所述的方法。
[0046]本申请提出的基于知识锚点的检索方法、装置、电子设备及存储介质,其通过获取知识锚点数据;通过对知识锚点数据进行实体特征改写,得到知识锚点语句,保证了知识锚点语句的合理性。进而,根据预设的关键字和字典树对知识锚点语句进行召回处理,得到检索语句集合。同时,通过预设的检索模型对知识锚点语句进行检索处理,得到检索特征数据,这样一来,能够得到符合要求的检索语句以及检索特征数据。进而,对检索特征数据和检索语句集合进行融合处理,得到检索文本,能够提高检索效率和检索准确性,然后根据预设的聚类标签对检索文本进行聚类处理,得到聚类文本集;最后对聚类文本集进行过滤处理,得到目标检索文本集,使得目标检索文本集的检索文本与检索意图的相关性更高,从而提高了信息检索的准确性。
附图说明
[0047]图1是本申请实施例提供的基于知识锚点的检索方法的流程图;
[0048]图2是图1中的步骤S102的流程图;
[0049]图3是图1中的步骤S103的流程图;
[0050]图4是图1中的步骤S104的流程图;
[0051]图5是图1中的步骤S106的流程图;
[0052]图6是本申请实施例提供的基于知识锚点的检索方法的另本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识锚点的检索方法,其特征在于,所述方法包括:获取知识锚点数据;通过对所述知识锚点数据进行实体特征改写,得到知识锚点语句;根据预设的关键字和字典树对所述知识锚点语句进行召回处理,得到检索语句集合;通过预设的检索模型对所述知识锚点语句进行检索处理,得到检索特征数据;对所述检索特征数据和所述检索语句集合进行融合处理,得到检索文本;根据预设的聚类标签对所述检索文本进行聚类处理,得到聚类文本集;对所述聚类文本集进行过滤处理,得到目标检索文本集。2.根据权利要求1所述的基于知识锚点的检索方法,其特征在于,所述通过对所述知识锚点数据进行实体特征改写,得到知识锚点语句的步骤,包括:对所述知识锚点数据进行特征提取,得到实体锚点特征;利用预设的字典树遍历所述实体锚点特征,以通过所述字典树对所述知识锚点数据进行扩充处理,得到目标锚点数据;对所述目标锚点数据进行实体特征改写,得到候选锚点语句;对所述候选锚点语句进行筛选处理,得到知识锚点语句。3.根据权利要求1所述的基于知识锚点的检索方法,其特征在于,所述根据预设的关键字对所述知识锚点语句进行召回处理,得到检索语句集合的步骤,包括:通过预设的序列分类器对所述知识锚点语句进行分类处理,得到标注锚点语句;对所述标注锚点语句进行卷积处理,得到标注锚点特征;根据所述关键字对所述字典树中的所述标注锚点特征进行关键字召回处理,得到检索语句集合。4.根据权利要求1所述的基于知识锚点的检索方法,其特征在于,所述通过预设的检索模型对所述知识锚点语句进行检索处理,得到检索特征数据的步骤,包括:对所述知识锚点语句进行词向量化处理得到锚点语句词向量,并对预设的参考语句进行词向量化处理,得到参考语句词向量;对所述锚点语句词向量和所述参考语句词向量进行特征提取,得到锚点语句特征和参考语句特征;对所述锚点语句特征和所述参考语句特征进行差异性计算,得到锚点局部特征值和参考局部特征值;对所述锚点局部特征值和所述参考局部特征值进行池化处理,得到池化特征值;通过预设的第一函数对所述池化特征值进行激活处理,得到检索特征数据。5.根据权利要求1所述的基于知识锚点的检索方法...

【专利技术属性】
技术研发人员:金美芝马建
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1