基于知识图谱的模糊匹配方法、装置和计算机设备制造方法及图纸

技术编号:28295617 阅读:96 留言:0更新日期:2021-04-30 16:19
本申请涉及知识图谱技术领域,提供了一种基于知识图谱的模糊匹配方法、装置、计算机设备和存储介质。所述方法包括:接收携带检索句的检索请求,对检索句进行分词,得到包括查询关键字的查询词袋;根据查询词袋,查询已构建的知识图谱,得到包含查询关键字的知识图谱节点文本;根据知识图谱节点文本,查询已构建的知识图谱,得到与知识图谱节点文本对应的相似文本集合;根据预设特征词得分表,获取与查询关键字对应的关键字得分,根据关键字得分以及节点连接关系,得到知识图谱节点文本的第一检索得分以及相似文本集合中相似节点文本的第二检索得分;根据第一检索得分以及第二检索得分,得到检索结果。采用本方法能够提高模糊匹配准确度。

【技术实现步骤摘要】
基于知识图谱的模糊匹配方法、装置和计算机设备
本申请涉及计算机
,特别是涉及一种基于知识图谱的模糊匹配方法、装置、计算机设备和存储介质。
技术介绍
随着计算机技术的发展,出现了模糊匹配技术,模糊匹配技术是指根据查询关键字,返回与查询关键字相关的描述。比如,常见的模糊匹配方法有搜索引擎根据查询关键字返回相关的网页链接。传统技术中,在进行模糊匹配时,常采用的方法为基于统计的倒排索引以及基于神经网络的计算。其中,基于统计的倒排索引的查询方式为:将文本做分词处理后,通过关键字做倒排索引,根据倒排索引将文本数据库分桶或者做哈希运算。基于神经网络的计算的查询方式为:通过人工或者半人工标注的方式准备训练语料,监督训练一个相似度模型,通过该模型可以输入一个文本,输出一个隐藏向量,或者输入两个文本,直接输出相似度得分。然而,传统方法都存在模糊匹配不准确的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高模糊匹配准确度的基于知识图谱的模糊匹配方法、装置、计算机设备和存储介质。一种基于知识图谱的模本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的模糊匹配方法,所述方法包括:/n接收携带检索句的检索请求,对所述检索句进行分词,得到包括查询关键字的查询词袋;/n根据所述查询词袋,查询已构建的知识图谱,得到包含所述查询关键字的知识图谱节点文本,所述已构建的知识图谱以文本数据为节点、并以与所述文本数据对应的文本相似度为节点连接关系;/n根据所述知识图谱节点文本,查询所述已构建的知识图谱,根据所述节点连接关系得到与所述知识图谱节点文本对应的相似文本集合;/n根据预设特征词得分表,获取与所述查询关键字对应的关键字得分,根据所述关键字得分以及所述节点连接关系,得到所述知识图谱节点文本的第一检索得分以及所述相似文本集合中相似节点...

【技术特征摘要】
1.一种基于知识图谱的模糊匹配方法,所述方法包括:
接收携带检索句的检索请求,对所述检索句进行分词,得到包括查询关键字的查询词袋;
根据所述查询词袋,查询已构建的知识图谱,得到包含所述查询关键字的知识图谱节点文本,所述已构建的知识图谱以文本数据为节点、并以与所述文本数据对应的文本相似度为节点连接关系;
根据所述知识图谱节点文本,查询所述已构建的知识图谱,根据所述节点连接关系得到与所述知识图谱节点文本对应的相似文本集合;
根据预设特征词得分表,获取与所述查询关键字对应的关键字得分,根据所述关键字得分以及所述节点连接关系,得到所述知识图谱节点文本的第一检索得分以及所述相似文本集合中相似节点文本的第二检索得分;
根据所述第一检索得分以及所述第二检索得分对所述知识图谱节点文本以及所述相似节点文本进行排序,得到与所述检索句对应的检索结果。


2.根据权利要求1所述的方法,其特征在于,所述根据所述关键字得分以及所述节点连接关系,得到所述知识图谱节点文本的第一检索得分以及所述相似文本集合中相似节点文本的第二检索得分包括:
根据所述关键字得分,计算所述知识图谱节点文本的第一检索得分,并根据所述知识图谱节点文本,确定与所述相似文本集合中相似节点文本对应的目标节点文本;
根据所述目标节点文本以及所述节点连接关系,计算所述相似节点文本的第二检索得分。


3.根据权利要求1所述的方法,其特征在于,所述根据所述查询词袋,查询已构建的知识图谱,得到包含所述查询关键字的知识图谱节点文本之前,还包括:
获取文本数据集,对所述文本数据集中文本数据进行分词,得到与所述文本数据对应的词语集合;
将所述词语集合输入已训练的词向量模型,得到与所述词语集合对应的词向量集合,根据所述词向量集合,得到与所述文本数据对应的文本向量;
根据所述文本向量、所述词语集合以及预设词频统计算法,计算所述文本数据集中文本数据之间的文本相似度,确定与所述文本数据对应的目标相似文本;
根据所述目标相似文本,以所述文本数据为节点、并以与所述目标相似文本对应的文本相似度为节点连接关系,构建知识图谱。


4.根据权利要求3所述的方法,其特征在于,所述根据所述词向量集合,得到与所述文本数据对应的文本向量包括:
根据所述词向量集合,计算所述词向量集合中各词向量的相同维度平均值;
归集所述相同维度平均值,得到与所述文本数据对应的文本向量。


5.根据权利要求3所述的方法,其特征在于,所述根据所述文本向量、所述词语集合以及预设词频统计算法,计算所述文本数据集中文本数据之间的文本相似度,确定与所述文本数据对应的目标相似文本包括:
根据所述词...

【专利技术属性】
技术研发人员:王昊张乐情罗水权刘剑李燕婷
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1