System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于知识图谱的课程智能搜索方法技术_技高网

一种基于知识图谱的课程智能搜索方法技术

技术编号:40628244 阅读:4 留言:0更新日期:2024-03-13 21:14
本发明专利技术涉及数据处理技术领域,提出了一种基于知识图谱的课程智能搜索方法,包括:获取课程数据,获取课程数据中的实体,根据课程数据中的实体获取图谱结构;获取用户的检索内容的实体集合,计算每个实体的核心查询指数;获取实体的语义向量,确定实体之间的实体匹配度,确定实体的综合实体匹配度,根据综合实体匹配度确定实体匹配候选集;根据图谱结构确定存在关系的实体,确定实体匹配候选集中实体的度,进而获取实体匹配候选集中实体的查询相关度评分,根据实体的查询相关度评分,确定根据用户的检索内容检索出的课程信息,完成基于知识图谱的课程智能搜索。本发明专利技术旨在解决搜索结果准确度不足的问题。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体涉及一种基于知识图谱的课程智能搜索方法


技术介绍

1、随着互联网和移动设备的普及,人们已经可以通过各种途径获取大量的教育资源,例如,在线课程、学术论文、电子书籍等,甚至因为海量信息的存在导致信息过剩情况的出现。信息过剩也带来了新的问题。在进行信息搜寻时,过剩的信息中充斥着大量冗余信息,从众多冗余信息中快速且准确地找到符合自己需求的教育资源成为一个复杂的问题。使用传统的搜索引擎对教育资源进行搜索是一种常用的教育资源检索方式,但是,搜索引擎的搜索往往不能满足用户的精细化需求,其搜索结果往往过于杂乱,不易筛选。基于知识图谱的课程智能搜索方法可以解决搜索结果过于杂乱的问题。

2、知识图谱是一个将实体、概念以及它们之间的关系表示为图形结构的语义网络,可以为用户提供更加个性化的搜索结果,还可以根据检索内容进行更深层次的语义匹配。但是,由于语言表达的多样性,用户的检索内容使用的语言表达可能并不准确,也会出现语义模糊的现象,致使检索内容中缺乏明确的实体或关系描述,对用户查询意图的理解以及根据理解进行准确匹配仍然是具有挑战的难点。


技术实现思路

1、本专利技术提供一种基于知识图谱的课程智能搜索方法,以解决课程搜索时语言表达不准确使同一语义的词语不同而无法匹配,导致的课程搜索结果准确度不足的问题,所采用的技术方案具体如下:

2、本专利技术一个实施例提供了一种基于知识图谱的课程智能搜索方法,该方法包括以下步骤:

3、获取课程数据,获取课程数据中的实体,根据课程数据中的实体获取图谱结构;

4、获取用户的检索内容的实体集合,根据用户的检索内容的实体集合中实体出现的频率和不同实体之间的距离,计算每个实体的核心查询指数;

5、获取用户的检索内容的实体和知识图谱中的实体的语义向量,确定用户的检索内容的实体与知识图谱中的实体之间的语义相似性和语义距离,进而确定用户的检索内容的实体与知识图谱中的实体之间的实体匹配度,根据实体的核心查询指数以及用户的检索内容的实体与知识图谱中的实体之间的实体匹配度,确定知识图谱中的实体的综合实体匹配度,根据综合实体匹配度确定实体匹配候选集;

6、根据图谱结构确定存在关系的实体,根据存在关系的实体确定实体匹配候选集中实体的度,根据实体匹配候选集中实体的度和实体的综合实体匹配度,获取实体匹配候选集中实体的查询相关度评分,根据实体的查询相关度评分,确定根据用户的检索内容检索出的课程信息,完成基于知识图谱的课程智能搜索。

7、进一步,所述获取用户的检索内容的实体集合,包括的具体方法为:

8、对去停用词处理后的用户的检索内容的文本序列,使用命名实体识别模型bert-bilstm-crf进行处理,获取用户的检索内容的实体集合。

9、进一步,所述根据用户的检索内容的实体集合中实体出现的频率和不同实体之间的距离,计算每个实体的核心查询指数,包括的具体方法为:

10、

11、其中,αi表示用户的检索内容中第i个实体的核心查询指数;n1表示用户的检索内容中实体的数量;fi表示用户的检索内容中第i个实体出现的频率;fi,k表示用户的检索内容的实体集合中剔除了第i个实体后,第k个实体出现的频率;di,k表示用户的检索内容的实体集合中剔除了第i个实体后,第k个实体与第i个实体之间的距离。

12、进一步,所述获取用户的检索内容的实体和知识图谱中的实体的语义向量,包括的具体方法为:

13、分别将用户的检索内容的每个实体和知识图谱中的每个实体输入bert模型,获取每个实体的语义向量。

14、进一步,所述语义相似性的获取方法为:将用户的检索内容的实体的语义向量与知识图谱中的实体的语义向量的余弦相似度记为这两个实体的语义相似性。

15、进一步,所述语义距离的获取方法为:将用户的检索内容的实体与知识图谱中的实体之间的编辑距离记为这两个实体的语义距离。

16、进一步,所述进而确定用户的检索内容的实体与知识图谱中的实体之间的实体匹配度,包括的具体方法为:

17、将用户的检索内容的实体与知识图谱中的实体的语义距离与第一调节参数的和记为第一语义距离,将用户的检索内容的实体与知识图谱中的实体的语义相似性与第一语义距离的比值的线性归一化值记为两个实体之间的实体匹配度。

18、进一步,所述实体匹配候选集的获取方法为:将大于等于选择阈值的综合实体匹配度对应的实体组成的集合记为实体匹配候选集。

19、进一步,所述根据图谱结构确定存在关系的实体,根据存在关系的实体确定实体匹配候选集中实体的度,包括的具体方法为:

20、将图谱结构中存在边相连的实体记为存在关系的实体,将实体匹配候选集中每个实体分别记为待分析实体,将与待分析实体存在关系的、实体匹配候选集中的其他实体的数量记为待分析实体的度。

21、进一步,所述根据实体的查询相关度评分,确定根据用户的检索内容检索出的课程信息,完成基于知识图谱的课程智能搜索,包括的具体方法为:

22、将实体匹配候选集中所有实体的查询相关度评分按照由高到低的顺序进行排序,按照排序顺序输出实体匹配候选集中实体对应的课程数据,输出的课程数据即为根据用户的检索内容检索出的课程信息。

23、本专利技术的有益效果是:

24、本专利技术通过课程数据的文本中的实体以及实体之间的特征,确定图谱结构;接着,计算每个实体的核心查询指数,即根据用户的检索内容确定检索内容表明的含义以及每个实体词在检索内容中的重要程度,使越为重要的实体表明的语义含义对课程搜索结果的影响越大;然后,根据用户的检索内容中的实体与图谱结构中的实体之间对应的课程信息的相似程度,确定用户的检索内容的实体与知识图谱中的实体之间的实体匹配度,进而根据实体匹配度和核心查询指数获取知识图谱中的实体的综合实体匹配度,即知识图谱中的实体与用户的检索内容的综合符合程度,综合实体匹配度可提升对图谱结构中实体对应的课程信息筛选的准确性;根据将用户的检索内容的实体与知识图谱中的实体进行匹配时,被更多实体关联的搜索结果更可能是用户想搜索出的内容的特征,结合知识图谱中实体的关联的密集程度,对实体匹配候选集中的实体对应的课程信息与用户的检索内容之间的关联程度进行评价,获取实体匹配候选集中实体的查询相关度评分,结合知识图谱的查询方式可以更精确地掌握用户查询内容的核心,提升课程查询结果与所查询内容核心的匹配度,能够为用户提供更贴合其查询意图的结果,提高用户满意度;最后,根据实体的查询相关度评分确定根据用户的检索内容检索出的课程信息,完成基于知识图谱的课程智能搜索,解决课程搜索时语言表达不准确使同一语义的词语不同而无法匹配,导致的课程搜索结果准确度不足的问题。

本文档来自技高网...

【技术保护点】

1.一种基于知识图谱的课程智能搜索方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述获取用户的检索内容的实体集合,包括的具体方法为:

3.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述根据用户的检索内容的实体集合中实体出现的频率和不同实体之间的距离,计算每个实体的核心查询指数,包括的具体方法为:

4.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述获取用户的检索内容的实体和知识图谱中的实体的语义向量,包括的具体方法为:

5.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述语义相似性的获取方法为:将用户的检索内容的实体的语义向量与知识图谱中的实体的语义向量的余弦相似度记为这两个实体的语义相似性。

6.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述语义距离的获取方法为:将用户的检索内容的实体与知识图谱中的实体之间的编辑距离记为这两个实体的语义距离。

7.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述进而确定用户的检索内容的实体与知识图谱中的实体之间的实体匹配度,包括的具体方法为:

8.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述实体匹配候选集的获取方法为:将大于等于选择阈值的综合实体匹配度对应的实体组成的集合记为实体匹配候选集。

9.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述根据图谱结构确定存在关系的实体,根据存在关系的实体确定实体匹配候选集中实体的度,包括的具体方法为:

10.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述根据实体的查询相关度评分,确定根据用户的检索内容检索出的课程信息,完成基于知识图谱的课程智能搜索,包括的具体方法为:

...

【技术特征摘要】

1.一种基于知识图谱的课程智能搜索方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述获取用户的检索内容的实体集合,包括的具体方法为:

3.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述根据用户的检索内容的实体集合中实体出现的频率和不同实体之间的距离,计算每个实体的核心查询指数,包括的具体方法为:

4.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述获取用户的检索内容的实体和知识图谱中的实体的语义向量,包括的具体方法为:

5.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在于,所述语义相似性的获取方法为:将用户的检索内容的实体的语义向量与知识图谱中的实体的语义向量的余弦相似度记为这两个实体的语义相似性。

6.根据权利要求1所述的一种基于知识图谱的课程智能搜索方法,其特征在...

【专利技术属性】
技术研发人员:李春光
申请(专利权)人:中共国网山西省电力公司党校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1