一种基于知识图谱的语义搜索方法及装置制造方法及图纸

技术编号:23149385 阅读:52 留言:0更新日期:2020-01-18 13:35
本发明专利技术提供一种基于知识图谱的语义搜索方法及装置,能够为用户提供准确地个性化搜索,且能够提高搜索效率和搜索准确度。所述方法包括:提取用户输入的待查询请求中的关键词,将提取的每一个关键词在本体库中进行概念的匹配,其中,所述待查询请求用于查询养老机构资源;若匹配成功,则执行基于本体的语义扩展;若执行失败,则执行基于知识图谱的语义扩展;根据用户的历史行为,确定基于用户行为的语义相似度;根据确定的基于用户行为的语义相似度及语义扩展结果,预测用户对养老机构资源的评分,将评分高的若干个养老机构资源信息作为推荐列表返回给用户。本发明专利技术涉及搜索引擎、计算机信息处理领域。

A semantic search method and device based on Knowledge Map

【技术实现步骤摘要】
一种基于知识图谱的语义搜索方法及装置
本专利技术涉及搜索引擎、计算机信息处理领域,特别是指一种基于知识图谱的语义搜索方法及装置。
技术介绍
近年来,随着信息科技的迅猛发展,网络信息资源呈现爆炸式地增长,人们在享受互联网信息交互带来巨大便利的同时,也受到“信息迷航”、“认知过载”等问题的困扰。面对互联网上养老资源信息的日益增多,现有的搜索方式未考虑语义信息和用户特征,不能理解用户查询意图,导致用户搜索效率和搜索精确度低,且不能为用户提供精准地个性化的搜索服务。
技术实现思路
本专利技术要解决的技术问题是提供一种基于知识图谱的语义搜索方法及装置,以解决现有技术所存在的用户搜索效率和搜索精确度低,且不能为用户提供精准地个性化的搜索服务的问题。为解决上述技术问题,本专利技术实施例提供一种基于知识图谱的语义搜索方法,包括:提取用户输入的待查询请求中的关键词,将提取的每一个关键词在本体库中进行概念的匹配,其中,所述待查询请求用于查询养老机构资源;若匹配成功,则执行基于本体的语义扩展;若执行失败,则执行基于知识图谱的语义扩展;根据用户的历史行为,确定基于用户行为的语义相似度;根据确定的基于用户行为的语义相似度及语义扩展结果,预测用户对养老机构资源的评分,将评分高的若干个养老机构资源信息作为推荐列表返回给用户。进一步地,所述若匹配成功,则执行基于本体的语义扩展包括:若匹配成功,则得到所述关键词映射到本体库中的实体概念,其中,映射得到的实体概念为待扩展实体概念;计算每一个待扩展实体概念与本体库中的其他实体概念的语义相似度;将语义相似度值大于预设的第一阈值时的其他本体概念作为相应待扩展实体概念的扩展词。进一步地,语义相似度表示为:其中,SimONT(c1,c2)表示基于本体的语义相似度,f1和f2分别表示实体概念c1和c2与最近的公共父节点之间的最短路径,D是c1和c2所在本体层次结构中的最大深度。进一步地,所述若执行失败,则执行基于知识图谱的语义扩展包括:若执行失败,则根据已构建的养老机构知识图谱,对待扩展实体概念与养老机构知识图谱中的本体概念分别进行继承关联和路径关联计算;将关联值之和大于预设的第二阈值时的养老机构知识图谱中的本体概念作为待扩展实体概念的扩展词。进一步地,继承关联计算表达式为:其中,Inherit(ci,cj)表示实体概念ci和cj的继承关联值,k表示实体概念ci和cj的局部深度最大的共同祖先数量,an是ci和cj的局部深度最大的共同祖先,是an在本体层次结构中的深度,是an所在分支的最大深度。进一步地,路径关联计算表达式为:其中,Path(ci,cj)表示实体概念ci和cj的路径关联值,m表示实体概念ci和cj的路径关联条数,lengthn为ci和cj之间第n条路径关联长度;关联值之和表示为:SimKG(ci,cj)=Inherit(ci,cj)+Path(ci,cj)其中,SimKG(ci,cj)表示继承关联值和路径关联值的和。进一步地,若历史行为为用户评分,则基于用户行为的语义相似度表示为:其中,Wij表示基于用户行为的养老机构资源i和j之间的相似度,|N(i)|表示对养老机构资源i进行评分的用户数,|N(j)|表示对养老机构资源j进行评分的用户数,|N(i)∩N(j)|是同时对养老机构资源i和j进行评分的用户数,养老机构资源i为实体概念ci,养老机构资源j为实体概念cj。进一步地,用户对养老机构资源的评分表示为:其中,Pui表示用户u对养老机构资源i的评分;N(u)表示用户u所评分过的养老机构资源的集合,S(i,k)表示与养老机构资源i最相似的k个资源集合;N(u)∩S(i,k)表示生成的参考资源集合,作为对资源i进行评分的参考;Sim(ci,cj)表示养老机构资源i与养老机构资源j的融合相似度,rui表示用户u对养老机构资源i的兴趣度。进一步地,若是执行基于本体的语义扩展,则融合相似度表示为:Sim(ci,cj)=α·SimONT(ci,cj)+(1-α)Wij其中,Sim(ci,cj)表示基于本体和用户行为的融合相似度;α为融合因子,表示Sim(ci,cj)中SimONT(ci,cj)所占的比例;若是执行基于知识图谱的语义扩展,则融合相似度表示为:Sim(ci,cj)=α·SimKG(ci,cj)+(1-α)Wij其中,Sim(ci,cj)表示基于知识图谱和用户行为的融合相似度;α为融合因子,表示Sim(ci,cj)中SimKG(ci,cj)所占的比例。本专利技术实施例还提供一种基于知识图谱的语义搜索装置,包括:匹配模块,用于提取用户输入的待查询请求中的关键词,将提取的每一个关键词在本体库中进行概念的匹配,其中,所述待查询请求用于查询养老机构资源;扩展模块,用于若匹配成功,则执行基于本体的语义扩展;若执行失败,则执行基于知识图谱的语义扩展;确定模块,用于根据用户的历史行为,确定基于用户行为的语义相似度;推荐模块,用于根据确定的基于用户行为的语义相似度及语义扩展结果,预测用户对养老机构资源的评分,将评分高的若干个养老机构资源信息作为推荐列表返回给用户。本专利技术的上述技术方案的有益效果如下:上述方案中,提取用户输入的待查询请求中的关键词,将提取的每一个关键词在本体库中进行概念的匹配,其中,所述待查询请求用于查询养老机构资源;若匹配成功,则执行基于本体的语义扩展;若执行失败,则执行基于知识图谱的语义扩展;根据用户的历史行为,确定基于用户行为的语义相似度;根据确定的基于用户行为的语义相似度及语义扩展结果,预测用户对养老机构资源的评分,将评分高的若干个养老机构资源信息作为推荐列表返回给用户,从而为每个用户提供准确地个性化搜索,且能够提高搜索效率和搜索准确度。附图说明图1为本专利技术实施例提供的基于知识图谱的语义搜索方法的流程示意图;图2为本专利技术实施例提供的基于知识图谱的语义搜索装置的结构示意图。具体实施方式为使本专利技术要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。本专利技术针对现有的用户搜索效率和搜索精确度低,且不能为用户提供精准地个性化的搜索服务的问题,提供一种基于知识图谱的语义搜索方法及装置。实施例一如图1所示,本专利技术实施例提供的基于知识图谱的语义搜索方法,包括:S101,提取用户输入的待查询请求中的关键词,将提取的每一个关键词在本体库中进行概念的匹配,其中,所述待查询请求用于查询养老机构资源;S102,若匹配成功,则执行基于本体的语义扩展;若执行失败,则执行基于知识图谱的语义扩展;S103,根据用户的历史行为,确定基于用户行为的语义相似度;S104,本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的语义搜索方法,其特征在于,包括:/n提取用户输入的待查询请求中的关键词,将提取的每一个关键词在本体库中进行概念的匹配,其中,所述待查询请求用于查询养老机构资源;/n若匹配成功,则执行基于本体的语义扩展;若执行失败,则执行基于知识图谱的语义扩展;/n根据用户的历史行为,确定基于用户行为的语义相似度;/n根据确定的基于用户行为的语义相似度及语义扩展结果,预测用户对养老机构资源的评分,将评分高的若干个养老机构资源信息作为推荐列表返回给用户。/n

【技术特征摘要】
1.一种基于知识图谱的语义搜索方法,其特征在于,包括:
提取用户输入的待查询请求中的关键词,将提取的每一个关键词在本体库中进行概念的匹配,其中,所述待查询请求用于查询养老机构资源;
若匹配成功,则执行基于本体的语义扩展;若执行失败,则执行基于知识图谱的语义扩展;
根据用户的历史行为,确定基于用户行为的语义相似度;
根据确定的基于用户行为的语义相似度及语义扩展结果,预测用户对养老机构资源的评分,将评分高的若干个养老机构资源信息作为推荐列表返回给用户。


2.根据权利要求1所述的基于知识图谱的语义搜索方法,其特征在于,所述若匹配成功,则执行基于本体的语义扩展包括:
若匹配成功,则得到所述关键词映射到本体库中的实体概念,其中,映射得到的实体概念为待扩展实体概念;
计算每一个待扩展实体概念与本体库中的其他实体概念的语义相似度;
将语义相似度值大于预设的第一阈值时的其他本体概念作为相应待扩展实体概念的扩展词。


3.根据权利要求2所述的基于知识图谱的语义搜索方法,其特征在于,语义相似度表示为:



其中,SimONT(c1,c2)表示基于本体的语义相似度,f1和f2分别表示实体概念c1和c2与最近的公共父节点之间的最短路径,D是c1和c2所在本体层次结构中的最大深度。


4.根据权利要求3所述的基于知识图谱的语义搜索方法,其特征在于,所述若执行失败,则执行基于知识图谱的语义扩展包括:
若执行失败,则根据已构建的养老机构知识图谱,对待扩展实体概念与养老机构知识图谱中的本体概念分别进行继承关联和路径关联计算;
将关联值之和大于预设的第二阈值时的养老机构知识图谱中的本体概念作为待扩展实体概念的扩展词。


5.根据权利要求4所述的基于知识图谱的语义搜索方法,其特征在于,继承关联计算表达式为:



其中,Inherit(ci,cj)表示实体概念ci和cj的继承关联值,k表示实体概念ci和cj的局部深度最大的共同祖先数量,an是ci和cj的局部深度最大的共同祖先,是an在本体层次结构中的深度,是an所在分支的最大深度。


6.根据权利要求5所述的基于知识图谱的语义搜索方法,其特征在于,路径关联计算表达式为:



其中,Path(ci,cj)表示实体概念ci和cj的路径关联值,m表示实体概念ci和cj的路径关联条数,lengthn为ci和cj之间第n条路径关联长度;
关联值之和表示为:
SimKG(ci,cj)=In...

【专利技术属性】
技术研发人员:宁焕生刘福超
申请(专利权)人:北京科技大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1