基于知识图谱的实体描述抽取方法、装置及计算设备制造方法及图纸

技术编号:26478743 阅读:60 留言:0更新日期:2020-11-25 19:22
本发明专利技术公开了一种基于知识图谱的实体描述抽取方法、装置及计算设备,其中,方法包括:步骤S1,针对一给定的实体,从知识图谱数据库中抽取出该实体的实体描述集合;步骤S2,针对实体描述集合中的每个非重复的实体描述,根据各个非重复的实体描述与该实体描述之间的相似度、以及各个非重复的实体描述在实体描述集合中出现的频率计算该实体描述的置信度;步骤S3,根据各个实体描述的置信度,从实体描述集合中筛选出至少一个实体描述作为实体的备用实体描述。本发明专利技术方案中,在量化某一实体描述的质量时,依赖于各个实体描述分别出现的频率、以及各个实体描述与该实体描述的相似度该两种信息得到量化结果,使得计算结果更为可靠。

【技术实现步骤摘要】
基于知识图谱的实体描述抽取方法、装置及计算设备
本专利技术涉及计算机
,具体涉及一种基于知识图谱的实体描述抽取方法、装置及计算设备。
技术介绍
现代搜索引擎在发展的过程中不断完善其产品功能,为用户提供更全面便捷的信息服务。其中,右侧推荐系统将与用户查询相关的实体通过图片及对应名称、类别标签的形式展示给用户,让用户可以更方便地了解和查询相关的其它知识信息,从而获得良好的用户体验。图1示出了搜索博美犬无推荐理由时的右侧推荐的示意图。如图1所示,用户根据右侧推荐的猜你喜欢、相关生物、猜你关注、以及其他人还搜该四个版块中的推荐内容,可以获得与博美犬相关的其它知识信息。但是,大多数用户并不了解推荐系统背后的工作原理,对推荐系统推荐的内容也不是特别了解。在这种情况下,则可通过将推荐理由用直观的形式展示给用户,以极大的提高用户的搜索体验以及对搜索系统的信任。一种较典型的方式是,将推荐实体本身的介绍展示给用户。在现有技术中,推荐理由的挖掘通常是基于模板的方式实现,其中,模板的来源主要有如下两种:第一种,基于高质量知识三元组种子进行BootsTra本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的实体描述抽取方法,包括:/n步骤S1,针对一给定的实体,从知识图谱数据库中抽取出该实体的实体描述集合;/n步骤S2,针对所述实体描述集合中的每个非重复的实体描述,根据各个非重复的实体描述与该实体描述之间的相似度、以及各个非重复的实体描述在实体描述集合中出现的频率计算该实体描述的置信度;/n步骤S3,根据各个实体描述的置信度,从所述实体描述集合中筛选出至少一个实体描述作为所述实体的备用实体描述。/n

【技术特征摘要】
1.一种基于知识图谱的实体描述抽取方法,包括:
步骤S1,针对一给定的实体,从知识图谱数据库中抽取出该实体的实体描述集合;
步骤S2,针对所述实体描述集合中的每个非重复的实体描述,根据各个非重复的实体描述与该实体描述之间的相似度、以及各个非重复的实体描述在实体描述集合中出现的频率计算该实体描述的置信度;
步骤S3,根据各个实体描述的置信度,从所述实体描述集合中筛选出至少一个实体描述作为所述实体的备用实体描述。


2.根据权利要求1所述的方法,其中,所述从知识图谱数据库中抽取出该实体的实体描述集合进一步包括:
利用一个或多个抽取模型从知识图谱数据库中抽取出该实体的实体描述集合。


3.根据权利要求1或2所述的方法,其中,在所述从知识图谱数据库中抽取出该实体的实体描述集合之后,所述方法还包括:
针对实体描述集合的每个非重复的实体描述,判断该实体描述的长度是否位于预设长度区间内,若否,则将该实体描述从实体描述集合中进行滤除;和/或,
判断该实体描述中是否包含预设符号,若是,则将该实体描述从实体描述集合中进行滤除。


4.一种搜索引擎推荐理由的推送方法,包括:
获取搜索引擎的推荐结果;
将所述推荐结果作为给定的实体,利用权利要求1-3任一项所述的方法,得到所述推荐结果对应的备用实体描述;
从所述备用实体描述中选择实体描述作为推荐理由在搜索结果展现页面进行呈现。


5.一种基于知识图谱的实体描述抽取装置,包括:
抽取模块,适于针对一给定的实体,从知识图谱数据库中抽取出该实体的实体描述集合;
置信度计算模块,适于针对所述实体描述集合中的每个非重复的实体描...

【专利技术属性】
技术研发人员:朱坤鸿张晨周梁
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1