一种上下位关系的确定方法、装置、服务器及存储介质制造方法及图纸

技术编号:19903524 阅读:42 留言:0更新日期:2018-12-26 02:56
本发明专利技术实施例公开了一种上下位关系的确定方法、装置、服务器及存储介质。所述方法包括:获取第一上位词和所述第一上位词对应的第一下位词集合以及第二上位词和所述第二上位词对应的第二下位词集合;确定所述第一下位词集合与所述第二下位词集合的包含关系;根据所述第一下位词集合与所述第二下位词集合的包含关系确定所述第一上位词和所述第二上位词的上下位关系。上下位关系更加饱满,泛化性较强,能够满足用户实体问答的需求。

【技术实现步骤摘要】
一种上下位关系的确定方法、装置、服务器及存储介质
本专利技术实施例涉及互联网
,尤其涉及一种上下位关系的确定方法、装置、服务器及存储介质。
技术介绍
上下位关系是一种基本的语义关系,常用于本体、知识库、词典的构建和验证。从技术实现的角度来看,上下位关系获取为其他信息的获取提供了重要支持。实体的上位词是对具有共同特性的一类实体的概括,例如“红色”、“黄色”、“绿色”的上位词是“颜色”,“轿车”、“卡车”的上位词是“汽车”。有了这种上下位关系作为先验知识,就可以快速地缩小实体答案的范围,有助于实体问答算法快速、准确地找出答案。例如,对于问题“天空是什么颜色的?”,在寻找答案的过程中,通常会先分析出问题的需求是“颜色”,之后借助实体上下位关系,可以快速地筛除上位词不是“颜色”的实体,将注意力集中在少量候选之上,甚至直接得到答案。现有的上下位关系的确定方法,通常是在问答数据中统计各个实体词共同出现的频次;当若干个实体词共同出现的频次较高时,则认为这些实体词存在上下位关系。例如,当问题中出现实体词“颜色”时,答案中经常出现“红色”和“黄色”,则认为“红色”和“黄色”的上位词是“颜色”。将本文档来自技高网...

【技术保护点】
1.一种上下位关系的确定方法,其特征在于,所述方法包括:获取第一上位词和所述第一上位词对应的第一下位词集合以及第二上位词和所述第二上位词对应的第二下位词集合;确定所述第一下位词集合与所述第二下位词集合的包含关系;根据所述第一下位词集合与所述第二下位词集合的包含关系确定所述第一上位词和所述第二上位词的上下位关系。

【技术特征摘要】
1.一种上下位关系的确定方法,其特征在于,所述方法包括:获取第一上位词和所述第一上位词对应的第一下位词集合以及第二上位词和所述第二上位词对应的第二下位词集合;确定所述第一下位词集合与所述第二下位词集合的包含关系;根据所述第一下位词集合与所述第二下位词集合的包含关系确定所述第一上位词和所述第二上位词的上下位关系。2.根据权利要求1所述的方法,其特征在于,所述确定所述第一下位词集合与所述第二下位词集合的包含关系,包括:若所述第一下位词集合为所述第二下位词集合的真子集,则确定所述第一下位词集合与所述第二下位词集合的包含关系为第一包含关系;或者,若所述第二下位词集合为所述第一下位词集合的真子集,则确定所述第一下位词集合与所述第二下位词集合的包含关系为第二包含关系。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一下位词集合与所述第二下位词集合的包含关系确定所述第一上位词和所述第二上位词的上下位关系,包括:若所述第一下位词集合与所述第二下位词集合的包含关系为第一包含关系,则所述第一上位词与所述第二上位词的上下位关系为所述第一上位词为所述第二上位词的下位词;所述第二上位词为所述第一上位词的上位词;或者,若所述第一下位词集合与所述第二下位词集合的包含关系为第二包含关系,则确定所述第一上位词与所述第二上位词的上下位关系为所述第一上位词为所述第二上位词的上位词;所述第二上位词为所述第一上位词的下位词。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:在预先确定的知识库中获取所述第一上位词对应的第一属性集合和所述第二上位词对应的第二属性集合;若所述第一属性集合与所述第二属性集合的交集不为空,则确定所述第一属性集合与所述第二属性集合的交集属性;确定所述交集属性与所述第一上位词的上下位关系;根据所述交集属性与所述第一上位词的上下位关系确定所述交集属性与所述第二上位词的上下位关系;所述交集属性与所述第一上位词的上下位关系和所述交集属性与所述第二上位词的上下位关系相同。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:计算所述第一上位词对应的第一上位词向量与第一目标词对应的第一目标词向量的夹角以及所述第二上位词对应的第二上位词向量与第二目标词对应的第二目标词向量的夹角;若所述第一上位词向量与所述第一目标词向量的夹角和所述第二上位词向量与所述第二目标词向量的夹角在预先设置的夹角范围内,则确定所述第一上位词与所述第一目标词的上下位关系;根据所述第一上位词与所述第一目标词的上下位关系确定所述第二上位词与所述第二目标词;所述第一上位词与所述第一目标词的上下位关系和所述第二上位词与所述第二目标词的上下位关系相同。6.一种上下位关系的确定装置,其特征在于,所述装置包括:获取模块和确定模块;其中,所述获取模块,用于获取第一上位词和所述第一上位词对应的第一下位词集合以及第二上位词和所...

【专利技术属性】
技术研发人员:丁宇辰时迎超
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1