动词短语蕴含图谱的构建方法及相关设备技术

技术编号:26891383 阅读:28 留言:0更新日期:2020-12-29 16:09
本公开提供了一种动词短语蕴含图谱的构建方法及装置、计算机可读存储介质、电子设备。该方法包括:获取目标语料;从所述目标语料中抽取第一动词短语;拆解所述第一动词短语,获得第一动词和第一名词;获得与所述第一名词具有蕴含关系的第二名词;获得与所述第一动词具有蕴含关系的第二动词;根据所述第一名词、所述第二名词、所述第一动词和所述第二动词组合获得第二动词短语;将所述第一动词短语和所述第二动词短语作为第一图谱中的节点,生成具有蕴含推理关系的所述第一图谱。通过本公开实施例提供的技术方案,可以实现高效构建高准确率的动词短语蕴含图谱,属于人工智能领域的自然语言处理技术。

【技术实现步骤摘要】
动词短语蕴含图谱的构建方法及相关设备
本公开涉及计算机
,具体而言,涉及一种动词短语蕴含图谱的构建方法及装置、计算机可读存储介质、电子设备。
技术介绍
人工智能(ArtificialIntelligence,AI)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。知识表示是人工智能范畴中重要而且基础的技术,对于人类和机器理解和认知世界都发挥着重要的作用。其中知识图谱(KnowledgeGraph,KG)作为目前最广泛使用的知识表示的一种技术,将现实生活中的实体、属性、概念等作为有语义信息的节点,以及它们之间的关系作为边构建出巨大的语义网络。在此之上,可以基于定义的推理规则,推导出没有显式给出的知识从而补全知识图谱或者帮助自然语言处理(NaturalLanguageProcessing,NLP)的相关任务。...

【技术保护点】
1.一种动词短语蕴含图谱的构建方法,其特征在于,包括:/n获取目标语料;/n从所述目标语料中抽取第一动词短语;/n拆解所述第一动词短语,获得第一动词和第一名词;/n获得与所述第一名词具有蕴含关系的第二名词;/n获得与所述第一动词具有蕴含关系的第二动词;/n根据所述第一名词、所述第二名词、所述第一动词和所述第二动词组合获得第二动词短语;/n将所述第一动词短语和所述第二动词短语作为第一图谱中的节点,生成具有蕴含推理关系的所述第一图谱。/n

【技术特征摘要】
1.一种动词短语蕴含图谱的构建方法,其特征在于,包括:
获取目标语料;
从所述目标语料中抽取第一动词短语;
拆解所述第一动词短语,获得第一动词和第一名词;
获得与所述第一名词具有蕴含关系的第二名词;
获得与所述第一动词具有蕴含关系的第二动词;
根据所述第一名词、所述第二名词、所述第一动词和所述第二动词组合获得第二动词短语;
将所述第一动词短语和所述第二动词短语作为第一图谱中的节点,生成具有蕴含推理关系的所述第一图谱。


2.根据权利要求1所述的方法,其特征在于,从所述目标语料中抽取第一动词短语,包括:
对所述目标语料进行预处理,获得待处理句子;
对所述待处理句子进行依存句法分析,获得所述待处理句子的句法解析;
利用根据所述依存句法分析设计的第一动词短语模板,从所述待处理句子的句法解析中抽取获得所述第一动词短语。


3.根据权利要求1所述的方法,其特征在于,从所述目标语料中抽取第一动词短语,包括:
对所述目标语料进行预处理,获得待处理句子;
获得所述待处理句子的语义角色标注;
利用根据所述语义角色标注设计的第二动词短语模板,从所述待处理句子的语义角色标注中抽取获得所述第一动词短语。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述第一动词短语和所述第二动词短语包括主语和谓语;或者,主语、谓语和宾语;或者,主语、谓语、宾语和介词状语;或者,主语、第一类型动词和形容词;或者,主语、系表动词和形容词。


5.根据权利要求4所述的方法,其特征在于,所述第一动词短语和所述第二动词短语还包括因果词。


6.根据权利要求1所述的方法,其特征在于,获得与所述第一名词具有蕴含关系的第二名词,包括:
获得目标名词上下位图谱;
从所述目标名词上下位图谱中查找与所述第一名词具有蕴含关系的所述第二名词;或者,
通过句式规则挖掘获得与所述第一名词具有蕴含关系的所述第二名词。


7.根据权利要求1所述的方法,其特征在于,获得与所述第一动词具有蕴含关系的第二动词,包括:
获得目标动词蕴含关系规则;
根据所述目标动词蕴含关系规则获得所述第一动词的推理动词;
计算所述第一动词和所述推理动词的词向量;
根据所述第一动词和所述推理动词的词向量,计算所述第一动词和所述推理动词之间的相似度;
根据所述第一动词和所述推理动词之间的相似度,从所述推理动词中确定所述第二动词。


8.根据权利要求1所述的方法,其特征在于,根据所述第一名词、所述第二名词、所述第一动词和所述第二动词组合获得第二动词短语,包括:
获得所述第一名词和所述第二名词的共现频率的互信息;
根据所述第一名词和所述第二名词的共现频率的互信息,获得所述第一名词和所述第二名词的名词指标;
计算所述第一动词与所述第二动词之间的目标距离指标;
根据所述第一动词...

【专利技术属性】
技术研发人员:禹常隆张海松
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1