The embodiment of this application provides a method, device, device and storage medium for extracting semantic relations, obtaining multiple candidate relationships among entities by extracting from text; searching text evidence including the candidate relationships among entities from information sources for each candidate relationship; and searching text evidence corresponding to each candidate relationship from the plurality of entities based on the number of text evidence corresponding to each candidate relationship obtained by searching. The actual relationship between the entities is determined in the candidate relationship. The technical scheme provided in the embodiment of this application can improve the reliability of semantic relation extraction.
【技术实现步骤摘要】
语义关系的抽取方法、装置、设备及存储介质
本申请实施例涉及人工智能
,尤其涉及一种语义关系的抽取方法、装置、设备及存储介质。
技术介绍
随着互联网的快速普及,网络信息呈爆炸式增长,采用信息抽取技术从文本中自动抽取结构化信息可以极大地提升人们获取信息的效率。关系抽取旨在基于文本的上下文信息从文本中抽取实体间的语义关系,是信息抽取的主要任务之一。然而,在文本中,由于一些特定关系的上下文信息严重不足,导致在关系分类时容易产生歧义,进而影响关系抽取的可靠性。
技术实现思路
本申请实施例提供一种语义关系的抽取方法、装置、设备及存储介质,用以提高语义关系抽取的可靠性,避免上下文信息缺失对语义关系抽取造成影响。本申请实施例第一方面提供一种语义关系的抽取方法,包括:从文本中抽取获得实体间的多个候选关系;针对每个候选关系,从信息源中查找包括所述实体间的所述候选关系的文本证据;基于查找获得的各候选关系对应的文本证据的数量,从所述多个候选关系中确定出所述实体间的实际关系。本申请实施例第二方面提供一种语义关系抽取装置,包括:抽取模块,用于从文本中抽取获得实体间的多个候选关系;证据查找模块,用于针对每个候选关系,从信息源中查找包括所述实体间的所述候选关系的文本证据;确定模块,用于基于查找获得的各候选关系对应的文本证据的数量,从所述多个候选关系中确定出所述实体间的实际关系。本申请实施例第三方面提供一种计算机设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器执行如上述第一方面所述的方法。本申请实施例 ...
【技术保护点】
1.一种语义关系的抽取方法,其特征在于,包括:从文本中抽取获得实体间的多个候选关系;针对每个候选关系,从信息源中查找包括所述实体间的所述候选关系的文本证据;基于查找获得的各候选关系对应的文本证据的数量,从所述多个候选关系中确定出所述实体间的实际关系。
【技术特征摘要】
1.一种语义关系的抽取方法,其特征在于,包括:从文本中抽取获得实体间的多个候选关系;针对每个候选关系,从信息源中查找包括所述实体间的所述候选关系的文本证据;基于查找获得的各候选关系对应的文本证据的数量,从所述多个候选关系中确定出所述实体间的实际关系。2.根据权利要求1所述的方法,其特征在于,所述针对每个候选关系,从信息源中查找包括所述实体间的所述候选关系的文本证据,包括:针对每个候选关系所属的关系类型,构建所述实体间符合所述关系类型的关系式;基于各候选关系对应的所述关系式,从信息源中查找各候选关系对应的文本证据。3.根据权利要求2所述的方法,其特征在于,所述基于各候选关系对应的所述关系式,从信息源中查找各候选关系对应的文本证据,包括:记录并判断基于当前关系式的查找次数;若当前关系式的查找次数达到预设次数,则在下一次查找操作中基于另一关系式查找文本证据;若当前关系式的查找次数未达到预设次数,则在下一次查找操作中继续基于当前关系式查找文本证据。4.根据权利要求2所述的方法,其特征在于,所述基于各候选关系对应的所述关系式,从信息源中查找各候选关系对应的文本证据,包括:判断本次查找操作获取到的文本证据的数量是否低于预设数量;若本次查找操作获取到的文本证据的数量高于预设数量,则在下一次查找操作中继续基于当前关系式查找文本证据;若本次查找操作获取到的文本证据的数量低于预设数量,则在下一次查找操作中基于另一关系式查找文本证据。5.根据权利要求2所述的方法,其特征在于,所述基于各候选关系对应的所述关系式,从信息源中查找各候选关系对应的文本证据,包括:根据当前关系式的查找次数和查找到的文本证据的数量,采用预设的马尔可夫决策MDP模型,确定下一次查找操作所对应的关系式或者结束所有查找操作。6.根据权利要求5所述的方法,其特征在于,所述根据当前关系式的查找次数和查找到的文本证据的数量,采用预设的马尔可夫决策MDP模型,确定下一次查找操作所对应的关系式或者结束所有查找操作,包括:根据本次查找操作获取到的文本证据的数量在本次查找结果中所占据的比例,确定本次查找操作对当前所对应的候选关系的置信度的提升量;根据当前关系式的查找次数和所述提升量,采用预设的马尔可夫决策MDP模型,确定下一次查找操作所对应的关系式或者结束所有查找操作。7.根据权利要求1所述的方法,其特征在于,所述基于查找获得的各候选关系对应的文本证据的数量,从所述多个候选关系中确定出所述实体间的实际关系,包括:根据查找到的各候选关系对应的文本证据的数量在所有文本证据中占据的比例,确定各候选关系的置信度,将所述多个候选关系中置信度最高的确定为所述实体间的实际关系。8.一种语义关系抽取装置,其特征在于,包括:抽取模...
【专利技术属性】
技术研发人员:潘禄,陈玉光,彭卫华,罗雨,陈亮,陈文浩,周辉,郑宇宏,陈伟娜,韩翠云,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。