【技术实现步骤摘要】
本申请涉及自然语言处理领域,特别是涉及一种针对于实体及实体关系的联合抽取方法、装置及存储介质。
技术介绍
1、在自然语言处理任务中,实体识别及实体关系抽取是构建知识图谱的关键技术。知识图谱可以分为模式层和数据层两个层次。其中,模式层定义了知识图谱中存储的实体类型和实体关系类型,而数据层则存储着实际的知识信息,通常以三元组的形式构成。
2、由于模式层的构建首先要明确实体以及实体关系,因此在知识抽取阶段,需要根据模式层的要求,从相应的待处理文本信息中提取出非结构化数据和结构化数据。对于结构化数据,可以使用python自动化脚本来提取实体以及实体关系,而对于非结构化数据,现有的一般利用模型从非结构化数据中提取实体以及实体关系。
3、但是在识别待处理文本信息中的实体,并抽取实体之间的实体关系的过程中,由于基于crf层所生成的标签向量(与输入至模型中的待处理文本信息对应)之间较为独立,并没有考虑标签向量之间的语义关联性,从而基于模型所得到的实体关系不能很好地体现出实体之间的关联性,并且会影响语境、语义以及上下文关系的表征,
...【技术保护点】
1.一种针对于实体及实体关系的联合抽取方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,基于所述待处理文本信息,确定分别与所述待处理文本信息中的各个词语对应的第一词向量的操作,包括:
3.根据权利要求2所述的方法,其特征在于,基于所述多个拼接向量,确定所述待处理文本信息的实体之间的实体关系的操作,包括:
4.根据权利要求3所述的方法,其特征在于,基于所述多个拼接向量,确定所述待处理文本信息的实体之间的实体关系概率值的操作,包括:
5.根据权利要求4所述的方法,其特征在于,基于所述实体关系概率值以及预设阈
...【技术特征摘要】
1.一种针对于实体及实体关系的联合抽取方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,基于所述待处理文本信息,确定分别与所述待处理文本信息中的各个词语对应的第一词向量的操作,包括:
3.根据权利要求2所述的方法,其特征在于,基于所述多个拼接向量,确定所述待处理文本信息的实体之间的实体关系的操作,包括:
4.根据权利要求3所述的方法,其特征在于,基于所述多个拼接向量,确定所述待处理文本信息的实体之间的实体关系概率值的操作,包括:
5.根据权利要求4所述的方法,其特征在于,基于...
【专利技术属性】
技术研发人员:张丽玮,张士运,包蓝鑫,类淑霞,张京,乔剑锋,周晓磊,闫瑾,
申请(专利权)人:首都经济贸易大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。