【技术实现步骤摘要】
信息抽取装置、电子设备、存储介质和相关方法
[0001]本申请实施例涉及数据处理
,尤其涉及一种信息抽取装置、电子设备、存储介质和相关方法。
技术介绍
[0002]通用信息抽取(Universal Information Extraction,UIE)是一种按照特定的抽取框架(schema),从给定的一组自由文本中抽取出符合抽取需求的信息结构的技术,所抽取出的信息结构包括实体、关系、事件和观点等。对于同一输入文本,按照不同的抽取框架进行信息抽取会抽取到不同的信息结构。
[0003]目前,针对不同的信息抽取任务对输入文本分别进行编码,进而对编码结果进行解码获得与信息抽取任务相对应的信息结构。比如,针对同一输入文本执行实体抽取任务、关系抽取任务和事件抽取任务时,需要分别针对实体抽取任务、关系抽取任务和事件抽取任务对该输入文本进行编码,然后对针对实体抽取任务的编码结果进行解码获得实体,对针对关系抽取任务的编码结果进行解码获得关系,对针对事件抽取任务的编码结果进行解码获得事件。
[0004]然而,针对同一输入文本执行不同的信息抽取任务时,需要反复对输入文本进行编码,导致信息抽取的效率较低。
技术实现思路
[0005]有鉴于此,本申请实施例提供一种信息抽取装置、电子设备、存储介质和相关方法,以至少部分解决上述问题。
[0006]根据本申请实施例的第一方面,提供了一种信息抽取方法,包括:对输入文本进行编码,获得特征序列,其中,所述特征序列用于指示所述输入文本中至少一个文本片段所属的文 ...
【技术保护点】
【技术特征摘要】
1.一种信息抽取方法,包括:对输入文本进行编码,获得特征序列,其中,所述特征序列用于指示所述输入文本中至少一个文本片段所属的文本片段类型;获取抽取框架,其中,所述抽取框架包括至少一个用于指示文本片段类型的类型信息;根据所述抽取框架,对所述特征序列进行解码,获得所述抽取框架对应的信息抽取结果。2.根据权利要求1所述的方法,其中,所述抽取框架为树状结构,所述树状结构包括一个根节点和至少一个叶子节点,所述叶子节点与所述根节点之间包括至少一个子节点,所述根节点为序列开始标识符,所述叶子节点为序列结束标识符,所述子节点包括所述类型信息。3.根据权利要求2所述的方法,其中,所述根据所述抽取框架,对所述特征序列进行解码,获得所述抽取框架对应的信息抽取结果,包括:根据所述抽取框架中第1级子节点包括的所述类型信息,对所述特征序列进行解码,从所述输入文本中抽取该第1级子节点对应的文本片段;根据所述抽取框架中第i级子节点包括的所述类型信息,及该第i级子节点的至少一个上级子节点对应的文本片段,对所述特征序列进行解码,从所述输入文本中抽取所述第i级子节点对应的文本片段,其中,i为大于或等于2的正整数;根据所述抽取框架中所述子节点的连接关系及对应的文本片段,生成所述抽取框架对应的信息抽取结果。4.根据权利要求3所述的方法,其中,所述方法还包括:若所述输入文本中未包括属于第1级子节点包括的所述类型信息指示的文本片段类型的文本片段,则确定所述第1级子节点对应的文本片段为空;若根据第i级子节点的至少一个上级子节点对应的文本片段,确定所述输入文本中未包括属于所述第i级子节点包括的所述类型信息指示的文本片段类型的文本片段,则确定所述第i级子节点对应的文本片段为空。5.根据权利要求4所述的方法,其中,所述方法还包括:若与所述第i级子节点相连接的第i
‑
1级子节点对应的文本片段被确定为空,则确定所述第i级子节点对应的文本片段为空。6.根据权利要求5所述的方法,其中,所述根据所述抽取框架中所述子节点的连接关系及对应的文本片段,生成所述抽取框架对应的信息抽取结果,包括:从所述子节点中确定对应的文本片段不为空的目标子节点;根据所述抽取框架中所述子节点的连接关系,若所述叶子节点与所述根节点之间存在至少一个所述目标子节点,则根据该叶子节点与所述根节点之间所述目标子节点对应的文本片段,生成该叶子节点对应的信息结构;生成包括所述信息结构的所述信息抽取结果。7.根据权利要求6所述的方法,其中,所述根据该叶子节点与所述根节点之间所述目标子节点对应的文本片段,生成该叶子节点对应的信息结构,包括:对该叶子节点与所述根节点之间至少一个所述目标子节点包括的所述类型信息,及该叶子节点与所述根节点之间的所述目标子节点对应的文本片段进行组合,获得该叶子节点
对应的信息结构。8.一种信息抽取装置,包括:编码器,用于对输入文本进行编码,获得特征序列,其中,所述特征序列用于指示所述输入文本中至少一个文本片段所属的文本片段类型;解码器,用于获取抽取框架,并根...
【专利技术属性】
技术研发人员:赵富邦,康杨杨,孙常龙,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。