【技术实现步骤摘要】
信息抽取方法及其装置
[0001]本申请涉及人工智能领域,尤其涉及自然语言处理(Natural Language Processing,NLP)及深度学习等技术,特别地涉及一种信息抽取方法及其装置。
技术介绍
[0002]信息抽取是指从自然语言文本中抽取指定类型的实体、关系、事件等事实信息,并形成结构化数据输出的文本处理技术。信息抽取是从文本数据中抽取特定信息的一种技术。文本数据是由一些具体的单位构成的,例如句子、段落、篇章,文本信息正是由一些小的具体的单位构成的,例如字、词、词组、句子、段落或是这些具体的单位的组合。抽取文本数据中的名词短语、人名、地名等都是文本信息抽取,当然,文本信息抽取技术所抽取的信息可以是各种类型的信息。
[0003]相关技术中,通常需要将文本数据进行语义化表达以得到该文本数据的语义特征表示,利用该语义特征表示对该文本数据进行信息抽取。因此,如何获取更加准确的语义特征表示以提升信息抽取效果,是亟待解决的问题。
技术实现思路
[0004]本申请提供了一种信息抽取、装置、电子设备以及存储介质。
[0005]根据本申请的第一方面,提供了一种信息抽取方法,包括:
[0006]获取待处理文本的特征向量以及所述待处理文本的依存关系图;
[0007]根据所述依存关系图生成对应的距离矩阵;
[0008]根据所述待处理文本的特征向量和所述距离矩阵,采用注意力机制计算所述待处理文本之中任意两个词之间的注意力值;
[0009]根据所述待处理文本的特征向 ...
【技术保护点】
【技术特征摘要】
1.一种信息抽取方法,包括:获取待处理文本的特征向量以及所述待处理文本的依存关系图;根据所述依存关系图生成对应的距离矩阵;根据所述待处理文本的特征向量和所述距离矩阵,采用注意力机制计算所述待处理文本之中任意两个词之间的注意力值;根据所述待处理文本的特征向量和所述待处理文本之中任意两个词之间的注意力值,获取所述待处理文本的语义特征表示;根据所述待处理文本的语义特征表示对所述待处理文本进行信息抽取。2.如权利要求1所述的方法,其中,所述根据所述依存关系图生成对应的距离矩阵,包括:根据所述依存关系图生成对应的邻接矩阵;根据所述依存关系图中节点在所述待处理文本中的位置信息,对所述邻接矩阵进行稠密化处理,以得到所述距离矩阵。3.如权利要求2所述的方法,其中,所述根据所述依存关系图中节点在所述待处理文本中的位置信息,对所述邻接矩阵进行稠密化处理,以得到所述距离矩阵,包括:确定所述依存关系图中节点所对应的词在所述待处理文本中的位置信息;在所述依存关系图之中两个节点之间未存在依存关系的情况下,根据所述位置信息确定所述两个节点各自对应的词在所述待处理文本中的距离值,并将所述邻接矩阵之中用以表示所述两个节点间的距离值,设置为所述两个节点各自对应的词在所述待处理文本中的距离值;在所述依存关系图之中两个节点之间存在依存关系的情况下,将所述邻接矩阵之中用以表示所述两个节点间的距离值设置为第一数值,以得到所述距离矩阵。4.如权利要求1所述的方法,其中,所述根据所述待处理文本的特征向量和所述距离矩阵,采用注意力机制计算所述待处理文本之中任意两个词之间的注意力值,包括:根据所述待处理文本的特征向量,确定查询向量和键向量;根据所述查询向量和所述键向量进行双仿射计算,以得到第一中间矩阵,并将所述查询向量和所述键向量进行矩阵相乘运算,以得到第二中间矩阵;根据所述距离矩阵对所述第一中间矩阵中的数据进行修正,以得到第三中间矩阵;将所述第二中间矩阵和所述第三中间矩阵进行矩阵相加运算,以得到第四中间矩阵;对所述第四中间矩阵进行按比缩放、遮掩和回归函数Softmax运算,以得到所述待处理文本之中任意两个词之间的注意力值。5.如权利要求4所述的方法,其中,所述根据所述距离矩阵对所述第一中间矩阵中的数据进行修正,以得到第三中间矩阵,包括:将所述第一中间矩阵中的数据与所述距离矩阵之中对应位置上的数据进行相除运算,以得到第三中间矩阵。6.如权利要求1所述的方法,其中,所述根据所述待处理文本的特征向量和所述距离矩阵,采用注意力机制计算所述待处理文本之中任意两个词之间的注意力值,包括:根据所述待处理文本的特征向量,确定查询向量和键向量;根据所述查询向量和所述键向量进行双仿射计算,以得到第一中间矩阵,并将所述查
询向量和所述键向量进行矩阵相乘运算,以得到第二中间矩阵;根据将所述第一中间矩阵和所述第二中间矩阵进行矩阵相加运算,以得到第三中间矩阵;对所述第三中间矩阵进行按比缩放、遮掩和回归函数Softmax运算,以得到对应的注意力矩阵;根据所述距离矩阵对所述注意力矩阵中的数据进行修正和归一化处理,以得到所述待处理文本之中任意两个词之间的注意力值。7.如权利要求6所述的方法,其中,所述根据所述距离矩阵对所述注意力矩阵中的数据进行修正和归一化处理,以得到所述待处理文本之中任意两个词之间的注意力值,包括:将注意力矩阵中的数据与所述距离矩阵之中对应位置上的数据进行相除运算,以得到第四中间矩阵;对所述第四中间矩阵中的数据进行归一化处理,以得到所述待处理文本之中任意两个词之间的注意力值。8.如权利要求1至7中任一项所述的方法,其中,所述根据所述待处理文本的特征向量和所述待处理文本之中任意两个词之间的注意力值,获取所述待处理文本的语义特征表示,包括:根据待处理文本的特征向量,确定值向量;将所述值向量和所述待处理文本之中任意两个词之间的注意力值进行乘积运算,以得到所述待处理文本的语义特征表示。9.如权利要求1至7中任一项所述的方法,其中,所述根据所述待处理文本的语义特征表示对所述待处理文本进行信息抽取,包括:基于所述语义特征表示对所述待处理文本进行实体识别,以得到所述待处理文本中的识别的实体信息。10.一种信息...
【专利技术属性】
技术研发人员:陈庆洋,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。