【技术实现步骤摘要】
信息处理方法和装置
本专利技术涉及计算机
,尤其涉及一种信息处理方法和装置。
技术介绍
从非结构化文本中提取关系三元组(实体-关系-实体)是构建大规模知识图的关键。通常,早期的信息抽取将实体抽取和关系抽取看作串联的任务,这样的串联模型在建模上相对更简单,但这样将实体识别和关系抽取当作两个独立的任务明显会存在以下缺点,1.实体冗余,由于先对抽取的实体进行两两配对,然后再进行关系分类,没有关系的候选实体对所带来的冗余信息,会提升错误率、增加计算复杂度。2.交互缺失,忽略了这两个任务之间的内在联系和依赖关系,从而导致关系抽取任务的结果严重依赖于实体抽取的结果,导致误差累积的问题。针对上述串联模型明显存在的一些问题,近年来有许多工作考虑将实体识别与关系抽取任务进行联合建模。目前联合抽取模型总体上可分为两大类:1、共享参数的联合抽取模型,2、联合解码的联合抽取模型。其中,共享参数的联合抽取模型,通过共享参数(共享输入特征或者内部隐层状态)实现联合,此种方法对子模型没有限制,但是由于使用独立的解码算法,导致实体模型和关系模型之间交互不强。为了加强实体模型和关系模型的交互,联合解码的联合抽取模型被提出来。但是,这种情况下需要对子模型特征的丰富性以及联合解码的精确性之间做权衡:一方面如果设计精确的联合解码算法,往往需要对特征进行限制,例如用条件随机场建模,使用维特比解码算法可以得到全局最优解,但是往往需要限制特征的阶数,导致降低子模型特征的丰富性。另一方面如果使用近似解码算法,比如集束搜索,在特征方面可 ...
【技术保护点】
1.一种信息处理装置,其特征在于,包括数据嵌入模块、特征编码模块和排序过滤模块,其中/n所述数据嵌入模块,用于向量的嵌入,并将嵌入的向量发送给所述特征编码模块进行编码处理;/n所述特征编码模块,用于对所述数据嵌入模块嵌入的向量进行编码处理得到编码向量,并将所述编码向量部分反馈给所述数据嵌入模块进行向量的嵌入,以及将所述编码向量输出给所述排序过滤模块进行处理;/n所述排序过滤模块,用于对所述特征编码模块输出的编码向量进行迭代解码和排序过滤处理,并将迭代解码和排序过滤处理后的表示向量部分发送给所述数据嵌入模块进行向量的嵌入;/n所述嵌入的向量包括所述特征编码模块反馈的编码向量和所述排序过滤模块处理后反馈的表示向量,还包括预先对输入数据进行处理后的字词混合向量和位置信息向量。/n
【技术特征摘要】 【专利技术属性】
1.一种信息处理装置,其特征在于,包括数据嵌入模块、特征编码模块和排序过滤模块,其中
所述数据嵌入模块,用于向量的嵌入,并将嵌入的向量发送给所述特征编码模块进行编码处理;
所述特征编码模块,用于对所述数据嵌入模块嵌入的向量进行编码处理得到编码向量,并将所述编码向量部分反馈给所述数据嵌入模块进行向量的嵌入,以及将所述编码向量输出给所述排序过滤模块进行处理;
所述排序过滤模块,用于对所述特征编码模块输出的编码向量进行迭代解码和排序过滤处理,并将迭代解码和排序过滤处理后的表示向量部分发送给所述数据嵌入模块进行向量的嵌入;
所述嵌入的向量包括所述特征编码模块反馈的编码向量和所述排序过滤模块处理后反馈的表示向量,还包括预先对输入数据进行处理后的字词混合向量和位置信息向量。
2.根据权利要求1所述的装置,其特征在于,所述数据嵌入模块,具体还用于:对所述编码向量进行维度变换,得到一个固定维度大小的编码向量,根据尾实体相对于头实体的相对位置,编码得到位置编码向量,然后将其与前述的固定维度大小的编码向量进行拼接,形成新的编码向量,之后,将新的编码向量与所述字词混合向量和位置信息向量共用融入到同一个嵌入层,并发送给所述特征编码模块。
3.根据权利要求1所述的装置,其特征在于,所述排序过滤模块包括:
迭代解码单元:用于对所述特征编码模块输出的编码向量进行迭代解码处理,并将迭代解码处理后的表示向量发送给打分单元;
打分单元:用于通过打分函数对所述表示向量进行置信度计算;
过滤单元:用于根据所述表示向量的置信度,选择出置信度大于置信度阈值的表示向量,并且将每个选择出的表示向量与其他已经选择出的表示向量进行相似度比较,并将相似度小于相似度阈值的表示向量发送给控制开关;
控制开关:用于控制所述过滤单元过滤后的表示向量发送给所述数据输入模块进行向量的嵌入;以及控制所述特征编码模块输出的编码向量直接进入特征解码模块进行特征解码。
4.根据权利要求1-3中任一项所述的装置,其特征在于,还包括:
特征解码模块,用于将排序过滤模块处理后的表示向量经过自注意力机制进行序列变换,将序列变换后的解码向量经过神经网络模型进行解码并输出。
技术研发人员:蔡华,
申请(专利权)人:华院数据技术上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。