一种基于标签推理网络的细粒度实体分类方法技术

技术编号：34039364 阅读：51 留言：0更新日期：2022-07-06 13:06

本发明专利技术公开了一种基于标签推理网络的细粒度实体分类方法，属于自然语言处理技术领域，基于预训练语言模型的上下文相关的实体提及编码器；基于序列到集合生成框架的标签演绎推理机制，结合生成的标签和上下文信息生成新的标签；基于属性网络的标签归纳推理机制，结合已经生成的标签所激活的属性生成新的标签；对应于上述描述的两种推理机制，使用基于集合预测的损失和属性图激活的损失的来优化网络参数。本发明专利技术可以端到端地建模学习和利用标签依存关系，并且可以解决细粒度实体分类中的长尾标签预测问题。尾标签预测问题。尾标签预测问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于标签推理网络的细粒度实体分类方法

[0001]本专利技术涉及一种细粒度实体分类方法，特别是涉及一种基于标签推理网络的细粒度实体分类方法，属于自然语言处理

技术介绍

[0002]细粒度实体分类是信息抽取中的重要任务。给定一个句子并指出其中的实体提及作为输入，细粒度实体分类的目的是结合句子信息对实体提及进行细粒度分类。例如给定输入“他们同市书法协会工作人员一起走了”，其中实体提及为“市书法协会”，需要将“市书法协会”分类为：{“组织”，“社会机构”，“事业单位”，“工作人员”，“职员”}。
[0003]细粒度实体识别任务的重大挑战来自其相互依存、大规模、细粒度的标签集合。其一，实体标签通常会存在复杂的依存结构：层次依存结构和关联依存结构。如图1所示：标签“person”，“musician”，“composer”构成一个三层的分类学结构；而“commander”，“theorist”，“scientist”由于他们共享了“expert”，“scholar”属性，构成了一个关联结构。其二，由于标签集合是大规模、细粒度的，导致标签集合中存在大量长尾标签。比如，在Ultra
‑
Fine数据集中就有大于80％的标签不足5条训练实例，甚至25％的标签没有训练实例。
[0004]已有的方法为了利用标签集合中的依存关系，通常会将标签之间的依存结构作为标签预测限制。然而这些方法需要预先定义的标签依存知识，再用特定的方法编码依存知识，这使得这些方法只能利用有限的依存关系并且难以泛化到新数...

【技术保护点】

【技术特征摘要】
1.一种基于标签推理网络的细粒度实体分类方法，其特征在于，包括以下步骤：给定一个句子，该句子由实体词、上下文、实体标记和句子标记组成，输入到预训练语言模型中，获得句子的源端隐状态表示，将其中句子标记的隐状态表示作为上下文相关的实体提及表示；将源端隐状态和实体提及表示输入到一解码器中，该解码器根据实体提及表示获得目标隐状态，再利用上下文注意力机制根据源端隐状态捕获不同时间步的上下文信息，以及利用前提注意力机制根据目标端隐状态捕获已经生成的标签信息，序列地预测全部实体提及标签，得到标签集合；根据实体提及表示、上下文信息和已经生成的标签信息，通过解码器计算在标签集合上的不同标签的预测概率，并选出每个时间步里预测概率最高的标签作为基于演绎推理生成的标签；将作为预测结果的标签拆分为多个属性，根据属性与标签之间的关系构建属性网络，该属性网络包括一属性图，该属性图包括属性结点和标签结点，以及表示属性结点和标签结点之间关联关系的边；在解码器的每个时间步，通过解码器的隐状态激活属性图中的属性结点；基于属性节点的激活状态和属性与标签之间的关联性，计算标签的激活分数：如果标签的激活份数大于一阈值，则生成标签，并作为基于归纳推理生成的标签；将基于演绎推理生成的标签和基于归纳推理生成的标签作为预测结果的标签集合，并与标准答案的标签集合进行对比，结合集合预测损失函数和属性网络激活损失函数优化上述解码器和属性网络的参数；利用预训练语言模型、优化后的解码器和属性网络来正式处理输入的句子，对句子中的实体进行分类。2.如权利要求1所述的方法，其特征在于，将句子输入预训练语言模型后，句子中的每一个标记和词汇都具有一个隐状态表示。3.如权利要求1所述的方法，其特征在于，预训练语言模型选用BERT模型；基于演绎推理的解码器选...

【专利技术属性】
技术研发人员：刘庆，林鸿宇，肖欣延，韩先培，孙乐，吴华，
申请(专利权)人：中国科学院软件研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人