实体抽取模型的训练方法、实体关系抽取方法及装置制造方法及图纸

技术编号：36191847 阅读：15 留言：0更新日期：2022-12-31 21:09

本申请提供一种实体抽取模型的训练方法、实体关系抽取方法及装置，其中实体抽取模型的训练方法包括：确定训练样本集的实体特征和词性特征，将训练样本集输入至初始抽取模型，通过特征抽取层获取到训练样本集的字符特征后，融合训练样本集的字符特征、实体特征和词性特征等不同的底层特征，共同对初始抽取模型进行训练，丰富了初始抽取模型在学习训练样本集中的样本文本时的依赖信息，减少了训练样本集的误差积累，增强训练完成的实体抽取模型的迁移能力，并且融合不同的底层特征，扩大了特征表示的差异性，提高了训练完成的实体抽取模型的抽取能力。抽取能力。抽取能力。

全部详细技术资料下载

【技术实现步骤摘要】
实体抽取模型的训练方法、实体关系抽取方法及装置

[0001]本申请涉及自然语言处理
，特别涉及一种实体抽取模型的训练方法，一种实体关系抽取方法，一种实体抽取模型的训练装置，一种实体关系抽取装置，一种计算设备，以及一种计算机存储介质。

技术介绍

[0002]命名实体识别(NER)是指从输入文本中抽取出具有特定意义的或指代性强的实体，是自然语言处理中一个非常重要的任务，其在文本信息理解、知识问答、检索、图谱构建等诸多场景中有着广泛的应用。目前，在进行命名实体识别时，除了需要从输入文本中抽取出具有特定意义的或指代性强的实体，以及该实体的实体类型外，还可能需要抽取各个实体之间的实体关系。
[0003]现有技术中，往往是通过预训练语言模型的编码层获取输入文本的语义信息，将该语义信息直接作为词嵌入特征，输入线性网络得到输入文本中的实体信息，然后再对实体信息进行语义编码，基于语义信息和实体信息两两联合判断实体之间的关系。
[0004]然而，上述实体关系抽取方法中，仅仅是基于输入文本的语义信息和实体信息联合判断实体之间的关系，抽取实体关系中依赖的底层信息较少，导致实体关系抽取的准确性较差。因此，如何提供更准确的实体关系抽取方法就成为技术人员亟待解决的问题。

技术实现思路

[0005]有鉴于此，本申请实施例提供了一种实体抽取模型的训练方法、实体关系抽取方法及装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的技术缺陷。
[0006]根据本申请实施例的第一方面，提供了一种实...

【技术保护点】

【技术特征摘要】
1.一种实体抽取模型的训练方法，其特征在于，包括：获取训练样本集，并确定所述训练样本集的实体特征和词性特征，其中，所述训练样本集包括至少一个样本文本；将所述训练样本集输入初始实体抽取模型中的特征抽取层，获得所述训练样本集中各个样本文本对应的字符特征；根据所述字符特征、所述实体特征和所述词性特征，调整所述初始实体抽取模型的模型参数，并返回执行所述获取训练样本集的操作步骤，直至达到训练停止条件，获得训练完成的实体抽取模型。2.根据权利要求1所述的实体抽取模型的训练方法，其特征在于，所述确定所述训练样本集的实体特征和词性特征，包括：根据所述训练样本集中各个样本文本包括的第一样本实体，构建预设实体词典，并确定所述预设实体词典对应的实体特征；对所述训练样本集中各个样本文本进行词性标注，并根据所述词性标注确定所述训练样本集的词性特征。3.根据权利要求2所述的实体抽取模型的训练方法，其特征在于，所述根据所述训练样本集中各个样本文本包括的第一样本实体，构建预设实体词典，并确定所述预设实体词典对应的实体特征，包括：抽取所述训练样本集中各个样本文本包括的第一样本实体，并统计各个第一样本实体出现的频数，选择频数大于频数阈值的目标样本实体构建所述预设实体词典；针对所述预设实体词典中的每个目标样本实体，查询预设词向量表，获取所述目标样本实体对应的词向量；通过特征融合网络融合所述各个目标样本实体对应的词向量，获得所述预设实体词典对应的实体特征。4.根据权利要求2所述的实体抽取模型的训练方法，其特征在于，所述对所述训练样本集中各个样本文本进行词性标注，并根据所述词性标注确定所述训练样本集的词性特征，包括：通过词性标注工具对所述训练样本集中各个样本文本进行词性标注，获得所述训练样本集中各个样本文本包括的各个词语的词性；基于预设编码规则对所述各个词语的词性进行编码，获得所述各个词语的词性向量；将所述各个词语的词性向量作为所述训练样本集的词性特征。5.根据权利要求1
‑
4任一项所述的实体抽取模型的训练方法，其特征在于，所述将所述训练样本集输入初始实体抽取模型中的特征抽取层，获得所述训练样本集中各个样本文本对应的字符特征，包括：将第一样本文本中的字符映射至预设字符库中对应的位置，获得所述第一样本文本的编码特征，其中，所述第一样本文本是所述训练样本集包括的任一样本文本；将所述编码特征输入初始实体抽取模型中的特征抽取层，获得所述第一样本文本对应的字符特征。6.根据权利要求1
‑
4任一项所述的实体抽取模型的训练方法，其特征在于，每个所述样本文本携带第一样本实体对应的实体类型标签；
所述根据所述字符特征、所述实体特征和所述词性特征，调整所述初始实体抽取模型的模型参数，包括：将所述各个样本文本对应的字符特征与所述实体特征、所述词性特征进行融合，获得所述训练样本集中各个样本文本的融合特征表示；将所述融合特征表示输入所述初始实体抽取模型中的实体识别层，获得所述初始实体抽取模型输出的预测实体类型；基于所述预测实体类型和所述实体类型标签，计算所述初始实体抽取模型的第一损失值，基于所述第一损失值，反向调整所述初始实体抽取模型的模型参数。7.根据权利要求6所述的实体抽取模型的训练方法，其特征在于，所述将所述各个样本文本对应的字符特征与所述实体特征、所述词性特征进行融合，获得所述训练样本集中各个样本文本的融合特征表示，包括：针对第一样本文本包括的第一字符的字符特征，将所述第一字符的字符特征与所述实体特征、所述第一字符的词性特征进行融合，获得所述第一字符的融合特征表示，其中，所述第一样本文本为所述训练样本集中的任一样本文本，所述第一字符为所述第一样本文本包括的任一字符；将第一样本文本包括的各个字符的融合特征表示作为所述第一样本文本的融合特征表示。8.根据权利要求6所述的实体抽取模型的训练方法，其特征在于，所述初始实体抽取模型还包括特征分析层；所述将所述融合特征表示输入所述初始实体抽取模型中的实体识别层，获得所述初始实体抽取模型输出的预测实体类型之前，还包括：将所述融合特征表示输入所述初始实体抽取模型中的特征分析层，获得所述各个样本文本对应的隐层表示；所述将所述融合特征表示输入所述初始实体抽取模型中的实体识别层，获得所述初始实体抽取模型输出的预测实体类型，包括：将所述隐层表示输入所述初始实体抽取模型中的实体识别层，获得所述初始实体抽取模型输出的预测实体类型。9.一种实体关系抽取方法，其特征在于，包括：将待抽取文本输入实体抽取模型，获得所述待抽取文本包括的各个目标实体以及对应的实体标注信息，其中，所述实体抽取模型为通过上述权利要求1
‑
8任一项所述的实体抽取模型的训练方法训练得到；将所述各个目标实体以及对应的实体标注信息输入关系抽取模型，获得所述各个目标实体之间的目标实体关系。10.根据权利要求9所述的实体关系抽取方法，其特征在于，所述将所述各个目标实体以及对应的实体标注信息输入关系抽取模型，获得所述各个目标实体之间的目标实体关系，包括：将所述各个目标实体以及对应的实体标注信息输入关系抽取模型的特征抽取层，获得所述各个目标实体中各个字符的字符语义向量，以及各个字符对应的实体标注信息的标注语义向量；
根据所述各个目标实体的所述字符语义向量和所述标注语义向量，确定所述各个目标实...

【专利技术属性】
技术研发人员：潘璋，李小龙，李长亮，
申请(专利权)人：北京金山数字娱乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人