一种实体识别模型训练方法及装置、实体识别方法及装置制造方法及图纸

技术编号：36026688 阅读：39 留言：0更新日期：2022-12-21 10:25

本申请提供一种实体识别模型训练方法及装置、实体识别方法及装置，应用于数据处理技术领域，其中，实体识别模型训练方法包括：获取本轮迭代对应的样本实体集；其中，本轮迭代对应的样本实体集根据第一文本表示以及第二文本表示对上轮迭代对应的样本实体集更新得到，第一文本表示为本轮迭代对应的初始实体集中的各个初始实体的文本表示，第二文本表示为上轮迭代对应的样本实体集中的各个样本实体的文本表示；根据本轮迭代对应的样本实体集对上轮迭代对应的实体识别模型进行训练，得到本轮迭代对应的实体识别模型。因此，在本申请实施例中，训练使用的样本数据无需人工标注便可以自动得到，从而可以减少训练过程中人工标注造成的成本。成的成本。成的成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种实体识别模型训练方法及装置、实体识别方法及装置

[0001]本申请涉及数据处理
，具体而言，涉及一种实体识别模型训练方法及装置、实体识别方法及装置。

技术介绍

[0002]命名实体识别是自然语言处理领域的热点研究方向之一，目的是从非结构化文本中识别出所需的实体和类型，其识别得到的结果可以应用于实体关系抽取、知识图谱构建等下游任务。在现有技术中，一般采用有监督的识别方法，但是采用该种方法，在对实体识别模型进行训练时需要大量人工标注的、具有领域特定性的语料和标签，导致训练成本较高且训练得到的实体识别模型的应用场景较少。

技术实现思路

[0003]本申请实施例的目的在于提供一种实体识别模型训练方法及装置、实体识别方法及装置，用以解决现有技术中对实体识别模型进行训练的训练成本较高且训练得到的实体识别模型的应用场景较少的技术问题。
[0004]第一方面，本申请实施例提供一种实体识别模型训练方法，包括：获取本轮迭代对应的样本实体集；其中，所述本轮迭代对应的样本实体集根据第一文本表示以及第二文本表示对上轮迭代对应的样本实体集更新得到，所述第一文本表示为所述本轮迭代对应的初始实体集中的各个初始实体的文本表示，所述第二文本表示为所述上轮迭代对应的样本实体集中的各个样本实体的文本表示；根据所述本轮迭代对应的样本实体集对上轮迭代对应的实体识别模型进行训练，得到本轮迭代对应的实体识别模型。在上述方案中，通过初始实体集中的各个初始实体对应的文本表示从初始实体集中筛选得到样本实体集，并利用上述筛选得到的样本实体...

【技术保护点】

【技术特征摘要】
1.一种实体识别模型训练方法，其特征在于，包括：获取本轮迭代对应的样本实体集；其中，所述本轮迭代对应的样本实体集根据第一文本表示以及第二文本表示对上轮迭代对应的样本实体集更新得到，所述第一文本表示为所述本轮迭代对应的初始实体集中的各个初始实体的文本表示，所述第二文本表示为所述上轮迭代对应的样本实体集中的各个样本实体的文本表示；根据所述本轮迭代对应的样本实体集对上轮迭代对应的实体识别模型进行训练，得到本轮迭代对应的实体识别模型。2.根据权利要求1所述的实体识别模型训练方法，其特征在于，所述获取本轮迭代对应的样本实体集，包括：获取所述本轮迭代对应的初始实体集；将所述本轮迭代对应的初始实体集以及所述上轮迭代对应的样本实体集输入上轮迭代对应的文本表示模型中，分别得到所述本轮迭代对应的初始实体集中各个初始实体对应的第一文本表示以及所述上轮迭代对应的样本实体集中各个样本实体对应的第二文本表示；根据所述第一文本表示以及所述第二文本表示对所述上轮迭代对应的样本实体集进行更新，得到所述本轮迭代对应的样本实体集。3.根据权利要求2所述的实体识别模型训练方法，其特征在于，所述根据所述第一文本表示以及所述第二文本表示对所述上轮迭代对应的样本实体集进行更新，得到所述本轮迭代对应的样本实体集，包括：针对所述本轮迭代对应的初始实体集中的一个初始实体以及所述上轮迭代对应的样本实体集中与该初始实体的类别相同的样本实体子集，根据该初始实体对应的第一文本表示与该样本实体子集对应的第二文本表示计算该初始实体对应的实体置信度；若所述实体置信度大于实体阈值，将该初始实体加入所述上轮迭代对应的样本实体集中。4.根据权利要求3所述的实体识别模型训练方法，其特征在于，所述根据该初始实体对应的第一文本表示与该样本实体子集对应的第二文本表示计算该初始实体对应的实体置信度，包括：计算该初始实体对应的第一文本表示与该样本实体子集中的各个样本实体对应的第二文本表示之间的多个余弦相似度；将多个预先相似度中的最大值确定为所述实体置信度。5.根据权利要求3所述的实体识别模型训练方法，其特征在于，所述根据该初始实体对应的第一文本表示与该样本实体子集对应的第二文本表示计算该初始实体对应的实体置信度，包括：计算该初始实体对应的第一文本表示与该样本实体子集中的各个样本实体对应的第二文本表示之间的多个余弦相似度；将多个余弦相似度中的最大值确定为该初始实体对应的局部分数；计算该初始实体对应的第一文本表示与该样本实体子集中的各个样本实体对应的第二文本表示之间的全局分数；根据所述局部分数以及所述全局分数计算所述实体置信度。
6.根据权利要求5所述的实体识别模型训练方...

【专利技术属性】
技术研发人员：穆晶晶，李健铨，胡加明，
申请(专利权)人：鼎富智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人