实体识别模型训练方法、实体识别的方法及系统技术方案

技术编号：34817326 阅读：19 留言：0更新日期：2022-09-03 20:27

本发明专利技术公开一种实体识别模型训练方法，实体识别的方法及系统。其实体识别模型训练方法包括：S1:构建实体识别模型，所述实体识别模型包括第一神经网路和第二神经网路；S2:对第一神经网络进行离线预测；S3:加载第一神经网络的预测结果和第二神经网络；S4:对第二神经网络进行压缩处理；S5:计算第一神经网络离线预测的logits的损失和第二神经网络在线预测的logits的损失；S6:计算第二神经网络的总损失，根据总损失更新第二神经网络参数。本申请先以离线的方式对第一神经网络进行预测，保留特征，再训练第二神经网络，大大减少了硬件的计算成本。算成本。算成本。

全部详细技术资料下载

【技术实现步骤摘要】
实体识别模型训练方法、实体识别的方法及系统

[0001]本专利技术涉及人工智能
，尤其涉及一种实体识别模型训练方法、实体识别的方法及系统。

技术介绍

[0002]自然语言处理(NLP，Natural Language Processing)是研究人与计算机交互的语言问题的一门学科。按照技术实现难度的不同，这类系统可以分成简单匹配式、模糊匹配式和段落理解式三种类型。
[0003]构成NLP的重要技术之一为知识抽取，知识抽取中主要包括三个核心子任务：实体识别、关系抽取以及事件抽取。
[0004]实体识别是信息提取、问答系统、句法分析、机器翻译、数据标注等应用领域的重要基础工具，在自然语言处理技术走向实用化的过程中占有重要地位。
[0005]目前针对实体识别的解决方案中，都是构建复杂的实体识别模型来实现，需要大量的GPU显卡资源，当构建的实体识别模型过于复杂的时候，势必会消耗大量的硬件成本。

技术实现思路

[0006]本专利技术为解决现有技术中存在的技术问题，提出一种实体识别模型训练方法，包括步骤：
[0007]S1:构建实体识别模型，所述实体识别模型包括第一神经网路和第二神经网路；
[0008]S2:对第一神经网络进行离线预测：将训练数据输入第一神经网路，得到第一神经网络的输出层的特征，并保存预测的每个样本的logits：
[0009]S3:加载第一神经网络的预测结果和第二神经网络；
[0010]S4:对第二神经网络进行压缩处理；
[0...

【技术保护点】

【技术特征摘要】
1.一种实体识别模型训练方法，其特征是，包括步骤：S1:构建实体识别模型，所述实体识别模型包括第一神经网路和第二神经网路；S2:对第一神经网络进行离线预测：将训练数据输入第一神经网路，得到第一神经网络的输出层的特征，并保存预测的每个样本的logits：S3:加载第一神经网络的预测结果和第二神经网络；S4:对第二神经网络进行压缩处理；S5:计算第一神经网络离线预测的logits的损失和第二神经网络在线预测的logits的损失；S6:计算第二神经网络的总损失，根据总损失更新第二神经网络参数。2.如权利要求1所述的实体识别模型训练方法，其特征是，第二神经网络的总损失为将第一神经网络离线预测的logits的损失、第二神经网络在线预测的logits的损失和交叉熵损失进行加权求和。3.如权利要求1所述的实体识别模型训练方法，其特征是，第一神经网络的模型采用12层transformer的bert构建。4.如权利要求1所述的实体识别模型训练方法，其特征是，第二神经网络的模型采用2层transformer作为特征提取器。5.一种实体识别的方法，包括步骤：接收输入的句子；实体识别模型对输入的句子进行处理；返回输出结果，其特征是，所述神经网络为权利要求1至...

【专利技术属性】
技术研发人员：曾祥云，朱姬渊，
申请(专利权)人：上海易康源医疗健康科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人