实体识别模型的训练方法、装置、设备及介质制造方法及图纸

技术编号：39312665 阅读：8 留言：0更新日期：2023-11-12 15:57

本申请提供了一种实体识别模型的训练方法、装置、设备及介质，涉及人工智能领域。该方法包括：获取样本文本和样本文本的实体标注，实体标注用于表示样本文本的目标实体；调用实体识别模型中的特征提取层对样本文本进行特征提取处理，得到样本文本的标识序列，标识序列中的标识与样本文本的文本内容的文字一一对应；调用实体识别模型中的分类器对标识序列进行实体识别处理，得到预测目标实体，分类器用于识别样本文本中的各个预测目标实体的头部和尾部，预测目标实体存在至少两个，预测目标实体是基于实体识别模型的单轮输出得到的；基于实体标注与预测目标实体之间的误差，对实体识别模型进行训练。该方法可以提高实体识别模型的准确率。模型的准确率。模型的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
实体识别模型的训练方法、装置、设备及介质

[0001]本申请涉及人工智能领域，特别涉及一种实体识别模型的训练方法、装置、设备及介质。

技术介绍

[0002]随着科技的发展，每天都会产生大量的文章，为满足不同对象的需求，需要对文章进行分类和匹配，及时为对象提供需要的文章。
[0003]相关技术需要先使用实体识别模型从文本中提取出实体词，然后通过实体识别模型从文本中抽取出特征，例如文本特征(例如文本长度，词性统计情况)，游戏实体特征(例如词性，词长)，文本和实体的交互特征(例如实体是否在新闻标题中出现，实体出现频次等)，然后根据上述特征计算每个实体的得分，取其中得分最高的实体作为关键实体。
[0004]在文本包括多个关键实体的情况下，相关技术需要多次调用实体识别模型，识别实体的效率较低。

技术实现思路

[0005]本申请实施例提供了一种实体识别模型的训练方法、装置、设备及介质，该方法生成的实体识别模型可以一次输出多个目标实体。所述技术方案如下：
[0006]根据本申请的一个方面，提供了一种实体识别模型的训练方法，该方法包括：
[0007]获取样本文本和所述样本文本的实体标注，所述实体标注用于表示所述样本文本的目标实体；
[0008]调用所述实体识别模型中的特征提取层对所述样本文本进行特征提取处理，得到所述样本文本的标识序列，所述标识序列中的标识与所述样本文本的文本内容的文字一一对应；
[0009]调用所述实体识别模型中的分类器对所述标识序列进行实体识别处理，...

【技术保护点】

【技术特征摘要】
1.一种实体识别模型的训练方法，其特征在于，所述方法包括：获取样本文本和所述样本文本的实体标注，所述实体标注用于表示所述样本文本的目标实体；调用所述实体识别模型中的特征提取层对所述样本文本进行特征提取处理，得到所述样本文本的标识序列，所述标识序列中的标识与所述样本文本的文本内容的文字一一对应；调用所述实体识别模型中的分类器对所述标识序列进行实体识别处理，得到预测目标实体，所述分类器用于识别所述样本文本中的各个所述预测目标实体的头部和尾部，所述预测目标实体存在至少两个，所述预测目标实体是基于所述实体识别模型的单轮输出得到的；基于所述实体标注与所述预测目标实体之间的误差，对所述实体识别模型进行训练。2.根据权利要求1所述的方法，其特征在于，所述分类器包括起始分类器和结尾分类器；所述调用所述实体识别模型中的分类器对所述标识序列进行实体识别处理，得到预测目标实体，包括：调用所述起始分类器对所述标识序列进行第一分类处理，得到所述标识序列中的起始标识，所述起始标识是与各个所述预测目标实体的头部对应的标识；调用所述结尾分类器对所述标识序列进行第二分类处理，得到所述标识序列中的结尾标识，所述结尾标识是与各个所述预测目标实体的尾部对应的标识；基于所述起始标识和所述结尾标识确定所述预测目标实体。3.根据权利要求2所述的方法，其特征在于，所述基于所述起始标识和所述结尾标识确定所述预测目标实体，包括：确定位于第i个起始标识后方的j个结尾标识，所述i，j为正整数；根据所述第i个起始标识和所述j个结尾标识之间的文字得到所述预测目标实体。4.根据权利要求1至3任一项所述的方法，其特征在于，所述样本文本包括文本标题和文本内容；所述特征提取层包括编码层和解码层；所述调用所述实体识别模型中的特征提取层对所述样本文本进行特征提取处理，得到所述样本文本的标识序列，包括：获取预设问题；组合所述预设问题、所述文本标题和所述文本内容，得到文本组合；调用所述实体识别模型中的所述编码层对所述文本组合进行编码处理，得到所述样本文本的向量组；调用所述实体识别模型中的所述解码层对所述向量组进行解码处理，得到所述样本文本的所述标识序列。5.根据权利要求4所述的方法，其特征在于，所述向量组包括文字特征向量和频次特征向量，所述文字特征向量用于表示所述样本文本中的文字，所述频次特征向量用于表示所述样本文本中文字的出现频次；所述编码层包括频次编码层和文字编码层；所述调用所述实体识别模型中的所述编码层对所述文本组合进行编码处理，得到所述样本文本的向量组，包括：
调用所述实体识别模型中的所述频次编码层对所述文本组合进行频次编码处理，得到所述频次特征向量；调用所述实体识别模型中的所述文字编码层对所述文本组合进行文字编码处理，得到所述文字特征向量。6.根据权利要求4所述的方法，其特征在于，所述向量组还包括段落特征向量；所述编码层还包括段落编码器；所述调用所述实体识别模型中的所述特征提取层对所述文本组合进行特征提取处理，得到所述样本文本的向量组，包括：为所述文本组合中的所述预设问题赋予第一数值；为所述文本组合中的所述文本标题赋予第二数值；为所述文本组合中的所述文本内容赋予第三数值；其中，所述第一数值、所述第二数值和所述第三数值是不同的值；调用所述实体识别模型中的所述段落编码器对所述文本组合进行编码处理，得到所述段落特征向量。7.根据权利要求4所述的方法，其特征在于，所述向量组还包括位置特征向量，所述位置特征向量用于表示所述样本文本中的文字所在的位置；所述调用所述实体识别模型中的所述...

【专利技术属性】
技术研发人员：黄东晓，刘文强，蒋益巧，
申请(专利权)人：深圳市腾讯信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人