模型训练方法、文本标注方法、文本标注装置及存储介质制造方法及图纸

技术编号:41133458 阅读:13 留言:0更新日期:2024-04-30 18:04
本申请提出一种基于文本标注的模型训练方法、文本标注方法、文本标注装置以及计算机存储介质。所述模型训练方法包括:获取各个预设标签的表示向量;遍历输入文本的每个字,获取每一个长度小于预设阈值的文本片段;通过文本标注模型的片段编码模块获取输入文本中各个文本片段的表示向量;通过文本标注模型的片段标注模块计算各个预设标签的表示向量和各个文本片段的表示向量的相似性;通过片段标注模块给每一文本片段配置相似性最大的预设标签作为预测标签;基于每一文本片段的预测标签和真实标签对文本标注模型进行训练。通过上述方法,利用实体标签蕴含的语义信息,为实体识别模型提供额外的先验知识,从而提高实体识别精度,提高模型训练效果。

【技术实现步骤摘要】

本申请涉及数据分析,特别是涉及一种基于文本标注的模型训练方法、文本标注方法、文本标注装置以及计算机存储介质。


技术介绍

1、深度学习已被广泛应用于各领域的实体识别任务中,并取得了较好的性能。然而,深度学习模型的性能很大程度上取决于训练数据的数量和质量,训练数据量不足将导致模型泛化能力差。在各领域的业务系统中,往往缺乏大量的标注数据(即低资源场景),导致深度学习模型的实体识别精度低,难以满足实际需求。数据标注需要大量的人力投入,过少的标注数据会严重影响深度学习模型的实体识别精度。


技术实现思路

1、为解决上述技术问题,本申请提出了一种基于文本标注的模型训练方法、文本标注方法、文本标注装置以及计算机存储介质。

2、为解决上述技术问题,本申请提出了一种基于文本标注的模型训练方法,所述模型训练方法包括:

3、获取各个预设标签的表示向量;

4、遍历输入文本的每个字,获取每一个长度小于预设阈值的文本片段;

5、通过文本标注模型的片段编码模块获取输入文本中各个文本片段的表示向本文档来自技高网...

【技术保护点】

1.一种基于文本标注的模型训练方法,其特征在于,所述模型训练方法包括:

2.根据权利要求1所述的模型训练方法,其特征在于,

3.根据权利要求1所述的模型训练方法,其特征在于,

4.根据权利要求1所述的模型训练方法,其特征在于,

5.根据权利要求1所述的模型训练方法,其特征在于,

6.根据权利要求5所述的模型训练方法,其特征在于,

7.一种文本标注方法,其特征在于,所述文本标注方法包括:

8.根据权利要求7所述的文本标注方法,其特征在于,

9.一种文本标注装置,其特征在于,所述文本标注装置包括存...

【技术特征摘要】

1.一种基于文本标注的模型训练方法,其特征在于,所述模型训练方法包括:

2.根据权利要求1所述的模型训练方法,其特征在于,

3.根据权利要求1所述的模型训练方法,其特征在于,

4.根据权利要求1所述的模型训练方法,其特征在于,

5.根据权利要求1所述的模型训练方法,其特征在于,

6.根据权利要求5所述的模型训练方法,其特征在于,

7.一种文本标注方...

【专利技术属性】
技术研发人员:毛廷运高云君周明伟陈璐陈立力刘伟棠郑博方
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1