提高文本分析模型泛化能力的训练方法及装置制造方法及图纸

技术编号:33732316 阅读:30 留言:0更新日期:2022-06-08 21:28
本说明书实施例提供提高文本分析模型泛化能力的训练方法及装置,其中所述提高文本分析模型泛化能力的训练方法包括:获取训练样本集,其中,所述训练样本集合中包括训练文本;基于所述训练样本集和预设环境分类信息生成目标环境矩阵,其中,所述目标环境矩阵中包括每个训练文本对应的环境标签;根据所述训练文本和所述训练文本对应的环境标签训练文本分析模型,其中,所述文本分析模型包括与所述预设环境分类信息对应的分类器。通过本方法,使得文本分析模型在预测阶段的预测分布与训练阶段的训练分布存在分布差异的情况下,提升了文本分析模型的预测准确率。本分析模型的预测准确率。本分析模型的预测准确率。

【技术实现步骤摘要】
提高文本分析模型泛化能力的训练方法及装置


[0001]本说明书实施例涉及计算机
,特别涉及提高文本分析模型泛化能力的训练方法。

技术介绍

[0002]自然语言处理(Natural Language Processing)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。其中,自然语言理解任务一直受到从业者的关注,但是目前大部分的方法去关注的场景是测试数据与训练数据相同的情况,掩盖了模型的脆弱性,因此,如何提升模型在自然语言理解任务中的效果,就成为技术人员亟待解决的问题。

技术实现思路

[0003]有鉴于此,本说明书施例提供了提高文本分析模型泛化能力的训练方法、文本分析方法、提高数据处理模型泛化能力的训练方法、数据处理方法。本说明书一个或者多个实施例同时涉及提高文本分析模型泛化能力的训练装置、文本分析装置、提高数据处理模型泛化能力的训练装置、数据处理装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提高文本分析模型泛化能力的训练方法,包括:获取训练样本集,其中,所述训练样本集合中包括训练文本;基于所述训练样本集和预设环境分类信息生成目标环境矩阵,其中,所述目标环境矩阵中包括每个训练文本对应的环境标签;根据所述训练文本和所述训练文本对应的环境标签训练文本分析模型,其中,所述文本分析模型包括与所述预设环境分类信息对应的分类器。2.如权利要求1所述的方法,基于所述训练样本集和预设环境分类信息生成目标环境矩阵,包括:基于所述训练样本集和预设环境分类信息生成初始环境矩阵;根据预设参考语义模型和所述训练样本集更新所述初始环境矩阵,生成目标环境矩阵。3.如权利要求2所述的方法,基于所述训练样本集和预设环境分类信息生成初始环境矩阵,包括:获取所述训练样本集中训练文本的数量和预设环境分类信息对应的环境数量;根据所述训练文本的数量和所述环境数量生成初始环境矩阵。4.如权利要求3所述的方法,所述预设环境分类信息包括第一环境分类信息和第二环境分类信息;获取预设环境分类信息对应的环境数量,包括:获取所述第一环境分类信息对应的第一环境数量,获取所述第二环境分类信息对应的第二环境数量,其中,所述第一环境数量大于所述第二环境数量;相应的,根据所述训练文本的数量和所述环境数量生成初始环境矩阵,包括:根据所述训练文本的数量和所述第一环境数量生成第一初始环境矩阵,根据所述训练文本的数量和所述第二环境数量生成第二初始环境矩阵。5.如权利要求4所述的方法,根据预设参考语义模型和所述训练样本集更新所述初始环境矩阵,生成目标环境矩阵,包括:根据预设参考语义模型和所述训练样本集更新所述第一初始环境矩阵,生成第一目标环境矩阵;根据预设参考语义模型和所述训练样本集更新所述第二初始环境矩阵,生成第二目标环境矩阵。6.如权利要求5所述的方法,所述文本分析模型包括编码器和分类器,其中,所述分类器的个数与所述环境数量对应;根据所述训练文本和所述训练文本对应的环境标签训练文本分析模型,包括:根据所述训练文本和所述第一目标环境矩阵对应的环境标签训练待训练文本分析模型,更新所述待训练文本分析模型的编码器参数和第一分类器参数,获得初始文本分析模型,其中,所述第一分类器的个数与所述第一环境数量对应;根据所述训练文本和所述第二目标环境矩阵对应的环境标签训练所述初始文本分析模型,更新所述初始文本分析模型的第二分类器参数,获得文本分析模型,其中,所述第二分类器的个数与所述第二环境数量对应。7.如权利要求...

【专利技术属性】
技术研发人员:余思成邴立东
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1