【技术实现步骤摘要】
文本处理方法、目标任务模型的训练方法和装置
本专利技术涉及人工智能
,尤其是涉及一种文本处理方法、目标任务模型的训练方法和装置。
技术介绍
文本增强属于数据增强的一种,文本增强技术可以增加文本样本量,从而提高语言相关的任务模型的训练效果。相关技术中,可以采用EDA(EasyDataAugmentation,简单数据增强)、回译、模型生成等方式实现文本增强。其中的模型生成方式中,模型输出的文本往往与模型的训练数据紧密相关,在大多情况下,模型采用通用语料集中的文本进行训练,模型能够在训练过程中学习到通用语料中文本的通用性和通顺性,但是难以学习到一些专业领域的措辞,导致难以应用至专业领域中的文本增强,应用范围受限。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种文本处理方法、目标任务模型的训练方法、装置和电子设备,以实现在指定领域下的文本增强,得到在各个专业领域下的文本增强数据。第一方面,本专利技术实施例提供了一种文本处理方法,方法包括:响应于接收到指定领域下的待处理语义信息,将待处理语义信 ...
【技术保护点】
1.一种文本处理方法,其特征在于,所述方法包括:/n将指定领域下的待处理语义信息输入至语言模型中,输出与所述待处理语义信息相关联的增强文本数据;/n基于所述增强文本数据,对所述指定领域下的文本集合进行文本增强;/n其中,所述语言模型基于预设的第一样本集合训练得到;所述第一样本集合中的训练样本包括:所述指定领域下的样本语义信息,以及与所述样本语义信息相匹配的样本文本数据。/n
【技术特征摘要】 【专利技术属性】
1.一种文本处理方法,其特征在于,所述方法包括:
将指定领域下的待处理语义信息输入至语言模型中,输出与所述待处理语义信息相关联的增强文本数据;
基于所述增强文本数据,对所述指定领域下的文本集合进行文本增强;
其中,所述语言模型基于预设的第一样本集合训练得到;所述第一样本集合中的训练样本包括:所述指定领域下的样本语义信息,以及与所述样本语义信息相匹配的样本文本数据。
2.根据权利要求1所述的方法,其特征在于,所述待处理语义信息包括:意图名信息、意图问题信息、意图回答信息或话术信息中的一种或多种。
3.根据权利要求1所述的方法,其特征在于,所述样本语义信息包括:意图名信息、意图问题信息、意图回答信息或话术信息中的一种或多种;所述样本文本数据包括话术信息。
4.根据权利要求1所述的方法,其特征在于,所述语言模型具体通过下述方式训练得到:
基于所述第一样本集合确定目标训练样本;其中,所述目标训练样本包括:所述指定领域下的目标样本语义信息,以及与所述目标样本语义信息相匹配的目标样本文本数据;
将所述目标样本语义信息输入至初始模型中,得到输出结果;
基于所述输出结果和所述目标样本文本数据,确定损失值;基于所述损失值训练所述初始模型,直至所述初始模型收敛,得到语言模型。
5.根据权利要求4所述的方法,其特征在于,将所述目标样本语义信息输入至初始模型中,得到输出结果的步骤之前,所述方法还包括:
基于预设的第二训练集合,对所述初始模型进行预训练,得到预训练后的所述初始模型;其中,所述第二训练集合中的训练样本包括:与所述指定领域相关的多轮对话数据。
6.根据权利要求1所述的方法,其特征在于,所述指定领域下的文本集合包括所述第一样本集合中的样本文本数据;
所述基于所述增强文本数据,对所述指定领域下的文本集合进行文本增强的步骤,包括:将所述增强文本数据增加至所述指定领域下的文本集合中。
7.根据权利要求6所述的方法,其特征在于,将所述增强文本数据增加至所述第一样本集合中的样本文本数据中的步骤,包括:
确定目标数据;其中,所述目标数据包括所述待处理语义信息,或者与所述待处理语义相匹配的文本数据;
计算所述增强文本数据与所述目标数据的相似度,如果所述相似度达到预设的相似度阈值,将所述增强文本数据更新至所述第一样本集合的样本文本数据中。
技术研发人员:浦嘉澍,席亚东,毛晓曦,范长杰,胡志鹏,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。