语言处理方法、训练方法、装置、设备、介质及程序产品制造方法及图纸

技术编号:39296887 阅读:7 留言:0更新日期:2023-11-07 11:04
本申请公开了一种语言处理方法、训练方法、装置、设备、介质及程序产品,其中,接收输入的待处理文本,待处理文本包括需要进行语言处理的文本;获取语言处理模型,语言处理模型包括语义特征编码网络和语言处理网络;通过语义特征编码网络对待处理文本进行语义编码,得到待处理文本的语义编码特征;通过语言处理网络对语义编码特征进行语言处理,得到待处理文本的处理结果文本;语义特征编码网络由掩码语言模型采用掩码预测任务和对比学习任务训练得到,对比学习任务的正例包括一样本文本中被掩码的字符在掩码前后的语义编码特征,对比学习任务的负例包括另一样本文本中字符的语义编码特征,能够提升语言处理模型的语言处理能力。力。力。

【技术实现步骤摘要】
语言处理方法、训练方法、装置、设备、介质及程序产品


[0001]本申请涉及自然语言处理
,具体涉及一种语言处理方法、训练方法、装置、设备、介质及程序产品。

技术介绍

[0002]自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向,它以语言为对象,利用计算机技术来分析、理解和处理自然语言,应用于机器翻译、自动摘要、观点提取、文本分类、问题回答、文本语义对比等方面。
[0003]自然语言处理任务的实现前提是使得计算机能够理解文本的语义,即需要对文本的语义进行表征,然而在目前的相关技术中,通常利用预训练的语言模型来对文本进行语义的表征,然而,这类语言模型的表征存在各向异性的问题,即表征位于表示空间的一个狭小子集中,不太具有区分性,捕获不同文本的语义差异的能力较差,进而导致自然语言处理的效果较差。

技术实现思路

[0004]本申请实施例提供一种语言处理方法、模型训练方法、语言处理装置、电子设备、计算机可读存储介质以及计算机程序产品,可以提高语言处理模型的语言处理能力。
[0005]第一方面,本申请提供的语言处理方法,包括:
[0006]接收输入的待处理文本,待处理文本包括需要进行语言处理的文本;
[0007]获取语言处理模型,语言处理模型包括语义特征编码网络和语言处理网络;
[0008]通过语义特征编码网络对待处理文本进行语义编码,得到待处理文本的语义编码特征;
[0009]通过语言处理网络对语义编码特征进行语言处理,得到待处理文本的处理结果文本;
[0010]其中,语义特征编码网络由掩码语言模型采用掩码预测任务和对比学习任务训练得到,对比学习任务的正例包括一样本文本中被掩码的字符在掩码前后的语义编码特征,对比学习任务的负例包括另一样本文本中字符的语义编码特征。
[0011]第二方面,本申请提供的语言处理装置,包括:
[0012]文本获取模块,用于接收输入的待处理文本,待处理文本包括需要进行语言处理的文本;
[0013]模型获取模块,用于获取语言处理模型,语言处理模型包括语义特征编码网络和语言处理网络;
[0014]语义编码模块,用于通过语义特征编码网络对待处理文本进行语义编码,得到待处理文本的语义编码特征;
[0015]语言处理模块,用于通过语言处理网络对语义编码特征进行语言处理,得到待处理文本的处理结果文本;
[0016]其中,语义特征编码网络由掩码语言模型采用掩码预测任务和对比学习任务训练得到,对比学习任务的正例包括一样本文本中被掩码的字符在掩码前后的语义编码特征,对比学习任务的负例包括另一样本文本中字符的语义编码特征。
[0017]在一可选的实施例中,语言处理装置还包括模型训练模块,用于获取掩码语言模型,掩码语言模型包括语义特征编码网络和掩码预测网络;获取对应掩码预测任务的n个原始文本,并对n个原始文本进行掩码处理,得到n个第一类样本文本;通过语义特征编码网络分别对n个原始文本和n个第一类样本文本进行语义编码,得到n个原始文本的n个第一样本语义编码特征、n个第一类样本文本的n个第二样本语义编码特征;通过掩码预测网络对n个第二样本语义编码特征进行掩码预测,得到n个预测文本;根据任一第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征,以及其它第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征,获取对比学习任务的对比损失;根据n个预测文本和n个原始文本,获取掩码预测任务的预测损失;根据对比损失和预测损失,对语义特征编码网络和掩码预测网络的网络参数进行联合更新,直至满足第一预设更新停止条件。
[0018]在一可选的实施例中,模型训练模块用于确定目标掩码比例,并根据目标掩码比例确定n个原始文本的待掩码字符;将n个原始文本中的待掩码字符替换为预设掩码字符,得到n个第一类样本文本。
[0019]在一可选的实施例中,模型训练模块用于选取n个第一类样本文本中的任一第一类样本文本,并从选取的第一类样本文本所对应的原始文本中选取目标待掩码字符;根据选取的第一类样本文本所对应的第一样本语义编码特征,确定目标待掩码字符的字符编码特征;根据选取的第一类样本文本所对应的第二样本语义编码特征,确定目标待掩码字符对应的预设掩码字符的正例字符编码特征;从其它第一类样本文本及其它第一类样本文本对应的原始文本中选取负例字符,并根据其它第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征,确定负例字符的负例字符编码特征;获取字符编码特征与正例字符编码特征之间的第一相似度,以及字符编码特征与负例字符编码特征之间的第二相似度;根据第一相似度和第二相似度获取对比损失。
[0020]在一可选的实施例中,模型训练模块用于获取对应对比损失的加权权重,并根据加权权重对对比损失进行加权计算,得到加权损失;融合加权损失和预测损失,得到融合损失;根据融合损失,对语义特征编码网络和掩码预测网络的网络参数进行联合更新,直至满足第一预设更新停止条件。
[0021]在一可选的实施例中,模型训练模块还用于获取对应不同语言处理类型的第二类样本文本,以及对应第二类样本文本的第一处理结果文本标签;构建对应每一语言处理类型的语言处理网络;针对每一语言处理类型,将对应的第二类样本文本输入语义特征编码网络进行语义编码,得到第三样本语义编码特征,并将第三样本语义编码特征输入对应的语言处理网络进行语言处理,得到第一样本处理结果文本,以及根据第一样本处理结果文本和对应的第一处理结果文本标签,获取每一语言处理类型的语言处理损失;根据每一语言处理类型的语言处理损失,对每一语言处理类型的语言处理网络的网络参数进行更新,直至满足第二预设更新停止条件。
[0022]在一可选的实施例中,模型获取模块用于确定对应待处理文本的目标语言处理类型;获取目标语言处理类型对应的语言处理网络,以及获取语义特征编码网络;将语义特征
编码网络、目标语言处理类型对应的语言处理网络,组合为语言处理模型。
[0023]第三方面,本申请提供的模型训练方法,包括:
[0024]获取预训练的语义特征编码网络,语义特征编码网络由掩码语言模型采用掩码预测任务和对比学习任务训练得到,对比学习任务的正例包括一样本文本中被掩码的字符在掩码前后的语义编码特征,对比学习任务的负例包括另一样本文本中字符的语义编码特征;
[0025]获取对应语言处理任务的o个第三类样本文本,以及对应o个第三类样本文本的o个第二处理结果文本标签;
[0026]构建对应语言处理任务的语言处理网络;
[0027]将o个第三类样本文本输入语义特征编码网络进行语义编码,得到o个第四样本语义编码特征;
[0028]将o个第四样本语义编码特征输入语言处理网络进行语言处理,得到o个第二样本处理结果文本;
[0029]根据o个第二样本处理结果文本和o个第二处理结果文本标签,获取语言处理损失本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语言处理方法,其特征在于,包括:接收输入的待处理文本,所述待处理文本包括需要进行语言处理的文本;获取语言处理模型,所述语言处理模型包括语义特征编码网络和语言处理网络;通过所述语义特征编码网络对所述待处理文本进行语义编码,得到所述待处理文本的语义编码特征;通过所述语言处理网络对所述语义编码特征进行语言处理,得到所述待处理文本的处理结果文本;其中,所述语义特征编码网络由掩码语言模型采用掩码预测任务和对比学习任务训练得到,所述对比学习任务的正例包括一样本文本中被掩码的字符在掩码前后的语义编码特征,所述对比学习任务的负例包括另一样本文本中字符的语义编码特征。2.根据权利要求1所述的语言处理方法,其特征在于,所述接收输入的待处理文本之前,还包括:获取掩码语言模型,所述掩码语言模型包括所述语义特征编码网络和掩码预测网络;获取对应掩码预测任务的n个原始文本,并对所述n个原始文本进行掩码处理,得到n个第一类样本文本;通过所述语义特征编码网络分别对所述n个原始文本和所述n个第一类样本文本进行语义编码,得到所述n个原始文本的n个第一样本语义编码特征、所述n个第一类样本文本的n个第二样本语义编码特征;通过所述掩码预测网络对所述n个第二样本语义编码特征进行掩码预测,得到n个预测文本;根据任一第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征,以及其它第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征,获取所述对比学习任务的对比损失;根据所述n个预测文本和所述n个原始文本,获取所述掩码预测任务的预测损失;根据所述对比损失和所述预测损失,对所述语义特征编码网络和所述掩码预测网络的网络参数进行联合更新,直至满足第一预设更新停止条件。3.根据权利要求2所述的语言处理方法,其特征在于,所述对所述n个原始文本进行掩码处理,得到n个第一类样本文本,包括:确定目标掩码比例,并根据所述目标掩码比例确定所述n个原始文本的待掩码字符;将所述n个原始文本中的待掩码字符替换为预设掩码字符,得到所述n个第一类样本文本。4.根据权利要求3所述的语言处理方法,其特征在于,所述根据任一第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征,以及其它第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征,获取所述对比学习任务的对比损失,包括:选取所述n个第一类样本文本中的任一第一类样本文本,并从选取的第一类样本文本所对应的原始文本中选取目标待掩码字符;根据所述选取的第一类样本文本所对应的第一样本语义编码特征,确定所述目标待掩码字符的字符编码特征;根据所述选取的第一类样本文本所对应的第二样本语义编码特征,确定所述目标待掩
码字符对应的预设掩码字符的正例字符编码特征;从其它第一类样本文本及其它第一类样本文本对应的原始文本中选取负例字符,并根据所述其它第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征,确定所述负例字符的负例字符编码特征;获取所述字符编码特征与所述正例字符编码特征之间的第一相似度,以及所述字符编码特征与所述负例字符编码特征之间的第二相似度;根据所述第一相似度和所述第二相似度获取所述对比损失。5.根据权利要求2所述的语言处理方法,其特征在于,所述根据所述对比损失和所述预测损失,对所述语义特征编码网络和所述掩码预测网络的网络参数进行联合更新,直至满足第一预设更新停止条件,包括:获取对应所述对比损失的加权权重,并根据所述加权权重对所述对比损失进行加权计算,得到加权损失;融合所述加权损失和所述预测损失,得到融合损失;根据所述融合损失,对所述语义特征编码网络和所述掩码预测网络的网络参数进行联合更新,直至满足所述第一预设更新停止条件。6.根据权利要求2所述的语言处理方法,其特...

【专利技术属性】
技术研发人员:陈敏萍杨赛勇黄孟缘
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1