语言处理方法、训练方法、装置、设备、介质及程序产品制造方法及图纸

技术编号：39296887 阅读：30 留言：0更新日期：2023-11-07 11:04

本申请公开了一种语言处理方法、训练方法、装置、设备、介质及程序产品，其中，接收输入的待处理文本，待处理文本包括需要进行语言处理的文本；获取语言处理模型，语言处理模型包括语义特征编码网络和语言处理网络；通过语义特征编码网络对待处理文本进行语义编码，得到待处理文本的语义编码特征；通过语言处理网络对语义编码特征进行语言处理，得到待处理文本的处理结果文本；语义特征编码网络由掩码语言模型采用掩码预测任务和对比学习任务训练得到，对比学习任务的正例包括一样本文本中被掩码的字符在掩码前后的语义编码特征，对比学习任务的负例包括另一样本文本中字符的语义编码特征，能够提升语言处理模型的语言处理能力。力。力。

全部详细技术资料下载

【技术实现步骤摘要】
语言处理方法、训练方法、装置、设备、介质及程序产品

[0001]本申请涉及自然语言处理
，具体涉及一种语言处理方法、训练方法、装置、设备、介质及程序产品。

技术介绍

[0002]自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向，它以语言为对象，利用计算机技术来分析、理解和处理自然语言，应用于机器翻译、自动摘要、观点提取、文本分类、问题回答、文本语义对比等方面。
[0003]自然语言处理任务的实现前提是使得计算机能够理解文本的语义，即需要对文本的语义进行表征，然而在目前的相关技术中，通常利用预训练的语言模型来对文本进行语义的表征，然而，这类语言模型的表征存在各向异性的问题，即表征位于表示空间的一个狭小子集中，不太具有区分性，捕获不同文本的语义差异的能力较差，进而导致自然语言处理的效果较差。

技术实现思路

[0004]本申请实施例提供一种语言处理方法、模型训练方法、语言处理装置、电子设备、计算机可读存储介质以及计算机程序产品...

【技术保护点】

【技术特征摘要】
1.一种语言处理方法，其特征在于，包括：接收输入的待处理文本，所述待处理文本包括需要进行语言处理的文本；获取语言处理模型，所述语言处理模型包括语义特征编码网络和语言处理网络；通过所述语义特征编码网络对所述待处理文本进行语义编码，得到所述待处理文本的语义编码特征；通过所述语言处理网络对所述语义编码特征进行语言处理，得到所述待处理文本的处理结果文本；其中，所述语义特征编码网络由掩码语言模型采用掩码预测任务和对比学习任务训练得到，所述对比学习任务的正例包括一样本文本中被掩码的字符在掩码前后的语义编码特征，所述对比学习任务的负例包括另一样本文本中字符的语义编码特征。2.根据权利要求1所述的语言处理方法，其特征在于，所述接收输入的待处理文本之前，还包括：获取掩码语言模型，所述掩码语言模型包括所述语义特征编码网络和掩码预测网络；获取对应掩码预测任务的n个原始文本，并对所述n个原始文本进行掩码处理，得到n个第一类样本文本；通过所述语义特征编码网络分别对所述n个原始文本和所述n个第一类样本文本进行语义编码，得到所述n个原始文本的n个第一样本语义编码特征、所述n个第一类样本文本的n个第二样本语义编码特征；通过所述掩码预测网络对所述n个第二样本语义编码特征进行掩码预测，得到n个预测文本；根据任一第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征，以及其它第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征，获取所述对比学习任务的对比损失；根据所述n个预测文本和所述n个原始文本，获取所述掩码预测任务的预测损失；根据所述对比损失和所述预测损失，对所述语义特征编码网络和所述掩码预测网络的网络参数进行联合更新，直至满足第一预设更新停止条件。3.根据权利要求2所述的语言处理方法，其特征在于，所述对所述n个原始文本进行掩码处理，得到n个第一类样本文本，包括：确定目标掩码比例，并根据所述目标掩码比例确定所述n个原始文本的待掩码字符；将所述n个原始文本中的待掩码字符替换为预设掩码字符，得到所述n个第一类样本文本。4.根据权利要求3所述的语言处理方法，其特征在于，所述根据任一第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征，以及其它第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征，获取所述对比学习任务的对比损失，包括：选取所述n个第一类样本文本中的任一第一类样本文本，并从选取的第一类样本文本所对应的原始文本中选取目标待掩码字符；根据所述选取的第一类样本文本所对应的第一样本语义编码特征，确定所述目标待掩码字符的字符编码特征；根据所述选取的第一类样本文本所对应的第二样本语义编码特征，确定所述目标待掩
码字符对应的预设掩码字符的正例字符编码特征；从其它第一类样本文本及其它第一类样本文本对应的原始文本中选取负例字符，并根据所述其它第一类样本文本对应的第一样本语义编码特征和第二样本语义编码特征，确定所述负例字符的负例字符编码特征；获取所述字符编码特征与所述正例字符编码特征之间的第一相似度，以及所述字符编码特征与所述负例字符编码特征之间的第二相似度；根据所述第一相似度和所述第二相似度获取所述对比损失。5.根据权利要求2所述的语言处理方法，其特征在于，所述根据所述对比损失和所述预测损失，对所述语义特征编码网络和所述掩码预测网络的网络参数进行联合更新，直至满足第一预设更新停止条件，包括：获取对应所述对比损失的加权权重，并根据所述加权权重对所述对比损失进行加权计算，得到加权损失；融合所述加权损失和所述预测损失，得到融合损失；根据所述融合损失，对所述语义特征编码网络和所述掩码预测网络的网络参数进行联合更新，直至满足所述第一预设更新停止条件。6.根据权利要求2所述的语言处理方法，其特...

【专利技术属性】
技术研发人员：陈敏萍，杨赛勇，黄孟缘，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人