模型处理方法及装置制造方法及图纸

技术编号：36195884 阅读：19 留言：0更新日期：2023-01-04 11:48

本说明书提供模型处理方法及装置，其中所述模型处理方法包括：在多个候选语言模型中搜索至少两个语言模型；将所述至少两个语言模型进行拼接，得到拼接模型；通过所述拼接模型获得训练样本的词特征；根据所述词特征训练任务模型，直到所述任务模型收敛；根据验证样本对收敛后的任务模型进行验证，得到所述任务模型的预测精度；根据所述任务模型的预测精度调整所述多个候选语言模型的搜索参数。所述多个候选语言模型的搜索参数。所述多个候选语言模型的搜索参数。

全部详细技术资料下载

【技术实现步骤摘要】
模型处理方法及装置

[0001]本说明书涉及语言处理
，特别涉及模型处理方法及装置。

技术介绍

[0002]随着人工智能的发展，越来越多的领域采用人工智能的方式进行自然语言处理。在进行自然语言处理的过程中，通常需要通过预训练的上下文语言模型对语句进行词特征表示，再基于词特征进行后续的任务处理，比如意图预测、或翻译等处理。而目前由于预训练的上下文语言模型对语句进行词特征表示方式较为单一，自然语言处理的结果可能并不理想，因此，亟需一种更为准确的方法解决此类问题。

技术实现思路

[0003]有鉴于此，本说明书实施例提供了一种模型处理方法。本说明书同时涉及一种模型处理装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的技术缺陷。
[0004]根据本说明书实施例的第一方面，提供了一种模型处理方法，包括：
[0005]在多个候选语言模型中搜索至少两个语言模型；
[0006]将所述至少两个语言模型进行拼接，得到拼接模型；
[0007]通过所述拼接模型获得训练样本的词特征；
[0008]根据所述词特征训练任务模型，直到所述任务模型收敛；
[0009]根据验证样本对收敛后的任务模型进行验证，得到所述任务模型的预测精度；
[0010]根据所述任务模型的预测精度调整所述多个候选语言模型的搜索参数。
[0011]根据本说明书实施例的第二方面，提供了一种模型处理装置，包括：
[0012]搜索模块，被配置为在多个候选语言模型中搜索至少...

【技术保护点】

【技术特征摘要】
1.一种模型处理方法，包括：在多个候选语言模型中搜索至少两个语言模型；将所述至少两个语言模型进行拼接，得到拼接模型；通过所述拼接模型获得训练样本的词特征；根据所述词特征训练任务模型，直到所述任务模型收敛；根据验证样本对收敛后的任务模型进行验证，得到所述任务模型的预测精度；根据所述任务模型的预测精度调整所述多个候选语言模型的搜索参数。2.根据权利要求1所述的方法，其中，一个候选语言模型作为一个节点，进入节点的有向边代表所述候选语言模型的输入，离开节点的有向边代表所述候选语言模型的输出，多个节点及有向边组成的有向无环图用于代表一组神经网络所存在的空间；相应的，所述在多个候选语言模型中搜索至少两个语言模型，包括：在多组神经网络所存在的空间中搜索至少两个节点。3.根据权利要求2所述的方法，其中，如果拼接模型为多个，所述方法还包括：根据概率分布对多个拼接模型进行采样，得到第一拼接模型；相应的，所述通过所述拼接模型获得训练样本的词特征包括：通过所述第一拼接模型获得训练样本的词特征。4.根据权利要求3所述的方法，其中，所述方法还包括：记录所述第一拼接模型与所述预测精度之间的对应关系。5.根据权利要求1所述的方法，其中，所述方法还包括：记录所述拼接模型与所述预测精度之间的对应关系。6.根据权利要求1所述的方法，其中，所述根据所述任务模型的预测精度调整所述多个候选语言模型的搜索参数，包括：根据所述预测精度、每个候选语言模型的搜索参数、搜索状态以及预设梯度策略算法，计算每个候选语言模型的搜索参数的梯度值；基于所述梯度值调整对应的搜索参数。7.根据权利要求1所述的方法，其中，所述根据所述任务模型的预测精度调整所述多个候选语言模型的搜索参数之后，还包括：在不满足预设搜索停止...

【专利技术属性】
技术研发人员：王新宇，蒋勇，王涛，阮巴赫，黄忠强，黄非，
申请(专利权)人：阿里巴巴新加坡控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人