模型优化方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号：34954874 阅读：13 留言：0更新日期：2022-09-17 12:32

本申请实施例公开了一种模型优化方法、装置、设备、存储介质及程序产品，适用于云技术、人工智能、智慧交通等场景。其中方法包括：获取测试样本；采用标签预测模型提取得到测试样本的多个预测样本特征，每个预测样本特征是通过丢弃测试样本的部分特征信息得到的；分别基于每个预测样本特征对测试样本进行标签预测，得到每个预测样本特征对应的预测结果；预测结果包括至少一个候选标签中每个候选标签的预测概率；根据每个预测样本特征对应的预测结果中每个候选标签的预测概率，确定标签预测模型的模型置信度，并向着增大模型置信度的方向对标签预测模型进行模型优化处理，以得到优化后的标签预测模型，优化后的标签预测模型具备较高的鲁棒性。的鲁棒性。的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
模型优化方法、装置、设备、存储介质及程序产品

[0001]本申请涉及人工智能
，尤其涉及一种模型优化方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]近年来，人工智能技术取得了长足的发展和进步，并已广泛应用于众多与人类生活息息相关的实际场景，极大地丰富和便捷了人们的日常生活。例如，人工智能技术中的深度学习技术如今普遍应用于图像分类、语音识别、机器翻译、自动驾驶以及智慧医疗等应用场景。具体地，深度学习技术可以用于对上述各应用场景下的标签预测模型进行模型优化，以使得优化后的标签预测模型可以具备更高以及更稳定的标签预测能力，从而相关设备可以基于优化后的标签预测模型处理得到准确的预测结果。
[0003]就当前而言，基于深度学习技术提出的众多模型优化方法通常无法优化得到鲁棒性较强的标签预测模型，这影响了优化后的标签预测模型在实际应用中的预测能力，进一步导致了预测结果的准确度较低的问题。因此，如何提升标签预测模型的鲁棒性成了当下的研究热点。

技术实现思路

[0004]本申请实施例提供了一种模型优化方法、装置、设备、存储介质及程序产品，可提升用于进行标签预测的标签预测模型的鲁棒性。
[0005]一方面，本申请实施例提供了一种模型优化方法，包括：
[0006]获取测试样本；
[0007]采用标签预测模型提取得到所述测试样本的多个预测样本特征，其中，每个预测样本特征是通过丢弃所述测试样本的部分特征信息得到的，且不同预测样本特征对应丢弃的特征信息不同；
[0008...

【技术保护点】

【技术特征摘要】
1.一种模型优化方法，其特征在于，包括：获取测试样本；采用标签预测模型提取得到所述测试样本的多个预测样本特征，其中，每个预测样本特征是通过丢弃所述测试样本的部分特征信息得到的，且不同预测样本特征对应丢弃的特征信息不同；分别基于每个预测样本特征对所述测试样本进行标签预测，得到所述每个预测样本特征对应的预测结果；其中，所述预测结果包括至少一个候选标签中每个候选标签的预测概率，所述预测概率用于指示所述测试样本预测为相应候选标签的概率；根据每个预测样本特征对应的预测结果中每个候选标签的预测概率，确定所述标签预测模型的模型置信度，并向着增大所述模型置信度的方向对所述标签预测模型进行模型优化处理，以得到优化后的标签预测模型，所述优化后的标签预测模型用于预测得到待预测数据的目标标签。2.根据权利要求1所述的方法，其特征在于，所述向着增大所述模型置信度的方向对所述标签预测模型进行模型优化处理，包括：获取所述标签预测模型中的多个候选模型参数；从所述多个候选模型参数中确定出至少一个待优化模型参数，所述至少一个待优化模型参数中每个待优化模型参数的泛化能力强度值均满足强度值条件；向着增大所述模型置信度的方向对每个待优化模型参数进行参数调整，以对所述标签预测模型进行模型优化处理。3.根据权利要求2所述的方法，其特征在于，所述模型置信度是基于模型损失值确定的，所述模型损失值是采用目标损失函数基于所述每个候选标签的预测概率计算得到的；所述从所述多个候选模型参数中确定出至少一个待优化模型参数，包括：反向传播所述模型损失值，并在反向传播过程中计算所述目标损失函数针对每个候选模型参数的二阶导数，所述二阶导数的绝对值用于指示相应候选模型参数的泛化能力强度值；基于所述多个候选模型参数中每个候选模型参数的二阶导数的绝对值，确定出所述至少一个待优化模型参数。4.根据权利要求2或3所述的方法，其特征在于，所述标签预测模型包括至少一个特征提取层，每个特征提取层包括多个特征提取模块；采用所述标签预测模型提取得到所述测试样本的预测样本特征的方式包括：从每个特征提取层中选取至少一个特征提取模块，得到多个目标特征提取模块；其中，所述多个目标特征提取模块的数量小于所述标签预测模型中全部特征提取模块的总数量，所述全部特征提取模块用于提取得到包括所述测试样本的完整特征信息的样本特征；采用所述多个目标特征提取模块对所述测试样本进行特征提取，得到所述测试样本的预测样本特征。5.根据权利要求2或3所述的方法，其特征在于，所述标签预测模型包括至少一个特征提取层，每个特征提取层包括多个特征提取模块；采用所述标签预测模型提取得到所述测试样本的预测样本特征的方式包括：采用每个特征提取层中的每个特征提取模块对...

【专利技术属性】
技术研发人员：牛帅程，吴家祥，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人