一种模型训练方法和系统技术方案

技术编号：23853941 阅读：55 留言：0更新日期：2020-04-18 10:05

本说明书实施例公开了一种模型训练方法。所述方法包括：获取训练样本；使用所述训练样本，所述训练样本为样本图像、样本文本或样本语音，通过随机梯度朗之万动力学算法对初始模型进行多轮训练，得到目标模型，所述目标模型为图像分类模型、文本分类模型或语音分类模型，其中，所述多轮训练包括：基于所述训练样本，确定模型参数对应的梯度下降值；向所述梯度下降值添加随机噪声；判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态；当未进入朗之万动力学状态，基于所述添加了随机噪声后的梯度下降值，优化模型参数，进行下一轮训练；当进入朗之万动力学状态，从模型参数的后验概率分布中采样模型参数，确定所述目标模型。

A model training method and system

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练方法和系统
本说明书涉及机器学习领域，特别涉及一种模型训练方法、系统、装置以及可读存储介质。
技术介绍
机器学习模型的准确度长期以来都是评价模型性能的核心标准之一。而即使是经过充分训练的模型，也很容易被对抗样本攻破，导致模型给出错误的分类结果。对抗样本对分类模型分类结果的影响有可能会导致财产损失乃至威胁生命。例如，在保险理赔时，经过修改的事故图像能够使保险理赔模型判定的损伤情况比实际情况严重，从而导致过高的理赔数额。又例如，用户可以修改其面部图像，使人脸识别模型将其识别为其他用户，以盗取其他用户的信息。再例如，一个经过稍加修改的实体停车标志能够使得一个实时的物体识别系统将其误识别为限速标志，从而可能造成交通事故。因此，如何以较低成本有效提高模型的鲁棒性成为机器学习领域亟待解决的问题。
技术实现思路
本说明书实施例的一个方面提供一种模型训练方法。所述模型训练方法包括：获取训练样本；使用所述训练样本，通过随机梯度朗之万动力学算法对初始模型进行多轮训练，得到目标模型，所述目标模型为图像分类模型、文本分类模型或语音分类模型，其中，所述多轮训练包括：基于所述训练样本，确定模型参数对应的梯度下降值；向所述梯度下降值添加随机噪声；判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态；当未进入朗之万动力学状态，基于所述添加了随机噪声后的梯度下降值，优化模型参数，进行下一轮训练；当进入朗之万动力学状态，从模型参数的后验概率分布中采样模型参数，确定所述目标模型。本说明书实施例的另一个...

【技术保护点】
1.一种模型训练方法，所述方法包括：/n获取训练样本，所述训练样本为样本图像、样本文本或样本语音；/n使用所述训练样本，通过随机梯度朗之万动力学算法对初始模型进行多轮训练，得到目标模型，所述目标模型为图像分类模型、文本分类模型或语音分类模型，其中，所述多轮训练包括：/n基于所述训练样本，确定模型参数对应的梯度下降值；/n向所述梯度下降值添加随机噪声；/n判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态；/n当未进入朗之万动力学状态，基于所述添加了随机噪声后的梯度下降值，优化模型参数，进行下一轮训练；/n当进入朗之万动力学状态，从模型参数的后验概率分布中采样模型参数，确定所述目标模型。/n

【技术特征摘要】
1.一种模型训练方法，所述方法包括：
获取训练样本，所述训练样本为样本图像、样本文本或样本语音；
使用所述训练样本，通过随机梯度朗之万动力学算法对初始模型进行多轮训练，得到目标模型，所述目标模型为图像分类模型、文本分类模型或语音分类模型，其中，所述多轮训练包括：
基于所述训练样本，确定模型参数对应的梯度下降值；
向所述梯度下降值添加随机噪声；
判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态；
当未进入朗之万动力学状态，基于所述添加了随机噪声后的梯度下降值，优化模型参数，进行下一轮训练；
当进入朗之万动力学状态，从模型参数的后验概率分布中采样模型参数，确定所述目标模型。

2.根据权利要求1所述的方法，所述随机噪声为服从高斯分布、伯努利分布或泊松分布的噪声。

3.根据权利要求1所述的方法，所述训练样本为含有用户个人信息的图像、文本或语音；
所述目标模型用于确定用户身份。

4.根据权利要求1所述的方法，所述方法还包括：
向所述目标模型输入对抗样本，所述对抗样本通过在正常图像、文本或语音中添加干扰后得到；
用所述目标模型对所述对抗样本进行分类，得到正确的分类结果。

5.一种模型训练系统，所述系统包括获取模块和训练模块；
所述获取模块，用于获取训练样本，所述训练样本为样本图像、样本文本或样本语音；
所述训练模块，用于使用所述训练样本，通过随机梯度朗之万动力学算法对初始模型进行多...

【专利技术属性】
技术研发人员：郇兆鑫，吴秉哲，张晓露，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人