深度学习训练方法、装置、设备及可读存储介质制造方法及图纸

技术编号：20797839 阅读：46 留言：0更新日期：2019-04-06 11:27

本发明专利技术实施例提供一种深度学习训练方法、装置、设备及可读存储介质。本发明专利技术实施例的方法通过将源域数训据集拆分成多个源域数据组，在对源域模型的每一轮模型训练中，均从训练数据组中随机抽取的多个小样本训练集，作为本轮的训练数据进行模型训练，得到各小样本训练集的模型参数；根据各小样本训练集的模型参数更新源域模型的初始参数，根据更新后的初始参数能得到本轮训练后的新的模型；由于每轮模型训练均重新从训练数据组中随机抽取的多个小样本训练集，作为新的训练数据，使得每轮模型训练所使用的训练数据均不相同，这样可以起到丰富训练数据的效果，即使在源域训练数据集中的样本数据较小的情况下，也可以实现训练出效果很好的模型。

Deep Learning Training Method, Device, Equipment and Readable Storage Media

The embodiment of the present invention provides a deep learning training method, device, device and readable storage medium. The method of the embodiment of the present invention divides the training data set of the source domain into several source domain data sets. In each round of model training of the source domain model, a plurality of small sample training sets are randomly extracted from the training data set, which are used as the training data of the current round for model training, and the model parameters of each small sample training set are obtained. The source domain is updated according to the model parameters of each small sample training set. According to the initial parameters of the model, the new model after the training can be obtained. Because each round of model training is randomly extracted from the training data set of multiple small samples, as new training data, the training data used in each round of model training are different, which can enrich the training data, even in the source domain. When the sample data in the training data set is small, the model with good training effect can also be realized.

全部详细技术资料下载

【技术实现步骤摘要】
深度学习训练方法、装置、设备及可读存储介质
本专利技术实施例涉及深度学习
，尤其涉及一种深度学习训练方法、装置、设备及可读存储介质。
技术介绍
深度学习(deeplearning)已经广泛应用于各个领域，已经可以像人类一样识别与认知，甚至解决各类问题的能力在某些方面已超越了人类。深度学习要求大体量训练数据，还需要有足够量包括标注数据的标签样本作为数据基础进行深度模型的训练。但在某些领域，由于样本采集困难、标签分析代价大等原因，通常标签样本很难获取，标签样本缺乏，小样本问题严重，导致训练出的深度模型效果差。
技术实现思路
本专利技术实施例提供一种深度学习训练方法、装置、设备及可读存储介质，用以解决在某些领域，由于样本采集困难、标签分析代价大等原因，通常标签样本很难获取，标签样本缺乏，小样本问题严重，导致训练出的深度模型效果差的问题。本专利技术实施例的一个方面是提供一种深度学习训练方法，包括：对从训练数据组中随机抽取的多个小样本训练集分别进行模型训练，得到各小样本训练集的模型参数；根据所述各小样本训练集的模型参数，更新源域模型的初始参数；验证根据更新后的初始参数得到...

【技术保护点】
1.一种深度学习模型训练方法，其特征在于，包括：对从训练数据组中随机抽取的多个小样本训练集分别进行模型训练，得到各小样本训练集的模型参数；根据所述各小样本训练集的模型参数，更新源域模型的初始参数；验证根据更新后的初始参数得到的模型是否符合预置条件；若不符合，则跳转执行对从训练数据组中随机抽取的多个小样本训练集分别进行模型训练的步骤；若符合，则将更新后的初始参数确定为所述源域模型的最终参数得到源域模型。

【技术特征摘要】
1.一种深度学习模型训练方法，其特征在于，包括：对从训练数据组中随机抽取的多个小样本训练集分别进行模型训练，得到各小样本训练集的模型参数；根据所述各小样本训练集的模型参数，更新源域模型的初始参数；验证根据更新后的初始参数得到的模型是否符合预置条件；若不符合，则跳转执行对从训练数据组中随机抽取的多个小样本训练集分别进行模型训练的步骤；若符合，则将更新后的初始参数确定为所述源域模型的最终参数得到源域模型。2.根据权利要求1所述的方法，其特征在于，所述对从训练数据组中随机抽取的多个小样本训练集分别进行模型训练，包括：对源域训练数据集进行分组处理，得到多个训练数据组；重复从所述多个训练数据组中分别抽取预设数量的训练数据的过程，得到多个小样本训练集。3.根据权利要求2所述的方法，其特征在于，所述对源域训练数据集进行分组处理，得到多个训练数据组，包括：若所述源域模型对应的学习任务为分类学习任务，则将所述源域训练数据集分成的训练数据组的数量等于所述学习任务的类别数量；若所述源域模型对应的学习任务为回归学习任务，则将所述源域训练数据集分成的训练数据组的数量等于所述学习任务的可变参数的数量。4.根据权利要求1所述的方法，其特征在于，所述根据所述各小样本训练集的模型参数，更新源域模型的初始参数，包括：根据所述各小样本训练集的模型参数，采用如下公式，更新源域模型的初始参数：其中，θf表示本次更新后源域模型的初始参数，θ0表示本次更新前源域模型的初始参数，表示所述各小样本训练集的模型参数的平均值，α表示衰变系数。5.根据权利要求4所述的方法，其特征在于，所述衰变系数为：其中，α0为衰变系数的预设初始值，N为预设的源域模型初始参数更新的总次数，j为当前源域模型的初始参数的更新次数，j为正整数。6.根据权利要求1所述的方法，其特征在于，所述验证根据更新后的初始参数得到的模型是否符合预置条件，包括：采用验证集对根据更新后的初始...

【专利技术属性】
技术研发人员：平安，何光宇，王希，
申请(专利权)人：东软集团股份有限公司，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人