模型训练方法、装置及存储介质制造方法及图纸

技术编号:36645012 阅读:12 留言:0更新日期:2023-02-18 13:04
本申请公开了一种模型训练方法、装置及存储介质。其中,方法包括:利用神经网络建立第一模型;获取第一样本图片数据;利用所述第一样本图片数据中的特定数据进行重采样处理及增加权重处理,分别得到第二样本图片数据和第三样本图片数据;利用所述第一样本图片数据、所述第二样本图片数据和所述第三样本图片数据对所述第一模型进行训练。本申请提供的方案,通过对样本图片数据进行重采样和增加权重处理,并利用获取的样本图片数据、重采样处理后的样本图片数据以及增加权重处理后的样本图片数据对第一模型进行训练的方式,增强了样本图片数据中特定数据的贡献,进而提高了模型的分类性能。分类性能。分类性能。

【技术实现步骤摘要】
模型训练方法、装置及存储介质


[0001]本申请涉及医学图像处理与深度学习领域,尤其涉及一种模型训练方法、装置及存储介质。

技术介绍

[0002]舌诊是观察舌头的色泽、形态的变化来辅助诊断及鉴别的一个简单有效的方法。因此,为了促进舌诊的发展,相关技术中将中医诊疗与图像分析技术相结合,通过对舌象进行定量分析,来实现舌诊的客观化、标准化和定量化。
[0003]然而,在对舌象进行识别和分析的过程中,常见的深度学习舌下脉络分类模型在模型训练的过程中,存在分类的准确率不高的问题。

技术实现思路

[0004]为解决相关技术问题,本申请实施例提供一种模型训练方法、装置及存储介质。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供一种模型训练方法,包括:
[0007]利用神经网络建立第一模型;
[0008]获取第一样本图片数据;
[0009]利用所述第一样本图片数据中的特定数据进行重采样处理及增加权重处理,分别得到第二样本图片数据和第三样本图片数据;
[0010]利用所述第一样本图片数据、所述第二样本图片数据和所述第三样本图片数据对所述第一模型进行训练。
[0011]上述方法中,所述利用所述第一样本图片数据中的特定数据进行重采样处理,得到第二样本图片数据,包括:
[0012]将所述第一样本图片数据中满足第一条件的样本图片数据进行重复采样处理,得到第四样本图片数据;所述第一条件表征所述样本图片数据的数据量低于第一阈值;
[0013]和/或,
[0014]将所述第一样本图片数据中不满足所述第一条件的样本图片数据进行欠采样处理,得到第五样本图片数据;
[0015]将所述第四样本图片数据和/或第五样本图片数据,作为所述第二样本图片数据。
[0016]上述方法中,每次训练中,针对所述第一样本图片数据的至少一类中的每类样本图片数据,从相应类样本图片数据中选择相似度满足预设条件的样本图片数据;所述至少一类中每类样本图片数据的数据量低于所述第一阈值;所述预设条件是根据上次训练的结果确定的;
[0017]将至少一类中每类相似度满足预设条件的样本图片数据,作为满足所述第一条件的样本图片数据。
[0018]上述方法中,所述利用所述第一样本图片数据中的特定数据进行增加权重处理,
得到第三样本图片数据,包括:
[0019]将所述第一样本图片数据中满足第一条件的样本图片数据进行增加权重处理,得到第六样本图片数据;所述第一条件表征所述样本图片数据的数据量低于第一阈值;
[0020]和/或,
[0021]将所述第一样本图片数据中不满足第一条件的样本图片数据进行减少权重处理,得到第七样本图片数据;
[0022]将所述第六样本图片数据和/或第七样本图片数据,作为所述第三样本图片数据。
[0023]上述方法中,所述将所述第一样本图片数据中满足第一条件的样本图片数据进行增加权重处理时,所述方法包括:
[0024]每次训练中,根据分错代价的值,确定所述第一样本图片数据中满足所述第一条件的样本图片数据的权重增加值;所述分错代价表征用于计算权重增加值的因子;所述分错代价的值是根据上次训练结果确定的;
[0025]利用所述权重增加值,对所述第一样本图片数据中满足所述第一条件的样本图片数据进行增加权重处理。
[0026]上述方法中,所述第一样本图片数据、所述第二样本图片数据和所述第三样本图片数据分别被输入至所述第一模型的三个分支网络,一个分支网络的第一子模块分别与另外两个分支网络的第二子模块相连接;第一子模块的输出与第二子模块连接。
[0027]上述方法中,利用所述第一模型的交叉熵损失函数,确定所述第一模型的训练结果对应的损失值;
[0028]其中,所述损失值用于判断是否对所述第一模型再次进行训练;所述损失值至少包含所述第一模型的训练结果中错误分类对应的损失值。
[0029]上述方法中,所述第一模型中的交叉熵损失函数表征为:
[0030][0031][0032][0033][0034]其中,N表征所述第一样本图片数据对应的图片数量;K表征所述第一样本图片数据对应的图片的类别数量;j表征所述第一模型的训练结果中预测分类结果的类别数量;g表征所述第一模型的训练结果中实际分类结果的类别数量;y
(i)[j]表征第i张图片真实标签和预测标签j的匹配情况;表征真实类别为j的第i张图片,预测分类结果为j的实际概率;表征归一化因子;α'、β'、γ'表征所述第一模型训练后的归一化参数;
[0035]其中,用于计算所述第一模型的训练结果中预测分类结果和实际分类结果的差异对应的损失值;用于计算所述第一模型的训练结果中错误分类结果对应
的损失值。
[0036]本申请实施例还提供一种模型训练装置,包括:
[0037]第一处理单元,用于利用神经网络建立第一模型;
[0038]获取单元,用于获取第一样本图片数据;
[0039]第二处理单元,用于利用所述第一样本图片数据中的特定数据进行重采样处理及增加权重处理,分别得到第二样本图片数据和第三样本图片数据;
[0040]训练单元,用于利用所述第一样本图片数据、所述第二样本图片数据和所述第三样本图片数据对所述第一模型进行训练。
[0041]本申请实施例还提供一种模型训练装置,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
[0042]其中,所述处理器用于运行所述计算机程序时,所述计算机程序被处理器执行时实现任一所述模型训练方法的步骤。
[0043]本申请实施例还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一所述模型训练方法的步骤。
[0044]本申请实施例提供的模型训练方法、装置及存储介质,利用神经网络建立第一模型后,获取第一样本图片数据,并利用所述第一样本图片数据中的特定数据进行重采样处理及增加权重处理,分别得到第二样本图片数据和第三样本图片数据;利用所述第一样本图片数据、所述第二样本图片数据和所述第三样本图片数据对所述第一模型进行训练。本申请实施例提供的技术方案,通过神经网络建立第一模型后,针对第一样本图片数据中的特定数据进行重采样处理及增加权重处理,并利用第一样本图片数据和处理后的样本图片数据来训练第一模型。如此,能够在不影响第一样本图片数据的图片特征的情况下,增加特定数据的图片特征对于训练第一模型的贡献率,避免了由于第一样本图片数据中存在不均衡样本而导致第一模型对特定数据的分类识别率低,使得分类性能受损的问题,提高了分类识别率。
附图说明
[0045]图1为本申请实施例第一种模型训练的方法流程示意图;
[0046]图2为本申请应用实施例中第一模型的架构图;
[0047]图3为本申请应用实施例中第一模型的子模块的架构图;
[0048]图4为本申请实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:利用神经网络建立第一模型;获取第一样本图片数据;利用所述第一样本图片数据中的特定数据进行重采样处理及增加权重处理,分别得到第二样本图片数据和第三样本图片数据;利用所述第一样本图片数据、所述第二样本图片数据和所述第三样本图片数据对所述第一模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述利用所述第一样本图片数据中的特定数据进行重采样处理,得到第二样本图片数据,包括:将所述第一样本图片数据中满足第一条件的样本图片数据进行重复采样处理,得到第四样本图片数据;所述第一条件表征所述样本图片数据的数据量低于第一阈值;和/或,将所述第一样本图片数据中不满足所述第一条件的样本图片数据进行欠采样处理,得到第五样本图片数据;将所述第四样本图片数据和/或第五样本图片数据,作为所述第二样本图片数据。3.根据权利要求2所述的方法,其特征在于,每次训练中,针对所述第一样本图片数据的至少一类中的每类样本图片数据,从相应类样本图片数据中选择相似度满足预设条件的样本图片数据;所述至少一类中每类样本图片数据的数据量低于所述第一阈值;所述预设条件是根据上次训练的结果确定的;将至少一类中每类相似度满足预设条件的样本图片数据,作为满足所述第一条件的样本图片数据。4.根据权利要求1所述的方法,其特征在于,所述利用所述第一样本图片数据中的特定数据进行增加权重处理,得到第三样本图片数据,包括:将所述第一样本图片数据中满足第一条件的样本图片数据进行增加权重处理,得到第六样本图片数据;所述第一条件表征所述样本图片数据的数据量低于第一阈值;和/或,将所述第一样本图片数据中不满足第一条件的样本图片数据进行减少权重处理,得到第七样本图片数据;将所述第六样本图片数据和/或第七样本图片数据,作为所述第三样本图片数据。5.根据权利要求4所述的方法,其特征在于,所述将所述第一样本图片数据中满足第一条件的样本图片数据进行增加权重处理时,所述方法包括:每次训练中,根据分错代价的值,确定所述第一样本图片数据中满足所述第一条件的样本图片数据的权重增加值;所述分错代价表征用于计算权重增加值的因子;所述分错代价的值是根据上次训练结果确定的;利用所述权重增加值,对所述第一样本图片数据中满足所述第一条件的样本图片数据进行增加权重处理。6.根据权...

【专利技术属性】
技术研发人员:杨了赵博马靖博唐晓霁杨适睿
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1