一种基于深度学习多权重损失函数的数据均衡方法技术

技术编号：28376312 阅读：12 留言：0更新日期：2021-05-08 00:03

本发明专利技术涉及一种基于深度学习多权重损失函数的数据均衡方法，应用深度学习模型的训练过程中，首先获取目标图像数据集，根据目标数据集确定数据样本的类别数目C和每类样本量N

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习多权重损失函数的数据均衡方法
本专利技术涉及人工智能、深度学习领域，具体涉及一种基于深度学习多权重损失函数的数据均衡方法。
技术介绍
随着人工智能的快速发展，深度学习在许多方面都取得了非常显著的效果，如数据挖掘、自然语言处理、多媒体学习、推荐和个性化技术、医学图像处理领域等。深度学习通过大量的数据使机器模仿视听和思考等人类的活动，挖掘数据的特征，解决了很多复杂的难题。获取大量的数据是一份非常耗时耗力的工作，且实际环境中的数据往往分布不均衡，从样本数量上来说，不同类别数据样本可能相差过大，例如在医学影像中，越是严重的疾病在同类相关疾病中占比越小，所采集的样本中也相对数量越少，但其误诊或漏诊所带来的代价却非常大。另一方面，从数据样本的区分难易程度上，不同类别数据的学习难度往往也不同，一些类别的特征相对简单固定，较容易训练，而一些类别样本的模式复杂多变，模型学习难度大。数据不均衡会影响神经网络的准确性，导致训练的神经网络模型更侧重于样本数目较多的、易于区分的样本类别，从而使数目较少、学习更为困难的样本类别识别准确率较低。目前解决数据不均衡的问题可从数据层面和算法层面来入手。在数据层面，常借助数据重采样，即对数量较少的类别进行上采样，对数量较多的类别进行下采样；在算法层面上，常利用不同的损失函数来达成不同的训练目的，传统的模型训练时，常使用简单的交叉熵损失函数进行模型与实际数据之间的误差计算，针对数据不均衡问题，目前有如Focalloss损失函数、Class-BalancedFocalLoss...

【技术保护点】
1.一种基于深度学习多权重损失函数的数据均衡方法，其特征在于：所述方法应用深度学习模型的训练过程中，包括以下内容：/n步骤1：获取目标图像数据集，根据目标图像数据集确定样本的类别数目C和每类样本数量N

【技术特征摘要】
1.一种基于深度学习多权重损失函数的数据均衡方法，其特征在于：所述方法应用深度学习模型的训练过程中，包括以下内容：
步骤1：获取目标图像数据集，根据目标图像数据集确定样本的类别数目C和每类样本数量Ni，Ni为第i类别的样本数量；
步骤2：确定超参数α、γ和每类样本类别的加权系数Ci，分别用来调节不同权重的作用范围；
步骤3：确定多权重损失函数，此多权重损失函数用以下公式表示：

式中，z表示样本的预测值，y表示样本的真实值；在等式右边中，C表示数据样本的类别数目，Ci表示每一类别样本重要性的加权系数；表示输出预测正确的概率，其定义为：

其中zi表示样本在第i类上的预测值，y为样本的标签真值；α、γ为常数，分别用来调节数量较多的样本类别和简单样本权重降低的速率；
步骤4，将多权重损失函数用于神经网络模型训练的反向传播过程中，并利用不同的权重来对应不同数据样本进行损失计算，从而缓解不同类别数量不均衡和分类难度不均衡的问题的影响，直至网络收敛，最终达到网络训练的目的。

...

【专利技术属性】
技术研发人员：徐梦娟，姚鹏，申书伟，邵鹏飞，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人