样本标签置信度计算方法、装置、设备及模型训练方法制造方法及图纸

技术编号：20365580 阅读：24 留言：0更新日期：2019-02-16 17:45

本发明专利技术公开了一种样本标签置信度计算方法、装置、设备及模型训练方法。其中样本标签置信度计算方法，用于对图像深度学习模型训练的样本标签置信度进行计算，包括以下步骤：根据当前样本的学习结果计算样本初始标签的初始标签置信度；判断初始标签置信度是否满足预设置信度条件，当初始标签置信度满足预设置信度条件时，保持当前样本的最终标签为初始标签不变；当初始标签置信度不满足预设置信度条件时，从所有预设类标签中选择置信度最大的标签作为当前样本的最终标签。该方法能够应用到深度学习模型中，使得深度学习模型在学习的过程中能够保留对训练样本的历史学习记忆。能够对错标样本进行纠错，从而使得模型能够得到更好的训练。

全部详细技术资料下载

【技术实现步骤摘要】
样本标签置信度计算方法、装置、设备及模型训练方法
本专利技术涉及，尤其涉及一种样本标签置信度计算方法、装置、设备及模型训练方法。
技术介绍
深度学习网络模型在医学领域已经取得了突出的成果，在图像分类、图像分割以及目标检测等领域均已打败传统图像处理技术。在图像分类方面，深度学习的研究者们针对性地提出了多种经典模型，如VggNet、GoogleNet以及ResNet等。目前，研究者们已经将这些经典模型应用于医学图像分类中。与传统的自然图像不同，医学图像强依赖于医学的领域知识，在实现某一特定医学影像的疾病分类时，研究者们需要专业的医生对医学图像进行标注，并且标注的精确度越高，深度学习模型的性能会越好。然而，由于医生的专业水平不同，对于医学影像的理解和判断也会有出入，收集的医学影像数据很难保证较高的纯度。此外，医生在标注过程中也会由于各种因素，如疲倦、疏忽，而导致误标的情况。对于学习资料不纯的情况，目前并没有针对性的处理方法，大多是通过发现一例错误样本纠错一例的方法进行样本集的沉淀。此外，算法模型的一些防止过拟合的方法也一定程度上抵御了数据纯度低的风险，如参数正则化、dropout处理等。还有一种特殊的网络结构teacher-studentnetwork，这类网络首先通过teacher网络学习样本集，然后student网络基于teacher网络学到的参数进行学习。Teacher网络能够在学习阶段降低错误样本的权重，student网络在学习时受到错误样本的影响会相对小些。但是，从根本上将，深度学习模型是以数据驱动的算法，数据的纯度能够影响模型在真实应用场景的最终性能...

【技术保护点】
1.一种样本标签置信度计算方法，用于对图像深度学习模型训练的样本标签置信度进行计算，其特征在于，包括：根据当前样本的学习结果计算样本初始标签的初始标签置信度；判断所述初始标签置信度是否满足预设置信度条件，并得到判断结果；根据所述判断结果，当所述初始标签置信度满足预设置信度条件时，保持所述当前样本的最终标签为所述初始标签不变；根据所述判断结果，当所述初始标签置信度不满足预设置信度条件时，从所有预设类标签中选择置信度最大的标签作为所述当前样本的最终标签；其中，包含所述初始标签的所有预设标签的数量两个以上。

【技术特征摘要】
1.一种样本标签置信度计算方法，用于对图像深度学习模型训练的样本标签置信度进行计算，其特征在于，包括：根据当前样本的学习结果计算样本初始标签的初始标签置信度；判断所述初始标签置信度是否满足预设置信度条件，并得到判断结果；根据所述判断结果，当所述初始标签置信度满足预设置信度条件时，保持所述当前样本的最终标签为所述初始标签不变；根据所述判断结果，当所述初始标签置信度不满足预设置信度条件时，从所有预设类标签中选择置信度最大的标签作为所述当前样本的最终标签；其中，包含所述初始标签的所有预设标签的数量两个以上。2.根据权利要求1所述的样本标签置信度计算方法，其特征在于，所述初始标签置信度包括基础置信度和调整置信度两部分。3.根据权利要求1所述的样本标签置信度计算方法，其特征在于，对于所述初始标签的初始标签置信度在最初预设学习次数内初始标签置信度为100％。4.根据权利要求3所述的样本标签置信度计算方法，其特征在于，所述根据当前样本的学习结果计算样本初始标签的初始标签置信度，包括：计算当前样本初始标签的基础置信度，其计算公式如下：其中，nstart最初预设学习次数，n表示当前学习的次数，k表示输入样本的标签权重衰减度；计算当前样本历史学习结果的调整置信度，其计算公式如下：其中p(n)m表示在第n次学习中，第m类标签的置信度；p(0)m表示第m类标签的置信度初始值；函数I(m＝i)表示的是当标签类别为i时输出1，否则输出0；N表示标签的类别数目；b表示标签的滑动平均系数；计算样本总的初始标签置信度，计算公式如下：且当所述初始标签置信度不满足预设置信度条件时，从样本所有预设类标签中选择置信度最大的标签作为所述当前样本的最终标签，先计算其他预设类标签的置信度，计算公式如下：再选择置信度最...

【专利技术属性】
技术研发人员：姜泓羊，杨康，高孟娣，代黎明，
申请(专利权)人：代黎明，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人