System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 对图像进行自动标注的方法和电子装置制造方法及图纸_技高网

对图像进行自动标注的方法和电子装置制造方法及图纸

技术编号:41285776 阅读:7 留言:0更新日期:2024-05-11 09:34
公开了对图像进行自动标注的方法和电子装置。所述方法包括:训练第一模型以预测训练数据集中的数据样本的标签的置信度,包括:使用通过基于由第一模型检测到的相应置信度和由第二模型生成的估计的校正后的标签校正不正确标签而获得的校正后的数据样本;训练第二模型以估计数据样本的正确标签,包括:估计与另一不正确标签对应的正确的另一标签,所述另一不正确标签基于由第一模型关于所述另一不正确标签生成的相应置信度而被检测到;以及用估计的正确的另一标签自动校正所述另一不正确标签。

【技术实现步骤摘要】

以下描述涉及对图像进行自动标注的方法和电子装置


技术介绍

1、可使用大量标注的数据来训练深度学习模型。例如,当训练数据包括用不正确标签标注的数据时,经训练的深度学习模型可能将不正确标签错误识别为正确标签,从而降低准确度的性能。


技术实现思路

1、提供本
技术实现思路
以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本
技术实现思路
不意在确定要求保护的主题的关键特征或必要特征,也不意在用于帮助确定要求保护的主题的范围。

2、在一个或多个总体方面中,一种对图像进行自动标注的方法可包括:训练第一模型以预测训练数据集中的数据样本的标签的置信度,包括:使用通过基于由第一模型检测的相应置信度和由第二模型生成的估计的校正后的标签校正不正确标签而获得的校正后的数据样本;训练第二模型以估计数据样本的正确标签,包括:估计与另一不正确标签对应的正确的另一标签,所述另一不正确标签基于由第一模型关于所述另一不正确标签生成的相应置信度而被检测到;以及用估计的正确的另一标签自动校正所述另一不正确标签,其中,训练数据集中的数据样本包括:作为图像的训练数据和作为图像的类别的训练数据的标签。

3、第一模型和第二模型的相应训练可以是迭代训练,迭代训练基于训练数据集中的标签的置信度来迭代地训练第一模型和第二模型,第一模型用于检测不正确标签,第二模型用于估计正确标签;迭代训练还包括:确定置信度,置信度包括每个标签正确的第一概率和每个标签不正确的第二概率;使用通过校正第一数据样本中的不正确标签而获得的校正后的数据样本,通过更新第一模型的第一参数来训练第一模型,以预测置信度,其中,训练数据集中的数据样本基于置信度的分布被分类为包括不正确标签的第一数据样本和包括正确标签的第二数据样本。

4、分类的步骤可包括:基于伯努利分布对包括正确标签的第二数据样本进行采样。

5、更新第一参数的步骤可包括:基于与校正后的数据样本对应的最大似然来更新第一模型的第一参数。

6、训练第一模型的步骤可包括:通过将针对置信度的相应正则化惩罚应用于更新后的第一参数来训练第一模型。

7、训练第一模型的步骤还可包括:基于计算的交叉熵损失来确定第一模型的初始参数值。

8、训练第二模型的步骤可包括:估计与第一数据样本的所述另一不正确标签对应的正确的另一标签的概率;使用包括所述另一正确标签的估计概率的第一数据样本,通过更新第二模型的第二参数来训练第二模型,以估计所述另一正确标签。

9、所述方法还可包括:基于置信度的分布将训练数据集中的数据样本分类为包括不正确标签的第一数据样本和包括正确标签的第二数据样本;其中,数据样本被混合,使得第一数据样本包括训练数据和与训练数据对应的不正确标签,并且第二数据样本包括训练数据和与训练数据对应的正确标签。

10、训练数据可包括由图像传感器获得的半导体的图像数据。

11、第一模型和第二模型可各自基于期望最大化(em)算法被训练。

12、在一个或多个总体方面,一种对图像进行自动标注的方法可包括:通过将数据样本应用于第一模型来检测数据样本的标签是否是不正确标签,其中,第一模型包括第一神经网络,第一神经网络被训练为基于标签的置信度来检测在包括数据样本中的不正确标签,其中,数据样本包括作为图像的输入数据和作为图像的类别的与输入数据对应的标签。

13、所述方法还可包括:当所述标签被确定为不正确标签时,通过将输入数据应用于第二模型来生成与不正确标签对应的正确标签,其中,第二模型包括第二神经网络,第二神经网络被训练为估计与包括不正确标签的数据样本对应的正确标签。

14、输入数据可包括由图像传感器获得的半导体的图像数据。

15、一种存储指令的非暂时性计算机可读存储介质,所述指令在由处理器执行时,可使处理器执行上述的方法。

16、在另一总体方面,一种电子装置可包括:通信系统;以及处理器,被配置为:基于由通信系统接收的训练数据集中的数据样本的标签的置信度,迭代地训练第一模型和第二模型,第一模型用于检测训练数据集中的不正确标签,第二模型用于估计与不正确标签对应的正确标签,并且生成其中不正确标签使用第一模型或第二模型中的至少一个而被校正的数据样本,其中,处理器还被配置为:训练第一模型以预测置信度,包括:使用通过基于由第一模型检测的相应置信度和由第二模型生成的估计的校正后的标签来校正不正确标签而生成的校正后的数据样本,训练第二模型以估计数据样本的正确标签,包括:估计与另一不正确标签对应的正确的另一标签,所述另一不正确标签基于由第一模型关于所述另一不正确标签生成的相应置信度而被检测到,以及用估计的正确的另一标签来自动校正所述另一不正确标签,其中,训练数据集中的数据样本包括:作为图像的训练数据和作为图像的类别的训练数据的标签。

17、处理器可被配置为确定置信度,置信度包括每个标签正确的第一概率和每个标签不正确的第二概率;基于置信度的分布,将训练数据集中的数据样本分类为包括不正确标签的第一数据样本和包括正确标签的第二数据样本;使用通过校正第一数据样本中的不正确标签而获得的校正后的数据样本,通过更新第一模型的第一参数来训练第一模型,以预测置信度。

18、处理器可被配置为基于与校正后的数据样本对应的最大似然来更新第一模型的第一参数。

19、处理器可被配置为:通过进一步将针对置信度的相应正则化惩罚应用于更新后的第一参数来训练第一模型。

20、处理器可被配置为:基于计算的交叉熵损失进一步确定第一模型的初始参数值。

21、处理器可被配置为:估计与第一数据样本的所述另一不正确标签对应的正确的另一标签的概率,使用包括正确的另一标签的估计概率的第一数据样本来,通过更新第二模型的第二参数来训练第二模型,以估计所述另一正确标签。

22、根据以下具体实施方式、附图和权利要求,其他特征和方面将是清楚的。

本文档来自技高网...

【技术保护点】

1.一种对图像进行自动标注的方法,包括:

2.根据权利要求1所述的方法,其中

3.根据权利要求2所述的方法,其中,分类的步骤包括:

4.根据权利要求2所述的方法,其中,更新第一参数的步骤包括:

5.根据权利要求2所述的方法,其中,训练第一模型的步骤包括:

6.根据权利要求1所述的方法,其中,训练第一模型的步骤还包括:

7.根据权利要求1所述的方法,其中,训练第二模型的步骤包括:

8.根据权利要求1所述的方法,还包括:

9.根据权利要求8所述的方法,其中,训练数据包括由图像传感器获得的半导体的图像数据。

10.根据权利要求1至权利要求9中的任一项所述的方法,其中,第一模型和第二模型各自基于期望最大化算法被训练。

11.一种对图像进行自动标注的方法,包括:

12.根据权利要求11所述的方法,其中,所述方法还包括:

13.根据权利要求11所述的方法,其中,输入数据包括由图像传感器获得的半导体的图像数据。

14.一种存储指令的非暂时性计算机可读存储介质,所述指令在由处理器执行时,使处理器执行根据权利要求1至权利要求13中的任意一项所述的方法。

15.一种电子装置,包括:

16.根据权利要求15所述的电子装置,其中,处理器被配置为:

17.根据权利要求16所述的电子装置,其中,处理器被配置为:

18.根据权利要求16所述的电子装置,其中,处理器被配置为:

19.根据权利要求15所述的电子装置,其中,处理器被配置为:

20.根据权利要求15所述的电子装置,其中,处理器被配置为:

...

【技术特征摘要】

1.一种对图像进行自动标注的方法,包括:

2.根据权利要求1所述的方法,其中

3.根据权利要求2所述的方法,其中,分类的步骤包括:

4.根据权利要求2所述的方法,其中,更新第一参数的步骤包括:

5.根据权利要求2所述的方法,其中,训练第一模型的步骤包括:

6.根据权利要求1所述的方法,其中,训练第一模型的步骤还包括:

7.根据权利要求1所述的方法,其中,训练第二模型的步骤包括:

8.根据权利要求1所述的方法,还包括:

9.根据权利要求8所述的方法,其中,训练数据包括由图像传感器获得的半导体的图像数据。

10.根据权利要求1至权利要求9中的任一项所述的方法,其中,第一模型和第二模型各自基于期望最大化算法被训练。

11.一种对图像进行...

【专利技术属性】
技术研发人员:金熙元张现盛李载允曺基豪
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1