图像识别模型训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:35109289 阅读:36 留言:0更新日期:2022-10-01 17:22
本申请涉及一种图像识别模型训练方法、装置、计算机设备和存储介质。本申请能够根据实际情况模拟出满足相应的全局非独立同分布程度值的训练样本进行训练,在兼顾隐私安全的同时,提高训练准确率。该方法包括:从主节点获取全量训练样本图像集合和全局非独立同分布程度值;全量训练样本图像集合中包括多种识别对象;确定本地的目标识别对象,并计算全量训练样本图像集合中每种识别对象的初始数量;基于预设的数据构造规则,根据全局非独立同分布程度值,计算得到每种目标识别对象的目标数量;根据每种目标识别对象的目标数量,构造目标训练样本图像集合;利用目标训练样本图像集合对图像识别模型进行训练,得到训练好的图像识别模型。模型。模型。

【技术实现步骤摘要】
图像识别模型训练方法、装置、计算机设备和存储介质


[0001]本申请涉及图像处理
,特别是涉及一种图像识别模型训练方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展,深度神经网络被用于各行各业。在图像识别领域,可通过事先标记的图像样本对深度神经网络模型进行训练,使得训练后的深度神经网络模型能够识别出待识别图像中出现的各种目标,例如识别出待识别图像中的人、汽车、猫、狗等。
[0003]在模型训练过程中,通常是先收集训练样本,对训练样本进行标注,使用带标注的训练样本对模型进行训练。现有的分布式训练方法中,通常是假设不同本地设备(即边缘端)上的训练样本中各种目标数量满足独立同分布的假设条件,即各设备上收集到的样本的目标数量分布相互独立、互不影响,且满足同一种概率分布属性。
[0004]然而,在现实应用过程中,由于实际环境的不同,导致不同设备(即边缘端)上收集到的训练样本中的待识别目标具有不同的分布属性,甚至高度偏态,例如普通居民街道上的摄像头采集的图像中,行人和自行车占据较大比例,而在高速公路上的摄像头采集到的图像中行人和自行车较少,各种类型的汽车更多。还例如,某些特色服饰只会出现在少数民族区域或特定国家,某类动物只会出现在特定区域的动物园监控摄像头中,而如果在图像识别模型的训练过程中,采用上述理想的独立同分布的样本进行分布式模型训练,获得的模型识别准确率不够高,另一方面,在现实中受到数据收集场景的局限,例如,考虑到隐私保护和数据安全的现实问题,无法收集边缘端上产生的历史实际数据,因此,在边缘端上使用历史数据训练得到的模型无法适用于当前场景,适应性不够高。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种图像识别模型训练方法、装置、计算机设备和存储介质。
[0006]一种图像识别模型训练方法,所述方法包括:
[0007]从主节点获取全量训练样本图像集合以及全局非独立同分布程度值;所述全量训练样本图像集合中包括多种识别对象;
[0008]确定本地的目标识别对象,并计算所述全量训练样本图像集合中每种所述识别对象的初始数量;
[0009]基于预设的数据构造规则,根据所述全局非独立同分布程度值和每种识别对象的初始数量,计算得到每种目标识别对象的目标数量;
[0010]根据所述每种目标识别对象的目标数量,构造目标训练样本图像集合;
[0011]利用所述目标训练样本图像集合对图像识别模型进行训练,得到训练好的图像识别模型。
[0012]在其中一个实施例中,所述目标识别对象包括主类识别对象和次类识别对象;所
述基于预设的数据构造规则,根据所述全局非独立同分布程度值和所述每种识别对象的初始数量,计算得到每种目标识别对象的目标数量,包括:
[0013]确定本地的所述主类识别对象和所述次类识别对象;
[0014]根据预设的数据构造规则,根据所述全局非独立同分布程度值,分别计算所述主类识别对象的目标数量和所述次类识别对象的目标数量;其中,所述主类识别对象在本地对象类别中数量占比最大。
[0015]在其中一个实施例中,所述确定本地的所述主类识别对象和所述次类识别对象,包括:
[0016]接收用户预设命令,按照用户预设命令生成所述主类识别对象和所述次类识别对象。
[0017]在其中一个实施例中,所述根据预设的数据构造规则,基于所述全局非独立同分布程度值,分别计算所述主类识别对象的目标数量和所述次类识别对象的目标数量,包括:
[0018]根据所述预设的数据构造规则,计算每种目标识别对象的目标数量为:
[0019][0020]其中,i表示第i种目标识别对象,total_num_label(i)表示第i种目标识别对象的目标数量。当第i种目标识别对象是主类识别对象时,其目标数量由两部分组成:num_basic_part(i)和num_label(i),其中num_basic_part(i)表示第i种目标识别对象的基础目标数量,num_label(i)表示第i种目标识别对象的附加目标数量;当第i种目标识别对象是次类识别对象时,其目标数量仅由附加目标数量num_label(i)构成。
[0021]在其中一个实施例中,所述全局非独立同分布程度值的取值范围为R∈[0,1],其中,R为全局非独立同分布程度值。
[0022]一种图像识别方法,所述方法包括:
[0023]获取待识别图像;所述待识别图像中包含目标识别对象中的至少一个;
[0024]利用上述任一种图像识别模型训练方法训练得到训练好的图像识别模型;
[0025]将所述待识别图像输入至所述训练好的图像识别模型,以识别出所述目标识别对象的类别。
[0026]一种图像识别模型训练装置,所述装置包括:
[0027]训练样本获取模块,用于从主节点获取全量训练样本图像集合以及全局非独立同分布程度值;所述全量训练样本图像集合中包括多种识别对象;
[0028]目标识别对象确定模块,用于确定本地的目标识别对象,并计算所述全量训练样本图像集合中每种所述识别对象的初始数量;
[0029]目标数量计算模块,用于基于预设的数据构造规则,根据所述全局非独立同分布程度值和每种识别对象的初始数量,计算得到每种目标识别对象的目标数量;
[0030]目标训练样本构造模块,用于根据所述每种目标识别对象的目标数量,构造目标训练样本图像集合;
[0031]图像识别模型训练模块,用于利用所述目标训练样本图像集合对图像识别模型进行训练,得到训练好的图像识别模型。
[0032]一种图像识别装置,所述装置包括:
[0033]待识别图像获取模块,用于获取待识别图像;所述待识别图像中包含目标识别对象中的至少一个;
[0034]模型训练模块,用于上述任一种图像识别模型训练方法训练得到训练好的图像识别模型;
[0035]类别识别模块,用于将所述待识别图像输入至所述训练好的图像识别模型,以识别出所述目标识别对象的类别。
[0036]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述图像识别模型训练方法实施例中的各步骤以及上述图像识别方法实施例中的各步骤。
[0037]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述图像识别模型训练方法实施例中的各步骤以及上述图像识别方法实施例中的各步骤。
[0038]一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上述图像识别模型训练方法实施例中的各步骤以及上述图像识别方法实施例中的各步骤。
[0039]上述图像识别模型训练方法、装置、计算机设备和存储介质,包括从主节点获取全量训练样本图像集合和全局非独立同分布程度值;全量训练样本图像集合中包括多种识别对象;确定本地的目标识别对象,并计算全量训练样本图像集合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型训练方法,其特征在于,所述方法包括:从主节点获取全量训练样本图像集合以及全局非独立同分布程度值;所述全量训练样本图像集合中包括多种识别对象;确定本地的目标识别对象,并计算所述全量训练样本图像集合中每种所述识别对象的初始数量;基于预设的数据构造规则,根据所述全局非独立同分布程度值和每种识别对象的初始数量,计算得到每种目标识别对象的目标数量;根据所述每种目标识别对象的目标数量,构造目标训练样本图像集合;利用所述目标训练样本图像集合对图像识别模型进行训练,得到训练好的图像识别模型。2.根据权利要求1所述的方法,其特征在于,所述目标识别对象包括主类识别对象和次类识别对象;所述基于预设的数据构造规则,根据所述全局非独立同分布程度值和每种识别对象的初始数量,计算得到每种目标识别对象的目标数量,包括:确定本地的所述主类识别对象和所述次类识别对象;根据预设的数据构造规则,基于所述全局非独立同分布程度值,分别计算所述主类识别对象的目标数量和所述次类识别对象的目标数量;其中,所述主类识别对象在本地对象类别中数量占比最大。3.根据权利要求2所述的方法,其特征在于,所述确定本地的所述主类识别对象和所述次类识别对象,包括:接收用户预设命令,按照用户预设命令生成所述主类识别对象和所述次类识别对象。4.根据权利要求2所述的方法,其特征在于,所述根据预设的数据构造规则,基于所述全局非独立同分布程度值,分别计算所述主类识别对象的目标数量和所述次类识别对象的目标数量,包括:根据所述预设的数据构造规则,计算每种目标识别对象的目标数量为:其中,i表示第i种目标识别对象,total_num_label(i)表示第i种目标识别对象的目标数量;当第i种目标识别对象是主类识别对象时,其目标数量由两部分组成:num_basic_part(i)和num_label(i),其中num_basic_part(i)表示第i种目标识别对象的基础目标数量,num_label(i)表示第i种目标识别对象的附加目标数量;当第i种目标识别对象是次类识别对...

【专利技术属性】
技术研发人员:戴晶帼陈光苏新铎叶鹏
申请(专利权)人:广州广电运通金融电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1