分类模型训练方法、装置、设备、介质及产品制造方法及图纸

技术编号:37136927 阅读:10 留言:0更新日期:2023-04-06 21:37
本发明专利技术实施例提供一种分类模型训练方法、装置、设备、介质及产品,该方法包括:采用预设的分类模型对各类别的第一训练图像样本进行特征提取,以获得各类别的第一特征数据;将所述各类别的第一特征数据映射到特征坐标系中,以获得各类别的第一特征数据对应的分布区域;获取各分布区域中第一特征数据数量最多的分布区域作为基准分布区域,并将除基准分布区域外的其他分布区域确定为待调整分布区域;根据所述基准分布区域对所述待调整分布区域进行区域扩大处理,以获得扩大后的分布区域;根据基准分布区域和扩大后的分布区域对所述预设的分类模型进行训练。本发明专利技术实施例的分类模型训练方法,提高了分类模型分类准确性。提高了分类模型分类准确性。提高了分类模型分类准确性。

【技术实现步骤摘要】
分类模型训练方法、装置、设备、介质及产品


[0001]本专利技术实施例涉及图像识别
,尤其涉及一种分类模型训练方法、装置、设备、介质及产品。

技术介绍

[0002]随着科技的不断发展,图像识别技术应用于越来越多的
中,比如自动驾驶领域、人工智能等,且在其领域中重要程度较高。图像识别技术是通过将图像输入图像识别模型中,识别出图像所属的分类。如要得到识别精确度较高的图像识别模型,需要预先对图像识别模型尤其是其中起分类作用的分类模型进行多次的训练。
[0003]目前对分类模型训练的方式主要是通过大量有类别标注的图像进行训练,该方式由于实际问题中无法做到各类别图像的平衡,导致训练的分类模型分类准确性较低。

技术实现思路

[0004]本专利技术提供一种分类模型训练方法、装置、设备、介质及产品,用以解决目前由于实际问题中无法做到各类别图像的平衡,导致训练的分类模型分类准确性较低的问题。
[0005]本专利技术实施例第一方面提供一种分类模型训练方法,包括:
[0006]采用预设的分类模型对各类别的第一训练图像样本进行特征提取,以获得各类别的第一特征数据;
[0007]将所述各类别的第一特征数据映射到特征坐标系中,以获得各类别的第一特征数据对应的分布区域;
[0008]获取各分布区域中第一特征数据数量最多的分布区域作为基准分布区域,并将除基准分布区域外的其他分布区域确定为待调整分布区域;
[0009]根据所述基准分布区域对所述待调整分布区域进行区域扩大处理,以获得扩大后的分布区域;
[0010]根据基准分布区域和扩大后的分布区域对所述预设的分类模型进行训练。
[0011]可选的,如上所述的方法,所述各类别的第一特征数据具有类别标识;
[0012]所述将所述各类别的第一特征数据映射到特征坐标系中,以获得各类别的第一特征数据对应的分布区域,包括:
[0013]按照各第一特征数据的类别标识,将相同类别标识的第一特征数据映射到特征坐标系的同一区域中,以获得各类别的第一特征数据对应的分布区域。
[0014]可选的,如上所述的方法,所述根据所述基准分布区域对所述待调整分布区域进行区域扩大处理,以获得扩大后的分布区域,包括:
[0015]确定所述基准分布区域和所述待调整分布区域中的类别中心特征;所述类别中心特征为位于对应类别的分布区域中心位置的特征数据;
[0016]采用预设的分类模型根据所述基准分布区域的类别中心特征和除类别中心特征以外的其他第一特征数据确定所述基准分布区域的多个类别边界特征;
[0017]根据所述基准分布区域的类别中心特征、各类别边界特征以及所述待调整分布区域的类别中心特征确定所述待调整分布区域扩大后的多个类别边界特征;其中,所述类别边界特征为位于对应类别的分布区域边界的特征;
[0018]根据所述待调整分布区域扩大后的多个类别边界特征确定所述扩大后的分布区域。
[0019]可选的,如上所述的方法,所述根据所述基准分布区域的类别中心特征、各类别边界特征以及所述待调整分布区域的类别中心特征确定所述待调整分布区域扩大后的多个类别边界特征,包括:
[0020]将所述基准分布区域的类别中心特征与基准分布区域的各类别边界特征之间在特征坐标系中的位置距离确定为类别区域偏移量;
[0021]以待调整分布区域的类别中心特征的位置为基准,按照各所述类别区域偏移量确定所述待调整分布区域扩大后的多个类别边界特征的位置;
[0022]根据所述待调整分布区域扩大后的多个类别边界特征的位置确定所述待调整分布区域扩大后的多个类别边界特征。
[0023]可选的,如上所述的方法,所述根据基准分布区域和扩大后的分布区域对所述预设的分类模型进行训练,包括:
[0024]采用预设的分类模型对各类别的第二训练图像样本进行特征提取,以获得各类别的第二特征数据;所述第二特征数据具有类别标识;
[0025]针对每个第二特征数据,确定当前第二特征数据与各分布区域中的各所述类别边界特征之间在特征坐标系中的最短位置距离;
[0026]将所述最短位置距离对应类别边界特征的所属分布区域确定为当前第二特征数据的分布区域;
[0027]将下一第二特征数据确定为当前第二特征数据,并执行所述确定当前第二特征数据与各分布区域中的各所述类别边界特征之间在特征坐标系中的最短位置距离的步骤;
[0028]判断各所述第二特征数据的分布区域所属类别与该第二特征数据的类别标识是否相同;
[0029]若确定各所述第二特征数据的分布区域所属类别与该第二特征数据的类别标识不同,则调整所述分类模型的参数,以进行训练。
[0030]可选的,如上所述的方法,所述针对每个第二特征数据,确定当前第二特征数据与各分布区域中的各所述类别边界特征之间在特征坐标系中的最短位置距离之前,还包括:
[0031]确定各类别的第二特征数据的数量以及各类别中第二特征数据的最大数量;
[0032]对第二特征数据的数量小于所述最大数量的各类别进行如下处理:
[0033]将当前类别的第二特征数据进行复制处理,以使第二特征数据的数量与所述最大数量相同;
[0034]将下一类别确定为当前类别,并执行所述将当前类别的第二特征数据进行复制处理,以使第二特征数据的数量与所述最大数量相同的步骤,直至处理完所有第二特征数据的数量小于所述最大数量的各类别。
[0035]本专利技术实施例第二方面提供一种分类模型训练装置,包括:
[0036]特征提取模块,用于采用预设的分类模型对各类别的第一训练图像样本进行特征
提取,以获得各类别的第一特征数据;
[0037]特征映射模块,用于将所述各类别的第一特征数据映射到特征坐标系中,以获得各类别的第一特征数据对应的分布区域;
[0038]区域确定模块,用于获取各分布区域中第一特征数据数量最多的分布区域作为基准分布区域,并将除基准分布区域外的其他分布区域确定为待调整分布区域;
[0039]区域扩大模块,用于根据所述基准分布区域对所述待调整分布区域进行区域扩大处理,以获得扩大后的分布区域;
[0040]训练模块,用于根据基准分布区域和扩大后的分布区域对所述预设的分类模型进行训练。
[0041]可选的,如上所述的装置,所述各类别的第一特征数据具有类别标识;
[0042]所述特征映射模块具体用于:
[0043]按照各第一特征数据的类别标识,将相同类别标识的第一特征数据映射到特征坐标系的同一区域中,以获得各类别的第一特征数据对应的分布区域。
[0044]可选的,如上所述的装置,所述区域扩大模块具体用于:
[0045]确定所述基准分布区域和所述待调整分布区域中的类别中心特征;所述类别中心特征为位于对应类别的分布区域中心位置的特征数据;采用预设的分类模型根据所述基准分布区域的类别中心特征和除类别中心特征以外的其他第一特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分类模型训练方法,其特征在于,包括:采用预设的分类模型对各类别的第一训练图像样本进行特征提取,以获得各类别的第一特征数据;将所述各类别的第一特征数据映射到特征坐标系中,以获得各类别的第一特征数据对应的分布区域;获取各分布区域中第一特征数据数量最多的分布区域作为基准分布区域,并将除基准分布区域外的其他分布区域确定为待调整分布区域;根据所述基准分布区域对所述待调整分布区域进行区域扩大处理,以获得扩大后的分布区域;根据基准分布区域和扩大后的分布区域对所述预设的分类模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述各类别的第一特征数据具有类别标识;所述将所述各类别的第一特征数据映射到特征坐标系中,以获得各类别的第一特征数据对应的分布区域,包括:按照各第一特征数据的类别标识,将相同类别标识的第一特征数据映射到特征坐标系的同一区域中,以获得各类别的第一特征数据对应的分布区域。3.根据权利要求2所述的方法,其特征在于,所述根据所述基准分布区域对所述待调整分布区域进行区域扩大处理,以获得扩大后的分布区域,包括:确定所述基准分布区域和所述待调整分布区域中的类别中心特征;所述类别中心特征为位于对应类别的分布区域中心位置的特征数据;采用预设的分类模型根据所述基准分布区域的类别中心特征和除类别中心特征以外的其他第一特征数据确定所述基准分布区域的多个类别边界特征;根据所述基准分布区域的类别中心特征、各类别边界特征以及所述待调整分布区域的类别中心特征确定所述待调整分布区域扩大后的多个类别边界特征;其中,所述类别边界特征为位于对应类别的分布区域边界的特征;根据所述待调整分布区域扩大后的多个类别边界特征确定所述扩大后的分布区域。4.根据权利要求3所述的方法,其特征在于,所述根据所述基准分布区域的类别中心特征、各类别边界特征以及所述待调整分布区域的类别中心特征确定所述待调整分布区域扩大后的多个类别边界特征,包括:将所述基准分布区域的类别中心特征与基准分布区域的各类别边界特征之间在特征坐标系中的位置距离确定为类别区域偏移量;以待调整分布区域的类别中心特征的位置为基准,按照各所述类别区域偏移量确定所述待调整分布区域扩大后的多个类别边界特征的位置;根据所述待调整分布区域扩大后的多个类别边界特征的位置确定所述待调整分布区域扩大后的多个类别边界特征。5.根据权利要求4所述的方法,其特征在于,所述根据基准分布区域和扩大后的分布区域对所述预设的分类模型进行训练,包括:采用预设的分类模型对各类别的第二训练图像样本进行特征提取,以获得各类别的第二特征数据;所述第二特征数据具有类别标识;<...

【专利技术属性】
技术研发人员:刘博李皓翔康昊华刚
申请(专利权)人:运鼎科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1