一种数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:41242816 阅读:15 留言:0更新日期:2024-05-09 23:54
本发明专利技术涉及一种数据处理方法、装置、设备及存储介质,方法包括:获取待处理数据,并从待处理数据中确定出尾部类数据和头部类数据;对尾部类数据进行数据增广,得到增广后的尾部类数据,并针对待训练识别模型的每轮迭代训练,将增广后的尾部类数据和头部类数据拆分成类别均衡的多个子样本数据;利用多个子样本数据对待训练识别模型进行模型训练,得到目标识别模型。本发明专利技术先对待处理数据中的尾部类数据增广,进而对增广后的尾部类数据和头部类数据进行拆分,拆分成类别均衡的多个子样本数据,如此,利用多个类别均衡的子样本数据对待训练识别模型进行模型训练,能够在不需要增加算力和算法复杂度的同时,又能提升尾部类别的精度。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体涉及一种数据处理方法、装置、设备及存储介质


技术介绍

1、随着智能驾驶感知领域的发展,基于深度学习的感知算法由于其具有可进化特征即随着数据的增多和场景的丰富性而使算法的性能不断提升越来越受欢迎。然而,由于实际驾驶场景中各个类别出现的频率差别较大,因此实际采集的数据中各个类别的数量相差较大,进而导致标注的数据中各个类别的数据分布不一致,出现数据倾斜甚至严重的长尾效应。使用长尾数据学习的深度学习模型,必将出现对尾部类的检测效果不理想,无法满足智能驾驶的要求。目前,针对长尾效应的解决方式一般通过增加深度学习模型的复杂度提升尾部类的检测结果精度,如此,容易导致在模型训练的过程中算力增加,复杂度较高的问题。


技术实现思路

1、本专利技术的目的之一在于提供一种数据处理方法,以解决现有技术中的存在的为提高尾部类的检测结果精度造成模型训练的过程中算力增加,复杂度较高的问题;目的之二在于提供一种装置、设备及存储介质。

2、为了实现上述目的,本专利技术采用的技术方案如下:

3本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,所述数据处理方法包括:

2.根据权利要求1所述的数据处理方法,其特征在于,所述从所述待处理数据中确定出尾部类数据和头部类数据,包括:

3.根据权利要求1所述的数据处理方法,其特征在于,所述从所述待处理数据中确定出尾部类数据和头部类数据,包括:

4.根据权利要求1至3任一所述的数据处理方法,其特征在于,所述对所述尾部类数据进行数据增广,得到增广后的尾部类数据,包括:

5.根据权利要求1至3任一所述的数据处理方法,其特征在于,所述将所述增广后的尾部类数据和所述头部类数据拆分成类别均衡的多个子样本数据,包括:...

【技术特征摘要】

1.一种数据处理方法,其特征在于,所述数据处理方法包括:

2.根据权利要求1所述的数据处理方法,其特征在于,所述从所述待处理数据中确定出尾部类数据和头部类数据,包括:

3.根据权利要求1所述的数据处理方法,其特征在于,所述从所述待处理数据中确定出尾部类数据和头部类数据,包括:

4.根据权利要求1至3任一所述的数据处理方法,其特征在于,所述对所述尾部类数据进行数据增广,得到增广后的尾部类数据,包括:

5.根据权利要求1至3任一所述的数据处理方法,其特征在于,所述将所述增广后的尾部类数据和所述头部类数据拆分成类别均衡的多个子样本数据,包括:

6.根据权利要求5所述的数据处理方法,其特...

【专利技术属性】
技术研发人员:刘金彦邓皓匀钱少华
申请(专利权)人:重庆长安科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1