多策略融合的可疑样本筛选方法、系统、设备及介质技术方案

技术编号:43050489 阅读:28 留言:0更新日期:2024-10-22 14:33
本发明专利技术提供了一种多策略融合的可疑样本筛选方法、系统、设备及介质,所述方法包括:通过多个分类模型对原始数据的自动标注框结果进行类别判别,依据判别结果输出第一可疑样本集,其中,所述判别结果包括可疑或正常;基于聚类算法、匹配算法和离群点算法,对所述原始数据进行判别输出第二可疑样本集;将所述第一可疑样本集与所述第二可疑样本集融合,输出可疑样本。本发明专利技术的方法通过多种策略可以筛选出目标级可疑样本,然后将融合后得到最终的可疑样本,该方法可以有效筛选出大多数误检的检测框,能够极大减少了大规模人工审核的成本。此外该方法通用性较好,除2D场景外也很容易扩展到3D、4D场景等,提高了各场景样本审核效率。

【技术实现步骤摘要】

本专利技术属于智能驾驶领域,涉及样本分析技术,具体涉及一种多策略融合的可疑样本筛选方法、系统、设备及介质


技术介绍

1、现阶段的基于小模型还是大模型的目标检测算法,检测精度上均存在一定上限,利用云端大模型的目标检测算法来做边缘端小模型的真值训练样本已成为行业主流态势,由于云端大模型标注后的样本会存在一定比例的误检,因此需要进行可疑的样本筛选定位和人工审核得到误检样本。

2、目前,现有的可疑样本定位筛选方法通过数据闭环方法实现的,其主要涉及障碍物检测、数据隐私处理、用户语音设备识别、视频序列等方面。例如:专利技术专利cn117390239a,公开了一种基于困难样本挑选的模型训练方法和系统,该方法通过人工标注初始数据集训练初版模型,用不确定性熵图来评价模型对新样本的表现,将模型表现差的样本视为困难样本,通过多次人工采集对应困难样本场景数据和人工标注的方式来更新训练集并重新训练模型,如此反复迭代后得到困难样本。

3、例如专利技术专利cn117539931 a,公开了一种困难样本挖掘方法、装置、设备及其存储介质,该方法通过构造特征置信度的本文档来自技高网...

【技术保护点】

1.一种多策略融合的可疑样本筛选方法,其特征在于,包括:

2.根据权利要求1所述的多策略融合的可疑样本筛选方法,其特征在于,所述通过多个分类模型对原始数据的自动标注框结果进行类别判别,依据判别结果输出第一可疑样本集,包括:

3.根据权利要求2所述的多策略融合的可疑样本筛选方法,其特征在于,所述依据原始类别与所有校验结果的差异,对每个所述检测框是否可疑判别,得到每个所述检测框的判别结果,包括:

4.根据权利要求1所述的多策略融合的可疑样本筛选方法,其特征在于,所述基于聚类算法、匹配算法和离群点算法,对所述原始数据进行判别输出第二可疑样本集,包括:

...

【技术特征摘要】

1.一种多策略融合的可疑样本筛选方法,其特征在于,包括:

2.根据权利要求1所述的多策略融合的可疑样本筛选方法,其特征在于,所述通过多个分类模型对原始数据的自动标注框结果进行类别判别,依据判别结果输出第一可疑样本集,包括:

3.根据权利要求2所述的多策略融合的可疑样本筛选方法,其特征在于,所述依据原始类别与所有校验结果的差异,对每个所述检测框是否可疑判别,得到每个所述检测框的判别结果,包括:

4.根据权利要求1所述的多策略融合的可疑样本筛选方法,其特征在于,所述基于聚类算法、匹配算法和离群点算法,对所述原始数据进行判别输出第二可疑样本集,包括:

5.根据权利要求4所述的多策略融合的可疑样本筛选方法,其特征在于,还包括...

【专利技术属性】
技术研发人员:程建伟宗明扬王雅儒白翔
申请(专利权)人:武汉极目智能技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1