【技术实现步骤摘要】
数据清洗方法及相关装置、设备和介质
[0001]本申请涉及图像处理
,特别是涉及一种数据清洗方法及相关装置
、
设备和介质
。
技术介绍
[0002]诸如车辆等对象的图档数据对于研究对象行动轨迹等应用具有极其重要意义
。
[0003]但是,对象的图档数据通常存在噪声,如某一对象的图档数据中还包含其他对象的拍摄图像,从而对后续基于图档数据的下游任务造成干扰
。
目前,对图档数据进行数据清洗的现有技术,通常存在误删除的问题
。
有鉴于此,如何尽可能地减少对图档数据进行数据清洗的误删除,以提升数据清洗的准确性,成为亟待解决的问题
。
技术实现思路
[0004]本申请主要解决的技术问题是提供一种数据清洗方法及相关装置
、
设备和介质,能够尽可能地减少对图档数据进行数据清洗的误删除,以提升数据清洗的准确性
。
[0005]为了解决上述问题,本申请第一方面提供了一种数据清洗方法,包括:分别识别同一对象图档内各个拍摄图像的属性数据;其中,属性数据包括拍摄图像中目标对象关于若干种对象属性的属性值;对于各种对象属性,统计拍摄图像关于对应对象属性的属性值在对象图档中的数量占比;响应于拍摄图像在至少一种对象属性上数量占比不满足第一条件,选择拍摄图像作为待定图像;基于待定图像的图像特征与对象图档的图档特征之间的第一相似度,确定是否将待定图像从对象图档中滤除;其中,图档特征由对象图档内拍摄图像的图像特征融合得到 ...
【技术保护点】
【技术特征摘要】
1.
一种数据清洗方法,其特征在于,包括:分别识别同一对象图档内各个拍摄图像的属性数据;其中,所述属性数据包括所述拍摄图像中目标对象关于若干种对象属性的属性值;对于各种所述对象属性,统计所述拍摄图像关于对应所述对象属性的属性值在所述对象图档中的数量占比;响应于所述拍摄图像在至少一种所述对象属性上所述数量占比不满足第一条件,选择所述拍摄图像作为待定图像;基于所述待定图像的图像特征与所述对象图档的图档特征之间的第一相似度,确定是否将所述待定图像从所述对象图档中滤除;其中,所述图档特征由所述对象图档内所述拍摄图像的图像特征融合得到
。2.
根据权利要求1所述的方法,其特征在于,所述分别识别同一对象图档内各个拍摄图像的属性数据,包括:识别所述拍摄图像关于至少一种第一属性的属性值;其中,所述第一属性为连续取值;所述对于各种所述对象属性,统计所述拍摄图像关于对应所述对象属性的属性值在所述对象图档中的数量占比,至少包括:对于各种所述第一属性,确定所述拍摄图像关于对应所述第一属性的属性值所在的预设区间,并统计所述拍摄图像关于对应所述第一属性对应所述预设区间在所述对象图档中的数量占比
。3.
根据权利要求1所述的方法,其特征在于,所述若干种对象属性还包括至少一种第二属性,且所述第二属性为离散取值
。4.
根据权利要求1所述的方法,其特征在于,所述基于所述待定图像的图像特征与所述对象图档的图档特征之间的第一相似度,确定是否将所述待定图像从所述对象图档中滤除,包括:基于所述第一相似度与第一阈值的比较结果,确定是否将所述待定图像从所述对象图档中滤除;所述方法还包括:获取所述对象图档中所述待定图像之外任一所述拍摄图像的图像特征与所述图档特征之间的第二相似度,并基于所述第二相似度与第二阈值的比较结果,确定是否将对应所述拍摄图像从所述对象图档中滤除;其中,所述第一阈值大于所述第二阈值
。5.
根据权利要求1所述的方法,其特征在于,在所述分别识别同一对象图档内各个拍摄图像的属性数据之前,所述方法还包括:获取所述对象图档中各个所述拍摄图像的图像质量;基于所述拍摄图像的图像质量,选择在所述对象图档中保留或删除所述拍摄图像
。6.
根据权利要求1至5任一项所述的方法,其特征在于,在所述基于所述待定图像的图像特征与所述对象图档的图档特征之间的第一相似度,确定是否将所述待定图像从所述对象图档中滤除之后,所述方法还包括:基于同一所述对象图档中所述拍摄图像的图像特征之间的第三相似度,得到所述对象图档经筛选后的第一图档;
基于不同所述第一图档的图档特征之间的第四相似度,得到所述第一图档经组合合并或单独保留后的第二图档;基于滤除图像的图像特征分别与各个所述第二图档的图档特征之间的第五相似度,将所述滤除图像归入所述第二图档或永久删除;其中,所述滤除图像为确定从所述对象图...
【专利技术属性】
技术研发人员:汪鹏飞,马子昂,
申请(专利权)人:杭州华橙软件技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。