【技术实现步骤摘要】
一种图像目标数据集均衡完备的构建方法
[0001]本专利技术涉及深度学习、计算机视觉和目标识别
,尤其涉及一种图像目标数据集均衡完备的构建方法。
技术介绍
[0002]随着理论技术的日益成熟,人工智能的浪潮正席卷全球,影响着现代社会的所有人。深度学习作为人工智能关键技术之一,其三大核心要素为:大数据、深度学习的算法设计和高性能的计算平台。其中大数据是当前人工智能发展的基础,在目标识别领域,大数据体现为待识别目标图像样本大数据构成的目标数据集。目标数据集的完整性、均衡性和规模大小直接影响目标识别深度学习网络模型的性能。正是在目标数据集的基础上,基于深度学习的目标识别算法得到了很好的发展,涌现了一大批优秀的算法。
[0003]然而在目标数据集构建过程中,受到待识别目标的成像条件、合作/非合作目标、采集条件、成本等诸多因素的影响,目标数据集表现出不均衡且不完备的特征,无法满足实际应用的需要,具体表现为:“训练好的深度网络模型在实验室环境下能够取得很好的目标识别效果,但是在实际应用环境下目标识别效果却极差”。造成这一问 ...
【技术保护点】
【技术特征摘要】
1.一种图像目标数据集均衡完备的构建方法,其特征在于,包括步骤:S1.基于数据集评价指标体系中各个指标的分级对多个样本数据集进行统计,得到样本数据集对应的原始数据,并利用卡方检验方法确定原始数据与满足均匀分布数据的偏离程度;S2.将确定的偏离程度作为比较序列,将实际识别准确率作为参考数列,计算比较序列与参考数列的关联系数和关联度,并根据计算得到的关联系数和关联度确定指标权重值;S3.统计待评价数据集的指标数据,计算统计的指标数据对应的卡方值,设定最优方案和最劣方案,并根据步骤S2中确定的指标权重值,比较待评价数据集与最优方案的贴近度;S4.根据贴近度计算整体、局部评价结果,输出最终评价结果。2.根据权利要求1所述的一种图像目标数据集均衡完备的构建方法,其特征在于,所述步骤S1中基于评价指标体系中各个指标的分级对多个样本数据集进行统计,得到样本数据集对应的原始数据,表示为:S={S
k
|S1,S2,...S
K
}k=1,2,...,K其中,K表示数据集总数;S表示K个数据集按各个指标的分级进行统计的统计量集合;其中,S
k
表示第k个数据集按各个指标的分级进行统计的统计量集合,M表示总指标数;表示第k个数据集中第i个指标的统计量集合,表示为:其中,I
ij
表示第k个数据集中第i个指标下第j个分级的数量;N表示第i个指标下实际分级数。3.根据权利要求2所述的一种图像目标数据集均衡完备的构建方法,其特征在于,所述步骤S1中利用卡方检验方法确定原始数据与满足均匀分布数据的偏离程度,具体为:第k个数据集单一指标下各个分级满足均匀分布,表示为:其中,A
i
表示每个分级下的统计量占整体的比例,E
i
表示每个分级具有相同概率;第k个数据集指标统计量经过卡方检验方法的卡方值集合,表示为:其中,表示第k个数据集指标统计量经过卡方检验方法的卡方值集合。4.根据权利要求1所述的一种图像目标数据集均衡完备的构建方法,其特征在于,所述步骤S2具体包括:S21.将确定的偏离程度作为比较序列,将实际识别准确率作为参考数列,根据灰色关联分析方法,基于数据集评价指标体系比较序列与参考数列的关联性进行分析,并计算关联系数和关联度;S22.将计算得到的关联度经过归一化处理得到指标权重值。5.根据权利要求4所述的一种图像目标数据集均衡完备的构建方法,其特征在于,所述
步骤S21具体包括:S211.将确定的偏离程度作为比较序列,将实际识别准确率作为参考数列,表示为:Y={y(k)|k=1,2,...,K}y(k)=A
k k=1,2,...,KX={x
i
(k)|i=1,2,...,M;k=1,2,...,K}其中,A
k
表示第k个数据集的识别准确率参考值;表示k个数据集中第i个指标统计量经过卡方检验的卡方值集合;Y表示参考数列,即各个样本数据集的实际识别准确率序列;X表示比较数列,即各个样本数据集中各指标的分级的数据统计量经过卡方检验方法计算后的卡方值集合。S212.对数据集中的所有数据进行无量纲化处理,表示为:S212.对数据集中的所有数据进行无量纲化处理,表示为:其中,x
′
i
(k)表示k个数据集中第i个指标统计量经过卡方检验的卡方值集合,x
′
i
(1)表示k个数据集中第1个指标统计量经过卡方检验的卡...
【专利技术属性】
技术研发人员:刘俊,靳远东,徐小康,谷雨,陈华杰,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。