【技术实现步骤摘要】
尺度自适应感知的目标计数深度网络设计方法
本专利技术涉及图像处理和模式识别
,尤其涉及尺度自适应感知的目标计数深度网络设计方法。
技术介绍
目标计数是对图片或视频帧中场景内容的一种理解,其在生产生活中变得越来越重要。例如,对公共场所中人群的密度统计,会帮助工作人员及时管理、便于疏导人群,以防拥挤、踩踏事件的发生。对某些果树的果实或者植物进行统计,会帮助果农或者大型养殖场了解植物的生长密度以及产量情况。上述的目标统计将会对生产生活起着指导作用,帮助人们更好的处理存在的问题。在图片或者视频帧中,由于拍摄视角的缘故,目标通常会有不同的视角。例如距离拍摄镜头近的物体尺度较大,相反较远的目标在图片中的尺度较小。这就需要设计的模型考虑目标多尺度的变化。但是由于不同的物体尺度不一样,所以在网络设计模型也需要自适应地条件感知的条件。基于以上分析,本专利技术提出了尺度自适应感知的目标计数深度网络设计方法。
技术实现思路
为了解决上述问题,本专利技术设计了尺度自适应感知的目标计数深度网络设计方法,该方法设计了自 ...
【技术保护点】
1.一种尺度自适应感知的目标计数深度网络设计方法,其特征在于,所述方法包括以下步骤:/n步骤1:制作训练和测试样本集合,将每个图片的目标标注生成真实标签;/n步骤2:将训练集和测试集的图片及其对应的真实标签进行尺寸调整;/n步骤3:建立尺度自适应感知目标计数深度网络模型;/n步骤4:将步骤2获得训练样本输入到步骤3建立的卷积网络模型中,通过Adam优化策略对网络进行参数学习;/n步骤5:深度网络模型测试;网络经步骤4训练完成后,保留网络的卷积层的参数;将测试图片通过步骤1和步骤2操作后输入网络中,将步骤3中卷积层16的输出Pre_net求和,记为当前图片的目标数量。/n
【技术特征摘要】
1.一种尺度自适应感知的目标计数深度网络设计方法,其特征在于,所述方法包括以下步骤:
步骤1:制作训练和测试样本集合,将每个图片的目标标注生成真实标签;
步骤2:将训练集和测试集的图片及其对应的真实标签进行尺寸调整;
步骤3:建立尺度自适应感知目标计数深度网络模型;
步骤4:将步骤2获得训练样本输入到步骤3建立的卷积网络模型中,通过Adam优化策略对网络进行参数学习;
步骤5:深度网络模型测试;网络经步骤4训练完成后,保留网络的卷积层的参数;将测试图片通过步骤1和步骤2操作后输入网络中,将步骤3中卷积层16的输出Pre_net求和,记为当前图片的目标数量。
2.根据权利要求1所述的尺度自适应感知的目标计数深度网络设计方法,其特征在于,所述步骤1具体如下:
步骤101:通过搜索引擎搜集一个特定目标有关的词汇搜索目标图片,或自行拍摄N张带有目标的图片;
步骤102:通过人工方式对步骤101的每张图片的每个目标进行标注,记录每个标注点的位置,进而建立一个特定目标相关数据集;
步骤103:首先将步骤102制作的数据集分为训练集和测试集;设数据集合总共有N个图片和与之对应的目标标注,记数据集合中的图片Dateset={I1,I2,...,IN}和与之对应的目标标注Labelset={l1,l2,...,lN};将前M个图片和它对应的目标标注设为训练集合,记训练图片为Traindate={I1,I2,...,IM}与之对应的标注Labeltrain={l1,l2,...,lM};同时将后N-M个图片和它对应的目标标注设为测试集合;记测试图片为Testdate={IM+1,IM+2,...,IN}与之对应的标注Labeltest={lM+1,lM+2,...,lN};
步骤104:将步骤103中第i个图片Ii转换成高斯密度图deni(x),可通过下述的公式进行计算:
其中表示给定图片的坐标,xj表示标注的目标位置;表示高斯核,其中xj是均值向量和σ2是方差项;如果x不在xj的领域范围内,令此时第i个图片的标签li变换为deni(x);
步骤105:依次对步骤102中的第1张图片直至第N个图片执行步骤104的操作,将图片的标注转换成高斯密度图;从而将训练的标注Labeltrain映射为训练真实标签Labeltrain_new:Labeltrain_new={den1,den2,...,denM},将测试的标注Labeltest映射为测试真实标签Labeltest_new:Labletest_new={denM+1,denM+2,...,denN}。
3.根据权利要求1所述的尺度自适应感知的目标计数深度网络设计方法,其特征在于,所述步骤2具体如下,
步骤201:将图片的尺寸调整为8的整数倍;记第i个图片Ii的尺寸大小为(pi,qi);图片通过插值的方式将尺寸大小调整为8的整数倍,记图片Ii调整后的尺寸大小(xi,yi);调整的计算公式为xi=(pi%8)×8和yi=(qi%8)×8,其中%表示整除操作;
步骤202:将与图片对应的高斯密度图也进行尺度调整;第i个图片Ii对应的真实标签deni(m)的尺寸大小为(pi,qi),通过步骤201中的调整计算公式后得到调整后真实标签den_newi(m)的大小(xi,yi);为了使得目标数量保持不变,对调整后的真实标签进行如下操作;
步骤203:依次对步骤105中的第1张图片直至第N个图片的真实标签执行步骤202的操作。
4.根据权利要求1所述的尺度自适应感知的目标计数深度网络设计方法,其特征在于,所述步骤3建立尺度自适应感知目标计数深度网络模型,网络的具体的模型给出如下:
卷积层1:使用64个3×3的卷积核去卷积输入为x×y×3的图像,经过ReLU激活函数后得到x×y×64的特征;
卷积层2:使用64个3×3的卷积核去卷积卷积层1的输出,经过ReLU激活函数和2×2的最大值池化层后得到(x%2)×(y%2)×64的特征;
卷积层3:使用128个3×3的卷积核去卷积卷积层2的输出,经过ReLU激活函数后得到(x%2)×(y%2)×128的特征;
卷积层4:使用128个3×3的卷积核去卷积卷积层3的输出,经过ReLU激活函数和2×2的最大值池化层后得到(x%2)×(y%2)×128的特征;
卷积层5:使用256个3×3的卷积核去卷积卷积层4的输出,经过ReLU激活函数后得到(x%4)×(y%4)×256的特征;
卷积层6:使用256个3×3的卷积核去卷积卷积层5的输出,经过ReLU激活函数后得到(x%4)×(y%4)×256的特征;
卷积层6_0_1:使用64个1×1的卷积核去卷积卷积层6的输出,经过ReLU激活函数后得到(x%4)×(y%4)×64的特征;
卷积层6_0_2:使用64个3×3的卷积核去卷积卷积层6_0_1的输出,经过ReLU激活函数后得到(x%4)×(y%4)×64的特征;
卷积层6_0_3:使用exp(a1)/(exp(a1)+exp(a2)+exp(a3))乘以卷积层6_0_2的输出后得到(x%4)×(y%4)×64的特征;
卷积层6_1_1:使用64个1×1的卷积核去卷积卷积层6的输出,经过ReLU激活函数后得到(x%4)×(y%4)×64的特征;
卷积层6_1_2:使用64个5×5的卷积核(padding的大小为2)去卷积卷积层6_1_1的输出,经过ReLU激活函数后得到...
【专利技术属性】
技术研发人员:成锋娜,周宏平,张镜洋,程卫国,徐亮,
申请(专利权)人:南京林业大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。