一种基于深度学习的动态图像特征捕捉方法技术

技术编号:37423672 阅读:13 留言:0更新日期:2023-04-30 09:45
本发明专利技术公开了一种基于深度学习的动态图像特征捕捉方法,涉及图像识别技术领域,通过对深度卷积神经网络模型的优化,使得深度卷积神经网络模型中对于识别结果不起作用或起负作用的卷积层进行剔除,一方面降低深度卷积神经网络模型的计算量,另一方面能够在已经完成训练的基础上,进一步的提高深度卷积神经网络模型的准确率;同时技术人员通过工具将错误识别的特征标记框进行删除后,将对应的对照视频帧和原始视频帧作为深度卷积神经网络模型的训练样本进行输入,也能使得深度卷积神经网络模型的识别精度更准。模型的识别精度更准。模型的识别精度更准。

【技术实现步骤摘要】
一种基于深度学习的动态图像特征捕捉方法


[0001]本专利技术涉及图像识别
,具体是一种基于深度学习的动态图像特征捕捉方法。

技术介绍

[0002]图像特征主要有图像的颜色特征、纹理特征、形状特征和空间关系特征,颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质,纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征,图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域,空间关系特征,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接关系、交叠关系和包含关系等;
[0003]现有技术中,在对动态图像进行特征提取时,当动态图像中出现多个特征中,容易出现识别结果混乱或错误的情况,如何得到更加准确的动态图像特征捕捉结果,是我们需要解决的问题,为此,现提供一种基于深度学习的动态图像特征捕捉方法。

技术实现思路

[0004]本专利技术的目的在于提供一种基于深度学习的动态图像特征捕捉方法。
[0005]本专利技术的目的可以通过以下技术方案实现:一种基于深度学习的动态图像特征捕捉方法,包括以下步骤:
[0006]步骤S1:对已经完成训练的深度卷积神经网络模型进行优化;
[0007]步骤S2:捕捉动态图像,并对所获得的动态图像进行预处理;
[0008]步骤S3:将经过预处理后的动态图像输入至完成优化的深度卷积神经模型内,并输出动态图像的特征捕捉结果;
[0009]步骤S4:根据所输出的特征捕捉结果,形成动态图像内所需要捕捉的特征的移动轨迹。
[0010]进一步的,深度卷积神经网络模型的训练过程包括:
[0011]构建深度卷积神经网络模型,并完成对所构建的深度卷积神经网络的训练;所述深度卷积神经网络模型由卷积层、池化层以及激活函数层组成;
[0012]对每个卷积层的权重进行设置,根据每个卷积层的权重系数,判断卷积层对深度卷积神经网络模型的影响类型;
[0013]将影响类型为负面影响和无影响的卷积层进行标记,并将所标记的卷积层进行剔除,完成对深度卷积神经网络模型的优化。
[0014]进一步的,对所获得的动态图像的预处理过程包括:
[0015]将所获得的动态图像转化为灰度动态图像;
[0016]将灰度动态图像转化为若干个视频帧;
[0017]获取每个灰度动态图像所转化的视频帧内各个区域的灰度值,并将所获得的灰度
值与视频帧内的对应位置进行关联;
[0018]建立二维坐标系,将视频帧映射至二维坐标系内,并将映射至二维坐标系内的所述视频帧标记为原始视频帧;
[0019]将所获得的所有原始视频帧输入至优化后的深度卷积神经网络模型内。
[0020]进一步的,原始视频帧在输入至深度卷积神经网络模型内后,对原始视频帧内所需要捕捉的特征对应的区域进行标记;
[0021]将完成标记后的原始视频帧进行输出,获得动态图像的特征捕捉结果;
[0022]将所输出的原始视频帧标记为对照视频帧,并将对照视频帧映射至二维坐标系内,将对照视频帧与二维坐标系中已有的对应原始视频帧进行重叠,获取被标记的特征在二维坐标系中的坐标范围。
[0023]进一步的,同一个视频帧内可存在多个所需要捕捉的特征,当视频帧内存在至少两个所需要识别的特征时,则不同的特征的标记均不相同。
[0024]进一步的,动态图像内所需要捕捉的特征的移动轨迹的形成过程包括:
[0025]将每个对照视频帧内所需要捕捉的特征全部进行标记;
[0026]根据每个对照视频帧对应的时间,形成对应的时间戳,并将所形成的时间戳与对应的对照视频帧内所捕捉到的所有特征进行关联;
[0027]并将每个对照视频帧内所标记的特征按照标记的不同,将所需要捕捉的特征进行归类,形成对应的特征集;
[0028]获取特征集内是否存在至少两个特征是属于同一个对照视频帧,用以判断是否存在错误识别,若存在错误识别;
[0029]则获取对应的特征所属的对照视频帧进行调出,由技术人员通过工具,将错误识别的特征标记框进行删除,并将删除结果同步至特征集内;
[0030]将同一个特征集内的特征按照其所关联的时间戳的时间顺序进行排序,并按照排序结果在二维坐标系内形成对应特征的移动轨迹,并将所形成的移动轨迹映射至动态图像内。
[0031]与现有技术相比,本专利技术的有益效果是:通过对卷积层的优化,使得深度卷积神经网络模型中对于识别结果不起作用或起负作用的卷积层进行剔除,一方面降低深度卷积神经网络模型的计算量,另一方面能够在已经完成训练的基础上,进一步的提高深度卷积神经网络模型的准确率;同时技术人员通过工具将错误识别的特征标记框进行删除后,将对应的对照视频帧和原始视频帧作为深度卷积神经网络模型的训练样本进行输入,也能使得深度卷积神经网络模型的识别精度更准。
附图说明
[0032]图1为本专利技术的原理图。
具体实施方式
[0033]如图1所示,一种基于深度学习的动态图像特征捕捉方法,包括以下步骤:
[0034]步骤S1:对已经完成训练的深度卷积神经网络模型进行优化;
[0035]步骤S2:捕捉动态图像,并对所获得的动态图像进行预处理;
[0036]步骤S3:将经过预处理后的动态图像输入至完成优化的深度卷积神经模型内,并输出动态图像的特征捕捉结果;
[0037]步骤S4:根据所输出的特征捕捉结果,形成动态图像内所需要捕捉的特征的移动轨迹。
[0038]需要进一步说明的是,在具体实施过程中,深度卷积神经网络模型的训练过程包括:
[0039]构建深度卷积神经网络模型,并完成对所构建的深度卷积神经网络的训练;所述深度卷积神经网络模型由卷积层、池化层以及激活函数层组成;
[0040]对每个卷积层进行标号,记为i,其中i=1,2,
……
,n,n为整数;
[0041]对每个卷积层的权重进行设置,并将每个卷积层的权重系数记为Q
i

[0042]根据每个卷积层的权重系数对卷积层进行优化,即:
[0043]获取完成训练的深度卷积神经网络的识别准确率,并将完成训练的深度卷积神经网络模型的识别准确率标记为初始识别准确率,将其记为CS;
[0044]将卷积层依次进行剔除,并获取对应卷积层进行剔除后,深度卷积神经网络模型的识别准确率,并将该识别准确率记为参照识别准确率;
[0045]举例说明:
[0046]将标号i=1的卷积层进行剔除,并获得仅含有标号i=2至i=n的卷积层的深度卷积神经网络模型的识别准确率;
[0047]再将标号i=2的卷积层进行剔除,并获得仅含有标号i=1、i=3至i=n的卷积层的深度卷积神经网络模型的识别准确率,以此类推;
[0048]将标号本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的动态图像特征捕捉方法,其特征在于,包括以下步骤:步骤S1:对已经完成训练的深度卷积神经网络模型进行优化;步骤S2:捕捉动态图像,并对所获得的动态图像进行预处理;步骤S3:将经过预处理后的动态图像输入至完成优化的深度卷积神经模型内,并输出动态图像的特征捕捉结果;步骤S4:根据所输出的特征捕捉结果,形成动态图像内所需要捕捉的特征的移动轨迹。2.根据权利要求1所述的一种基于深度学习的动态图像特征捕捉方法,其特征在于,深度卷积神经网络模型的训练过程包括:构建深度卷积神经网络模型,并完成对所构建的深度卷积神经网络的训练;所述深度卷积神经网络模型由卷积层、池化层以及激活函数层组成;对每个卷积层的权重进行设置,根据每个卷积层的权重系数,判断卷积层对深度卷积神经网络模型的影响类型;将影响类型为负面影响和无影响的卷积层进行标记,并将所标记的卷积层进行剔除,完成对深度卷积神经网络模型的优化。3.根据权利要求2所述的一种基于深度学习的动态图像特征捕捉方法,其特征在于,对所获得的动态图像的预处理过程包括:将所获得的动态图像转化为灰度动态图像;将灰度动态图像转化为若干个视频帧;获取每个灰度动态图像所转化的视频帧内各个区域的灰度值,并将所获得的灰度值与视频帧内的对应位置进行关联;建立二维坐标系,将视频帧映射至二维坐标系内,并将映射至二维坐标系内的所述视频帧标记为原始视频帧;将所获得的所有原始视频帧输入至优化后的深度卷积神经网络模型内。4.根据权利要求3所述的一种基于深度学习的动态图像特征捕捉方法...

【专利技术属性】
技术研发人员:殷波
申请(专利权)人:贵州交通职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1