一种基于图像识别增强的视觉AI精确识别方法技术

技术编号:38756628 阅读:5 留言:0更新日期:2023-09-10 09:41
本发明专利技术公开了一种基于图像识别增强的视觉AI精确识别方法,涉及AI视觉识别技术领域,为了解决图像质量不佳导致后期识别不精准的问题。本基于图像识别增强的视觉AI精确识别方法,通过CNN单帧目标检测器将视频数据进行初步检测,保证最小延迟的前提下,以用户指定的速率聚合多帧检测结果,提供可靠的检测,根据滤波结果对图片进行去噪,确保截取到的图片清晰可见,确保后期的识别更加的精准,将图片进行处理后,再进行多尺度训练,增加了物品识别的精确性,同时又通过压缩方法提高效率,根据梯度递减公式,逐层的向前反馈,形成反向传播机制,可以优化参数,并且通过优化的参数可以加强学习数据参数与数据可以中的参数之间的关联性。关联性。关联性。

【技术实现步骤摘要】
一种基于图像识别增强的视觉AI精确识别方法


[0001]本专利技术涉及AI视觉识别
,具体为一种基于图像识别增强的视觉AI精确识别方法。

技术介绍

[0002]AI视觉识别技术是指利用人工智能,对图像进行对象识别,以识别各种不同模式的目标和对象的技术。
[0003]公开号为CN111428718A的中国专利公开了一种基于图像增强的自然场景文本识别方法,主要通过在文本识别模型中的识别网络模块前引入专门的图像增强模块,并端到端地对整个识别模型进行训练,使得所引入图像增强模块能够自适应地对输入图像进行调整和增强,例如抑制复杂背景、突出文本区域等,从而改善图像的质量,有效提高后继文本识别网络模块的准确率,上述专利虽然解决了图像增强的问题,但是在实际操作中还存在以下问题:1.在对图像进行获取时,由于视频中的图像多角度的截取,使视频图像采集的不完整,视频图像没有进行颜色的调整,使视频图像精度不佳,以及视频数据的延迟导致数据不可靠。
[0004]2.没有对单一的图片以及视频中截取的图片进行进一步的图片处理,从而导致图片质量较差,以及对图片没有进行图像训练,从而导致图片识别精准度降低。
[0005]3.图片参数没有经过更深层的训练学习,从而使图像参数的数据优化率不佳,导致参数与参数之间的关联性降低无法更快速的识别。

技术实现思路

[0006]本专利技术的目的在于提供一种基于图像识别增强的视觉AI精确识别方法,通过CNN单帧目标检测器将视频数据进行初步检测,保证最小延迟的前提下,以用户指定的速率聚合多帧检测结果,提供可靠的检测,根据滤波结果对图片进行去噪,确保截取到的图片清晰可见,确保后期的识别更加的精准,将图片进行处理后,再进行多尺度训练,增加了物品识别的精确性,同时又通过压缩方法提高效率,根据梯度递减公式,逐层的向前反馈,形成反向传播机制,可以优化参数,并且通过优化的参数可以加强学习数据参数与数据可以中的参数之间的关联性,可以解决现有技术中的问题。
[0007]为实现上述目的,本专利技术提供如下技术方案:一种基于图像识别增强的视觉AI精确识别方法,包括:S1:图像采集:根据外部的采集设备将所要拍摄的物体进行拍摄;其中,拍摄的数据分为图像数据和视频数据,视频数据则单独进行数据处理,处理完成后生成视频图像数据;S2:采集图像处理:将图像数据和视频图像数据中的图片进行图片处理;图像处理完成后,将图像进行多尺度检测训练;
S3:处理图像转换:将处理完成图像的数据转换为数字图像信息,并且将每组数字图像信息的参数进行转换;其中,每组数字图像信息参数与相同的数字图像信息进行对应;S4:数字图像训练:将数字图像信息通过深度神经网络计算进行训练,训练完成后标注为学习数据,并且,将学习数据与数据库中的数据进行参数精度对比。
[0008]优选的,针对S1中,视频数据的处理,包括:将视频数据生成动态图像数据,并将动态图像数据进行不同视角的截取;其中,不同的视角采用不同的经纬度截取;将截取完成的图片中失真图片进行的复原性处理,图片融合成重叠度大而且亮度差异小的图片;图片的颜色进行自动调整,将调整完成的图片标注为视频图像数据。
[0009]优选的,所述针对S1中,视频数据的处理,还包括:在视频数据处理之前先通过CNN单帧目标检测器将视频数据进行初步检测;其中,检测方式包括用快速检测旨在以最小的延迟,即变化时间之后的最小时间,在线确定分布变化,并且,将视频数据中的音频数据进行数据提取,并将提取的音频数据进行音频分帧,确定每个音频帧对应的视频数据原件对应的视频帧。
[0010]优选的,针对S2中,采集图像的处理,包括:将图像数据和视频图像数据中的图片进行图片确认,并确定截取到的图片的每个通道对应的灰度图像;再根据灰色图像对每个通道对应的灰度图像进行线性空间滤波得到滤波图像,并将滤波图像进行图像去噪,得到最终图像。
[0011]优选的,针对S2中,多尺度检测训练,包括:将图像缩放至多个尺度下,并将每一个尺度单独地计算特征图;从每个特征图中图像的多个尺度中随机选取一种尺度,将输入图片缩放到该尺度并送入网络中。
[0012]优选的,针对S4中,深度神经网络的计算训练,包括:先将参数数据进行正向传播,其中,参数数据是由低层次向高层次进行传播;当传播得出的数据结果与预期不相符时进行反向传播,其中反向传播是将误差从高层次向底层次进行传播训练;其中,传播训练的过程为:先将参数的权值进行初始化设置,设置完成后,参数数据经过卷积层、下采样层和全连接层的正向传播得到输出值;当误差大于期望值时,将误差传回网络中,依次求得全连接层、下采样层和卷积层的误差;其中各层的误差为网络的总误差;当误差等于或小于期望值时,则训练完成。
[0013]优选的,针对S4中,学习数据与数据库的对比流程,包括:数据库中的包括物体检测板块和面部识别板块;其中,物体检测板块中包括不同种类物体模型的参数;
其中,不同的物体根据图像尺寸参数的比例进行自动适配,面部识别板块为人脸识别,通过边缘检测法与学习数据进行参数对比。
[0014]优选的,针对S4中,学习数据与数据库的对比流程,还包括:根据学习数据中的参数,分别与物体检测板块和面部识别板块中的图像参数进行对比,直至学习数据与数据库中的对比数据的阈值为标准阈值,学习数据与数据库对比至最小阈值后,则将对应的数据库中的参数进行参数提取,参数提取完成后将参数数据进行导出,根据导出的参数代码在显示终端显示对应的学习数据的类型。
[0015]与现有技术相比,本专利技术的有益效果如下:1.本专利技术提供的一种基于图像识别增强的视觉AI精确识别方法,通过CNN单帧目标检测器将视频数据进行初步检测,保证最小延迟的前提下,以用户指定的速率聚合多帧检测结果,提供可靠的检测,使用快速检测(QD)旨在以最小的延迟,即变化时间之后的最小时间,可靠地在线确定分布变化,通过观察更多的(噪声)数据,但增加延迟,可以获得可靠性,利用最快检测理论(MDOD),提出了在视频上工作的最小延迟目标检测器,利用低延迟模型的特性为数据匹配多段视频以作精确的检测和检验,从而更加提高图片识别的精确性,达到精确识别的效果,通过对动态图像数据不同视角以及不同视角下不同经纬度的截取,有效的保证了视频数据中图片的多样性,通过对截取图片的复原性处理以及将图片融合成重叠度大而且亮度差异小的图片,并对图片的颜色进行调整,提高了视频数据中图片的精度与质量,有效的加强了后期识别的效率。
[0016]2.本专利技术提供的一种基于图像识别增强的视觉AI精确识别方法,根据截取到的图片的每个通道对应的灰度图像,再将灰色图像对每个通道对应的灰度图像进行线性空间滤波得到滤波图像,并根据滤波结果对图片进行去噪,确保截取到的图片清晰可见,确保后期的识别更加的精准,将图片进行处理后,再进行多尺度训练,多尺度训练通常是指设置几种不同的图片输入尺度,训练时从多个尺度中随机选取一种尺度,将输入图片缩放到该尺度并送入网络中,是一种简单又有效的提升多尺度物体检测的方法。虽然本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像识别增强的视觉AI精确识别方法,其特征在于,包括:S1:图像采集:根据外部的采集设备将所要拍摄的物体进行拍摄;其中,拍摄的数据分为图像数据和视频数据,视频数据则单独进行数据处理,处理完成后生成视频图像数据;S2:采集图像处理训练:将图像数据和视频图像数据中的图片进行图片处理;图像处理完成后,将图像进行多尺度检测训练;S3:处理图像转换:将处理完成图像的数据转换为数字图像信息,并且将每组数字图像信息的参数进行转换;其中,每组数字图像信息参数与相同的数字图像信息进行对应;S4:数字图像训练:将数字图像信息通过深度神经网络计算进行训练,训练完成后标注为学习数据,并且,将学习数据与数据库中的数据进行参数精度对比。2.根据权利要求1所述的一种基于图像识别增强的视觉AI精确识别方法,其特征在于:针对S1中,视频数据的处理,包括:将视频数据生成动态图像数据,并将动态图像数据进行不同视角的截取;其中,不同的视角采用不同的经纬度截取;将截取完成的图片中失真图片进行的复原性处理,图片融合成重叠度大而且亮度差异小的图片;图片的颜色进行自动调整,将调整完成的图片标注为视频图像数据。3.根据权利要求1所述的一种基于图像识别增强的视觉AI精确识别方法,其特征在于:针对S1中,视频数据的处理,还包括:在视频数据处理之前先通过CNN单帧目标检测器将视频数据进行初步检测;将视频数据中的音频数据进行数据提取,并将提取的音频数据进行音频分帧,确定每个音频帧对应的视频数据原件对应的视频帧。4.根据权利要求1所述的一种基于图像识别增强的视觉AI精确识别方法,其特征在于:针对S2中,采集图像的处理,包括:将图像数据和视频图像数据中的图片进行图片确认,并确定截取到的图片的每个通道对应的灰度图像;再根据灰色图像对每个通道对应的灰度图像进行线性空间滤波得到滤波图像,并将滤波图像进行图像去噪,得到最终...

【专利技术属性】
技术研发人员:沈华江赵潇玮王萍邱松寰吴晓春王伟吴欣烨张传红
申请(专利权)人:上海旋荣科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1