一种基于图像识别增强的视觉AI精确识别方法技术

技术编号：38756628 阅读：5 留言：0更新日期：2023-09-10 09:41

本发明专利技术公开了一种基于图像识别增强的视觉AI精确识别方法，涉及AI视觉识别技术领域，为了解决图像质量不佳导致后期识别不精准的问题。本基于图像识别增强的视觉AI精确识别方法，通过CNN单帧目标检测器将视频数据进行初步检测，保证最小延迟的前提下，以用户指定的速率聚合多帧检测结果，提供可靠的检测，根据滤波结果对图片进行去噪，确保截取到的图片清晰可见，确保后期的识别更加的精准，将图片进行处理后，再进行多尺度训练，增加了物品识别的精确性，同时又通过压缩方法提高效率，根据梯度递减公式，逐层的向前反馈，形成反向传播机制，可以优化参数，并且通过优化的参数可以加强学习数据参数与数据可以中的参数之间的关联性。关联性。关联性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图像识别增强的视觉AI精确识别方法

[0001]本专利技术涉及AI视觉识别
，具体为一种基于图像识别增强的视觉AI精确识别方法。

技术介绍

[0002]AI视觉识别技术是指利用人工智能,对图像进行对象识别,以识别各种不同模式的目标和对象的技术。
[0003]公开号为CN111428718A的中国专利公开了一种基于图像增强的自然场景文本识别方法，主要通过在文本识别模型中的识别网络模块前引入专门的图像增强模块，并端到端地对整个识别模型进行训练，使得所引入图像增强模块能够自适应地对输入图像进行调整和增强，例如抑制复杂背景、突出文本区域等，从而改善图像的质量，有效提高后继文本识别网络模块的准确率，上述专利虽然解决了图像增强的问题，但是在实际操作中还存在以下问题：1.在对图像进行获取时，由于视频中的图像多角度的截取，使视频图像采集的不完整，视频图像没有进行颜色的调整，使视频图像精度不佳，以及视频数据的延迟导致数据不可靠。
[0004]2.没有对单一的图片以及视频中截取的图片进行进一步的图片处理，从而导致图片质量较差，以及对图片没有进行图像训练，从而导致图片识别精准度降低。
[0005]3.图片参数没有经过更深层的训练学习，从而使图像参数的数据优化率不佳，导致参数与参数之间的关联性降低无法更快速的识别。

技术实现思路

[0006]本专利技术的目的在于提供一种基于图像识别增强的视觉AI精确识别方法，通过CNN单帧目标检测器将视频数据进行初步检测，保证最小延迟的前提下，以用户指定...

【技术保护点】

【技术特征摘要】
1.一种基于图像识别增强的视觉AI精确识别方法，其特征在于，包括：S1：图像采集：根据外部的采集设备将所要拍摄的物体进行拍摄；其中，拍摄的数据分为图像数据和视频数据，视频数据则单独进行数据处理，处理完成后生成视频图像数据；S2：采集图像处理训练：将图像数据和视频图像数据中的图片进行图片处理；图像处理完成后，将图像进行多尺度检测训练；S3：处理图像转换：将处理完成图像的数据转换为数字图像信息，并且将每组数字图像信息的参数进行转换；其中，每组数字图像信息参数与相同的数字图像信息进行对应；S4：数字图像训练：将数字图像信息通过深度神经网络计算进行训练，训练完成后标注为学习数据，并且，将学习数据与数据库中的数据进行参数精度对比。2.根据权利要求1所述的一种基于图像识别增强的视觉AI精确识别方法，其特征在于：针对S1中，视频数据的处理，包括：将视频数据生成动态图像数据，并将动态图像数据进行不同视角的截取；其中，不同的视角采用不同的经纬度截取；将截取完成的图片中失真图片进行的复原性处理，图片融合成重叠度大而且亮度差异小的图片；图片的颜色进行自动调整，将调整完成的图片标注为视频图像数据。3.根据权利要求1所述的一种基于图像识别增强的视觉AI精确识别方法，其特征在于：针对S1中，视频数据的处理，还包括：在视频数据处理之前先通过CNN单帧目标检测器将视频数据进行初步检测；将视频数据中的音频数据进行数据提取，并将提取的音频数据进行音频分帧，确定每个音频帧对应的视频数据原件对应的视频帧。4.根据权利要求1所述的一种基于图像识别增强的视觉AI精确识别方法，其特征在于：针对S2中，采集图像的处理，包括：将图像数据和视频图像数据中的图片进行图片确认，并确定截取到的图片的每个通道对应的灰度图像；再根据灰色图像对每个通道对应的灰度图像进行线性空间滤波得到滤波图像，并将滤波图像进行图像去噪，得到最终...

【专利技术属性】
技术研发人员：沈华江，赵潇玮，王萍，邱松寰，吴晓春，王伟，吴欣烨，张传红，
申请(专利权)人：上海旋荣科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人