System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于基于深度学习的图像分析的方法和系统技术方案_技高网

用于基于深度学习的图像分析的方法和系统技术方案

技术编号:40840987 阅读:6 留言:0更新日期:2024-04-01 15:07
本公开涉及用于基于深度学习的图像分析的方法和系统。一种基于深度学习的图像分析系统包括:标注模块,其用于基于对训练图像进行的标注来生成训练数据;训练模块,其用于提供多个图像分析功能选项以供用户进行选择,并且利用训练数据对用于所选择的图像分析功能的深度学习模型进行训练,以生成多个经训练的深度学习模型;以及可配置的推断模块,其用于提供可配置的多模型融合架构,该可配置的多模型融合架构是由多个经训练的深度学习模型以串行或并行方式连接形成的,并且用于对输入图像进行图像分析以生成推断结果。

【技术实现步骤摘要】

本公开总体上涉及图像分析,并且更具体地涉及用于基于深度学习的图像分析的方法和系统


技术介绍

1、近年来,基于深度学习的图像分析已经在诸多计算机视觉领域得到了广泛应用,这些计算机视觉领域包括例如缺陷检测、人脸识别、行人重识别、场景文字检测、目标跟踪和自动驾驶,等等。目前已经开发了一些基于深度学习的图像分析软件,通过对深度学习模型(例如,卷积神经网络(convolutional neural network,cnn))进行训练并且利用训练好的模型执行推断来获得针对输入图像的预测结果。然而,这些软件在实际应用中可能存在各种问题。

2、一方面,这些软件往往是针对单一应用场景而开发的(例如,当在缺陷检测领域应用时,这些软件往往只能用于图像分类、目标检测、图像分割等应用场景中的一个特定应用场景),并且通常基于固定的深度学习模型进行训练和推断,以尽可能提高特定模型的识别精度。在这种情况下,这些统一配置的软件可能无法良好地适配其他应用场景,从而导致深度学习模型在应用于其他场景时不能准确获得推断结果,或者获得的推断结果不能满足精度要求。在缺陷检测领域中,用户的需求可能涉及对所采集的产品图像进行分析来识别是否存在缺陷(因此涉及图像分类等应用场景),或者用户的需求可能涉及进一步确定所识别的缺陷的类型、缺陷的面积大小,等等(因此涉及目标检测、图像分割等应用场景)。在这种情况下,针对单一应用场景开发的软件通常难以满足不同的用户需求。此外,由于不同产品可能出现的缺陷的类型(例如,划痕、凹坑、赃污)以及形态是千变万化的,导致上述常规的统一配置的软件在利用固定的深度学习模型的情况下通常难以满足实际应用中针对复杂缺陷的精度要求。

3、另一方面,目前,基于深度学习的图像分析的不同阶段(例如,标注、训练和推断)可能分别在由不同开发者提供的不同软件中完成,导致这些软件无法彼此适配。例如,通过标注软件获得的训练数据可能无法直接作为训练软件的输入,而是需要额外的格式转换操作,从而降低了这些软件的可操作性。此外,由于基于深度学习的图像分析可能在不同的场景中应用,涉及各种各样的安装环境需求,当前开发的软件在不同应用环境中的适配度方面也面临严峻挑战。

4、因此,需要一种在应用场景和安装环境适配性、推断精度、以及操作便捷性等一个或多个方面获得改进的基于深度学习的图像分析方法和系统,以解决当前开发的软件中存在的上述问题。


技术实现思路

1、提供本
技术实现思路
来以简化形式介绍在下面的具体实施方式中进一步描述的一系列概念。本
技术实现思路
不旨在识别要求保护的主题的关键特征或必要特征,也不旨在用于限制要求保护的主题的范围。

2、在一方面,本公开提供了一种基于深度学习的图像分析系统,包括:标注模块,其用于基于对训练图像进行的标注来生成训练数据;训练模块,其用于提供多个图像分析功能选项以供用户进行选择,并且利用所述训练数据对用于所选择的图像分析功能的深度学习模型进行训练,以生成多个经训练的深度学习模型;以及可配置的推断模块,其用于提供可配置的多模型融合架构,所述可配置的多模型融合架构是由所述多个经训练的深度学习模型以串行或并行方式连接形成的,并且用于对输入图像进行图像分析以生成推断结果。

3、在另一方面,本公开提供了一种基于深度学习的图像分析方法,包括:基于对训练图像进行的标注来生成训练数据;提供多个图像分析功能选项以供用户进行选择,并且利用所述训练数据对用于所选择的图像分析功能的深度学习模型进行训练,以生成多个经训练的深度学习模型;以及提供可配置的多模型融合架构,所述可配置的多模型融合架构是由所述多个经训练的深度学习模型以串行或并行方式连接形成的,并且用于对输入图像进行图像分析以生成推断结果。

4、在另一方面,本公开提供了一种用于基于深度学习的图像分析的装置,包括:处理器;以及存储器,所述存储器中存储有一个或多个指令,所述一个或多个指令在由所述处理器执行时,使得所述处理器执行上述方法。

5、在另一方面,本公开提供了一种非暂时性计算机可读存储介质,其包括一个或多个指令,所述一个或多个指令在由计算设备的处理器执行时,使得所述处理器执行上述方法。

本文档来自技高网...

【技术保护点】

1.一种基于深度学习的图像分析系统,包括:

2.根据权利要求1所述的系统,其中,所述标注模块进一步用于提供数据格式转换选项,所述数据格式转换选项用于将所生成的训练数据转换为所述训练模块能够直接使用的格式。

3.根据权利要求1所述的系统,其中,所述标注模块进一步用于提供裁剪选项,所述裁剪选项用于对训练图像进行裁剪并且生成多个图像块以用于分别生成训练数据。

4.根据权利要求1所述的系统,其中,由所述训练模块提供的所述多个图像分析功能选项包括以下各项中的一项或多项:图像分类、目标检测、图像分割、关键点检测、异常检测以及光学字符识别OCR。

5.根据权利要求1所述的系统,其中,所述训练模块进一步用于:针对所选择的图像分析功能,提供多个深度学习模型选项以供所述用户选择。

6.根据权利要求1所述的系统,其中,所述训练模块进一步用于:

7.根据权利要求1所述的系统,其中,所述训练模块进一步用于在训练过程中显示指示训练的损失和准确度的曲线图。

8.根据权利要求1所述的系统,其中,所述训练模块进一步用于提供模型验证选项,所述模型验证选项用于利用测试图片验证所述多个经训练的深度学习模型中的任一个经训练的深度学习模型的有效性。

9.根据权利要求1所述的系统,其中,所述可配置的推断模块进一步包括预处理单元,所述预处理单元用于在利用所述可配置的多模型融合架构对所述输入图像进行图像分析之前对所述输入图像进行预处理。

10.根据权利要求9所述的系统,其中,所述可配置的推断模块进一步包括配置文件单元,所述配置文件单元用于接收由所述用户输入的配置参数,其中,所述配置参数包括由所述预处理单元用于对所述输入图像进行预处理的参数。

11.根据权利要求10所述的系统,其中,所述配置参数进一步包括指定所述可配置的多模型融合架构中的每个经训练的深度学习模型的输入和输出的参数。

12.一种基于深度学习的图像分析方法,包括:

13.根据权利要求12所述的方法,进一步包括提供数据格式转换选项,所述数据格式转换选项用于将所生成的训练数据转换为所述训练模块能够直接使用的格式。

14.根据权利要求12所述的方法,进一步包括提供裁剪选项,所述裁剪选项用于对训练图像进行裁剪并且生成多个图像块以用于分别生成训练数据。

15.根据权利要求12所述的方法,其中,由所述训练模块提供的所述多个图像分析功能选项包括以下各项中的一项或多项:图像分类、目标检测、图像分割、关键点检测、异常检测以及光学字符识别OCR。

16.根据权利要求12所述的方法,进一步包括:针对所选择的图像分析功能,提供多个深度学习模型选项以供所述用户选择。

17.根据权利要求12所述的方法,进一步包括:

18.根据权利要求12所述的方法,进一步包括在训练过程中显示指示训练的损失和准确度的曲线图。

19.根据权利要求12所述的方法,进一步包括提供模型验证选项,所述模型验证选项用于利用测试图片验证所述多个经训练的深度学习模型中的任一个经训练的深度学习模型的有效性。

20.根据权利要求12所述的方法,进一步包括在利用所述可配置的多模型融合架构对所述输入图像进行图像分析之前对所述输入图像进行预处理。

21.根据权利要求20所述的方法,进一步包括接收由所述用户输入的配置参数,其中,所述配置参数包括由所述预处理单元用于对所述输入图像进行预处理的参数。

22.根据权利要求21所述的方法,其中,所述配置参数进一步包括指定所述可配置的多模型融合架构中的每个经训练的深度学习模型的输入和输出的参数。

23.一种用于基于深度学习的图像分析的装置,包括:

24.一种非暂时性计算机可读存储介质,其包括一个或多个指令,所述一个或多个指令在由计算设备的处理器执行时,使得所述处理器执行根据权利要求12-22中任一项所述的方法。

...

【技术特征摘要】

1.一种基于深度学习的图像分析系统,包括:

2.根据权利要求1所述的系统,其中,所述标注模块进一步用于提供数据格式转换选项,所述数据格式转换选项用于将所生成的训练数据转换为所述训练模块能够直接使用的格式。

3.根据权利要求1所述的系统,其中,所述标注模块进一步用于提供裁剪选项,所述裁剪选项用于对训练图像进行裁剪并且生成多个图像块以用于分别生成训练数据。

4.根据权利要求1所述的系统,其中,由所述训练模块提供的所述多个图像分析功能选项包括以下各项中的一项或多项:图像分类、目标检测、图像分割、关键点检测、异常检测以及光学字符识别ocr。

5.根据权利要求1所述的系统,其中,所述训练模块进一步用于:针对所选择的图像分析功能,提供多个深度学习模型选项以供所述用户选择。

6.根据权利要求1所述的系统,其中,所述训练模块进一步用于:

7.根据权利要求1所述的系统,其中,所述训练模块进一步用于在训练过程中显示指示训练的损失和准确度的曲线图。

8.根据权利要求1所述的系统,其中,所述训练模块进一步用于提供模型验证选项,所述模型验证选项用于利用测试图片验证所述多个经训练的深度学习模型中的任一个经训练的深度学习模型的有效性。

9.根据权利要求1所述的系统,其中,所述可配置的推断模块进一步包括预处理单元,所述预处理单元用于在利用所述可配置的多模型融合架构对所述输入图像进行图像分析之前对所述输入图像进行预处理。

10.根据权利要求9所述的系统,其中,所述可配置的推断模块进一步包括配置文件单元,所述配置文件单元用于接收由所述用户输入的配置参数,其中,所述配置参数包括由所述预处理单元用于对所述输入图像进行预处理的参数。

11.根据权利要求10所述的系统,其中,所述配置参数进一步包括指定所述可配置的多模型融合架构中的每个经训练的深度学习模型的输入和输出的参数。

12.一种基于深度学习...

【专利技术属性】
技术研发人员:张翠翠薛廷民
申请(专利权)人:博世汽车部件苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1