一种深度学习模型部署方法、设备及介质技术

技术编号:33934211 阅读:14 留言:0更新日期:2022-06-25 22:54
本发明专利技术公开了一种深度学习模型部署方法、设备及介质,其中方法,包括如下步骤,S100、模型训练:对从工业相机获取的缺陷图片进行预处理并利用处理后的缺陷图片对模型进行训练;S200、模型导出:选择部署框架类型,导出模型以及模型说明文件;S300、模型部署:导入从工业相机获取的工业图片,加载并读取模型说明文件,并根据模型说明文件自动选择对应的推断参数,并通过模型识别推断并输出检测结果;本发明专利技术在模型导出的时候同时生成模型说明文件,在模型部署端直接加载模型说明文件,自动匹配选择模型推断框架类型,无需手动选择,操作简单。操作简单。操作简单。

【技术实现步骤摘要】
一种深度学习模型部署方法、设备及介质


[0001]本专利技术涉及工业视觉检测
,具体涉及一种深度学习模型部署方法、设备及介质。

技术介绍

[0002]近年来,深度学习在计算机视觉方向的优势越来越明显,基于深度学习的工业视觉检测也越来越受到重视,但是由于本地部署难度大、能够真正落地并不容易。
[0003]虽然云端部署是一种捷径,可以为中小企业和用户提供简单、便捷的模型部署;但是其存在着严重的隐私泄露的问题,很大一部分企业不愿意将自己的数据共享出去,难以推行下去。
[0004]如已公开的专利CN111488197A,主要针对中小企业和用户提供简单、便捷的模型部署,但是过于依靠云端;本专利技术提出一种深度学习模型部署方法,可以满足在限定的硬件资源条件下进行的深度学习模型以及资源部署,操作简单,效率高,且具有较好的通用性。

技术实现思路

[0005]本专利技术的专利技术目的是提供一种深度学习模型部署方法、设备及介质,操作简单,效率高,且具有较好的通用性。
[0006]为达到上述专利技术目的,本专利技术采用的技术方案是:一种深度学习模型部署方法,包括如下步骤,S100、模型训练:对从工业相机获取的缺陷图片进行预处理并利用处理后的缺陷图片对模型进行训练;S200、模型导出:选择部署框架类型,导出模型以及模型说明文件;S300、模型部署:导入从工业相机获取的工业图片,加载并读取模型说明文件,并根据模型说明文件自动选择对应的推断参数,并通过模型识别推断并输出检测结果。
[0007]优选地,所述S100与S200于一个软件平台上顺序进行。
[0008]优选地,所述S100包括以下步骤:S110、缺陷图片收集与缺陷标注处理,生成训练数据集;S130、将训练数据集分为训练数据以及验证数据;S140、选择模型,通过训练数据集对模型进行训练,并根据训练效果调节训练参数;S150、选择测试图片,测试训练模型是否达到要求,如果没有达到要求则继续训练,如果达到要求停止训练,完成模型训练。
[0009]其中,将训练数据集按(3

5):1随机分为训练数据以及验证数据;更优的,训练数据以及验证数据的比例为4:1。
[0010]其中,训练参数包括模型任务类型、循环次数、批次大小、切分比例、学习率。
[0011]优选地,所述S200包括以下步骤:
S210、选择部署框架类型;S220、针对选择的部署框架类型选择模型格式后进行导出操作;S230、导出模型的同时,生成对应的模型说明文件。
[0012]其中,模型与模型说明文件一一对应。
[0013]优选地,所述模型说明文件里包含模型任务类型、框架类型、推断模型类型、模型加载图片长宽尺寸、加载数据排列格式及其他。
[0014]在实际使用中,模型说明文件为JSON格式(如modelInfo.json),里面记录有对应模型的模型信息,包含以下内容:任务类型(如"task_type":"分类")、模型类型(如"model_type":"精度优先")、框架类型(如"infer_backend_type":"TensorRT")、类别信息(如"class_names":["cat","dog"])、输入批次大小(如"input_batch_size(N)":1,)、输入通道大小(如"input_img_channel(C)":3)、输入高度(如"input_img_height(H)":224)、输入宽度(如"input_img_width(W)":224)、输入数据排列顺序(如input_data_arr":"NCHW")。优选地,所述S300包括以下步骤:S310、通过工业相机拍摄,获得工业图片;S320、加载工业图片以及模型说明文件;S330、读取模型说明文件,并根据模型说明文件自动选择对应的推断参数;S340、加载导出的模型并选择性的设置推断参数;S350、开始推断、获取模型输出数据后,于工业图片上展示最终检测结果。
[0015]其中,所述推断参数里包含模型任务类型、框架类型、推断模型类型、模型加载图片长宽尺寸、加载数据排列格式、得分阈值以及是否使用GPU。
[0016]其中,步骤S340为,对已经自动选择的推断参数(得分阈值,是否使用GPU)的再次调整。
[0017]实际使用中,通过调用c++的JSON库,解析JSON格式的模型说明文件,读取里面记录对应模型的模型信息("task_type"、"model_type"、"infer_backend_type"、"class_names"、"input_batch_size(N)"、input_img_channel(C)、"input_img_height(H)"、"input_img_width(W)"、"input_data_arr"),根据对应的信息内容("分类"、"精度优先"、"TensorRT"、["cat","dog"]、1、3、224、224、"NCHW")在QT界面匹配选择推断。
[0018]“任务类型”、“模型类型”、“推断框架类型”、“类别”、“输入批次大小”、“输入通道大小”、“输入高度”、“输入宽度”、“输入数据排列顺序”,上述参数是从模型说明文件中直接读取的。
[0019]其中“得分阈值”、“是否使用GPU”是默认参数,这些默认参数支持二次修改、选择。
[0020]其中,所述S350包括如下步骤,S351、加载推断模型后开始推断,获取模型输出数据;S352、对模型输出数据进行后处理,获得检测数据,检测数据包括检测类别、检测框坐标、检测框面积、检测得分等信息;S353、对检测数据进行结果过滤,获得检测结果;S354、在输入图像上展示最终检测结果。
[0021]S355、将检测结果传送给后续模块。
[0022]优选地,所述S110与S130之间还包括以下步骤:S120、对训练数据集进行扩增。
[0023]优选地,所述S200还包括以下步骤:S240、对导出的模型进行加密。
[0024]本专利技术还请求保护一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,执行上述的深度学习模型部署方法的指令。
[0025]本专利技术还请求保护一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,执行上所述的深度学习模型部署方法的指令。
[0026]由于上述技术方案运用,本专利技术与现有技术相比具有下列优点:1、本专利技术提供了一种深度学习模型部署方法、设备及介质,在模型导出的时候同时生成模型说明文件,在模型部署端直接加载模型说明文件,自动匹配选择模型推断框架类型,无需手动选择输入,操作简单;2、本专利技术提供了一种深度学习模型部署方法、设备及介质,无需连入云端,可以满足在限定的硬件资源条件下进行的深度学习模型以及资源部署,操作简单,效率高,且具有较好的通用性;3、本专利技术提供了一种深度学习模型部署本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型部署方法,其特征在于,包括如下步骤,S100、模型训练:对从工业相机获取的缺陷图片进行预处理并利用处理后的缺陷图片对模型进行训练;S200、模型导出:选择部署框架类型,导出模型以及模型说明文件;S300、模型部署:导入从工业相机获取的工业图片,加载并读取模型说明文件,并根据模型说明文件自动选择对应的推断参数,并通过模型识别推断并输出检测结果。2.如权利要求1所述的一种深度学习模型部署方法,其特征在于,所述S100与S200于一个软件平台上顺序进行。3.如权利要求1所述的一种深度学习模型部署方法,其特征在于,所述S100包括以下步骤:S110、缺陷图片收集与缺陷标注处理,生成训练数据集;S130、将训练数据集分为训练数据以及验证数据;S140、选择模型,通过训练数据集对模型进行训练,并根据训练效果调节训练参数;S150、选择测试图片,测试训练模型是否达到要求,如果没有达到要求则继续训练,如果达到要求停止训练,完成模型训练。4.如权利要求1所述的一种深度学习模型部署方法,其特征在于,所述S200包括以下步骤:S210、选择部署框架类型;S220、针对选择的部署框架类型选择模型格式后进行导出操作;S230、导出模型的同时,生成对应的模型说明文件。5.如权利要求1所述的一种深度学习模型部署方法,...

【专利技术属性】
技术研发人员:强伟余章卫
申请(专利权)人:苏州中科行智智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1