一种GPU资源调度方法及系统技术方案

技术编号：38160784 阅读：11 留言：0更新日期：2023-07-13 09:33

本发明专利技术公开了一种GPU资源调度方法及系统。包括步骤：生成配置文件，所述配置文件包括参数配置及模型权重系数；根据所述配置文件进行初始化；采集图片及其现场设定的光学面信息；对所述图片及所述光学面信息进行推理。采用本发明专利技术的GPU资源调度方法及系统，采用文件合并的方式，利用模型对应的权重载入函数，将模型的权重系数加入到配置文件所包含的字典中，和其他配置信息一起形成一个字典的数据形式，并以pickle的文件格式进行保存，以此形式，基于本方案，在训练结束时，只需输出一个文件，而现场的工程师也只需要一个文件即可完成部署，避免了文件管理带来的效率问题。避免了文件管理带来的效率问题。避免了文件管理带来的效率问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种GPU资源调度方法及系统

[0001]本专利技术涉及工业质检领域及计算机领域，尤其涉及一种GPU资源调度方法及系统。

技术介绍

[0002]目前，工厂中部署的缺陷检测模型在进行推理时，由于机器发送的图片来自不同的光学面，图像的尺寸不固定，使得为其提供推理服务的深度学习模型系统必须能接受动态的图片尺寸，目前常规的深度学习批处理无法应对这种情况；同时，不同光学面的图片需要被不同的模型组合进行处理，而GPU对于模型的加载和资源释放都需要时间成本，而推理服务对于推理速度的要求是必要且苛刻的，如果推理服务启动时有大量的资源未被利用，在生产中会大大降低生产速度。
[0003]在现有技术实际的推理场景下，同一个显卡的计算资源允许多个模型的线程同时访问，但需要根据显卡的显存来设置每个模型在该显卡上推理时所允许的最大线程数。如果线程数过大，同时推理时模型所占用的显存资源超过显卡的实际显存，则无法推理。计算资源配置相同的机器可以使用同一个配置文件进行推理，因此以字典形式存储模型和显卡的最优配置非常适合工厂中批量质检的场景，只要在一台机器上实验出效率最高的模型、显卡、最大线程数，就可以将同样的参数批量配置在拥有同样硬件配置的机器上。
[0004]且在现有技术的生产方式中，现场的工程师在部署时需要配置多个文件，因为过去的配置文件仅仅包含了模型文件的权重路径，但一个方案常常有多个模型，每个模型都有一个权重。在这样的方式下，从模型训练到现场部署，中间需要交互的除了一个配置文件，还需要若干模型文件，造成了文件管理问题，也时常因...

【技术保护点】

【技术特征摘要】
1.一种GPU资源调度方法，其特征在于，所述方法具体包括以下步骤：生成配置文件，所述配置文件包括参数配置及模型权重系数；根据所述配置文件进行初始化；采集图片及其现场设定的光学面信息；对所述图片及所述光学面信息进行推理。2.如权利要求1所述的GPU资源调度方法，其特征在于，对所述图片及所述光学面信息进行推理具体包括以下子步骤：根据所述光学面信息，调取所述配置文件中相对应的所述参数配置及所述模型权重系数，并根据所述参数配置及所述模型权重系数进行实例化；调用检测模型对所述图片进行推理，得到图片中缺陷的检测框信息，并于检测框位置以固定尺寸裁剪，生成缺陷图像；调用分类模型对所述缺陷图像进行判断是否属于某类缺陷，并返回推理结果。3.如权利要求2所述的GPU资源调度方法，其特征在于，所述调用检测模型对所述图片进行推理具体为：根据检测模型自身属性的模型名，调取模型对应的线程队列；若所述队列中有元素，则获取队首的元素，并根据所述元素中提供的索引信息调取所述模型权重系数进行推理，并在推理结束后释放资源，将所述元素放回所述队列的队尾；若队列中没有元素，则阻塞所述推理线程，直至所述推理线程队列不为空。4.如权利要求1所述的GPU资源调度方法，其特征在于，根据所述配置文件进行初始化具体包括以下子步骤：对所述配置文件中的信息进行初始化得到模型池对象；根据所述配置文件中的信息得到所述参数配置对应的字典；用所述模型池对象及所述字典初始化Inference类型对象。5.如权利要求1所述的GPU资源调度方法，其特征在于，采集图片及其现场设定的光学面信息具体为：采集图片及其现场设定的光学面信息，并通过GR...

【专利技术属性】
技术研发人员：戴猛，马元巍，潘正颐，侯大为，童竹勍，
申请(专利权)人：常州微亿智造科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人