当前位置: 首页 > 专利查询>鹏城实验室专利>正文

一种图像数据处理方法、装置、智能终端及存储介质制造方法及图纸

技术编号:33124375 阅读:13 留言:0更新日期:2022-04-17 00:31
本发明专利技术公开了图像数据处理方法、装置、智能终端及存储介质,图像数据处理方法包括:获取待处理图像数据,并获取多个读取工具中的一个目标读取工具;基于目标读取工具读取待处理图像数据,获取预处理图像数据;获取多个数据操作类中的至少一个目标数据操作类,并获取一个目标深度学习框架,其中,每一个预处理图像读取库和每一个上述预处理深度学习框架中都分别包括所有上述数据操作类对应的后端处理函数;基于预处理图像数据的格式、目标数据操作类以及目标深度学习框架对预处理图像数据进行处理,获取目标图像数据。与现有技术相比,本发明专利技术有利于将获取的待处理图像数据快速、方便地转换为与目标深度学习框架格式对应的目标图像数据。标图像数据。标图像数据。

【技术实现步骤摘要】
一种图像数据处理方法、装置、智能终端及存储介质


[0001]本专利技术涉及深度学习图像处理
,尤其涉及的是一种图像数据处理方法、装置、智能终端及存储介质。

技术介绍

[0002]随着科学技术的发展,深度学习技术也得到迅速发展,在图像处理、自然语言处理等应用场景中都得到了广泛应用。同时,伴随着深度学习的发展,为了辅助研究者与从业者更加方便快捷的构建并训练深度学习模型,诞生了深度学习框架。在图像处理领域,开发者进行神经网络模型训练之前,需要对图像数据进行预处理,然后将数据制作成分批次的数据集,输送给模型进行训练或者推理。因此,针对一个深度学习框架,需要其对应的特定格式的图像的数据才能实现后续模型的训练或推理。
[0003]现有技术中,不同的用户(开发者)可能习惯使用不同的深度学习框架。现有技术的问题在于,不同深度学习框架、图像处理库之间支持的图像数据格式和算子操作存在差异,因此当开发者在面对获取的各种不同格式的图像数据和用于处理图像数据的不同深度学习框架,会存在数据格式不兼容的问题,而不同深度学习框架中包括的算子不同,因此存在部分操作(算子)缺失的现象,不利于将图像数据快速、方便地转换为所需的深度学习框架对应所需的格式,从而不利于进行后续的模型训练或推理,且影响用户的操作体验。
[0004]因此,现有技术还有待改进和发展。

技术实现思路

[0005]本专利技术的主要目的在于提供一种图像数据处理方法、装置、智能终端及存储介质,旨在解决现有技术中对于获取的各种不同格式的图像数据和用于处理图像数据的不同深度学习框架,会存在数据格式不兼容的问题,而不同深度学习框架中存在部分操作(算子)缺失的现象,不利于将图像数据快速、方便地转换为所需的深度学习框架对应所需的格式的问题。
[0006]为了实现上述目的,本专利技术第一方面提供一种图像数据处理方法,其中,上述方法包括:
[0007]获取待处理图像数据,并获取多个读取工具中的一个目标读取工具,其中,上述读取工具包括至少一个预处理图像读取库和多个预处理深度学习框架;
[0008]基于上述目标读取工具读取上述待处理图像数据,获取预处理图像数据;
[0009]获取多个数据操作类中的至少一个目标数据操作类,并获取多个上述预处理深度学习框架中的一个目标深度学习框架,其中,每一个上述预处理图像读取库和每一个上述预处理深度学习框架中都分别包括所有上述数据操作类对应的后端处理函数;
[0010]基于上述预处理图像数据的格式、上述目标数据操作类以及上述目标深度学习框架对上述预处理图像数据进行处理,获取目标图像数据,其中,上述目标图像数据的格式与上述目标深度学习框架对应。
[0011]可选的,上述获取待处理图像数据,并获取多个读取工具中的一个目标读取工具,包括:
[0012]获取待处理图像数据,并获取目标对象输入的目标读取工具选择指令;
[0013]基于上述目标读取工具选择指令从所有上述读取工具中选择一个作为目标读取工具。
[0014]可选的,上述获取多个数据操作类中的至少一个目标数据操作类,并获取多个上述预处理深度学习框架中的一个目标深度学习框架,包括:
[0015]获取目标对象输入的目标数据操作类选择指令,基于上述目标数据操作类选择指令从所有上述数据操作类中选择至少一个作为目标数据操作类;
[0016]获取目标对象输入的目标深度学习框架选择指令,基于上述目标深度学习框架选择指令从所有上述预处理深度学习框架中选择一个作为目标深度学习框架。
[0017]可选的,上述预处理图像读取库包括预处理后的OpenCV、预处理后的Python图像库和预处理后的NumPy,上述预处理深度学习框架包括预处理后的TensorFlow、预处理后的PaddlePaddle、预处理后的MindSpore以及预处理后的PyTorch。
[0018]可选的,每一个上述数据操作类对应一种待执行图像数据操作,上述待执行图像数据操作包括剪裁、中心剪裁、填充、归一化和标准化。
[0019]可选的,上述基于上述预处理图像数据的格式、上述目标数据操作类以及上述目标深度学习框架对上述预处理图像数据进行处理,获取目标图像数据,包括:
[0020]基于上述预处理图像数据的格式、上述目标数据操作类以及上述目标深度学习框架获取目标后端处理函数;
[0021]基于上述目标后端处理函数对上述预处理图像数据进行处理,获取目标图像数据。
[0022]可选的,上述基于上述预处理图像数据的格式、上述目标数据操作类以及上述目标深度学习框架获取目标后端处理函数,包括:
[0023]获取与上述预处理图像数据的格式对应的一个预处理图像读取库或一个预处理深度学习框架,作为目标操作处理工具;
[0024]当上述目标操作处理工具与上述目标深度学习框架相同时,获取上述目标操作处理工具对应的目标后端处理函数,其中,上述目标后端处理函数包括上述目标操作处理工具中所有与上述目标数据操作类对应的后端处理函数;
[0025]当上述目标操作处理工具与上述目标深度学习框架不相同时,获取上述目标操作处理工具对应的目标后端处理函数,其中,上述目标后端处理函数包括上述目标操作处理工具中所有与上述目标数据操作类对应的后端处理函数以及格式转换函数,上述格式转换函数用于将上述目标操作处理工具处理后获得的数据的格式转换为上述目标深度学习框架对应的数据格式。
[0026]可选的,在上述基于上述预处理图像数据的格式、上述目标数据操作类以及上述目标深度学习框架对上述预处理图像数据进行处理,获取目标图像数据之后,上述方法还包括:
[0027]基于上述目标图像数据获取上述目标深度学习框架对应的待处理数据集;
[0028]获取多个数据集操作类中的至少一个目标数据集操作类,其中,每一个上述预处
理深度学习框架中都分别包括所有上述数据集操作类对应的后端处理函数;
[0029]基于上述目标数据集操作类对上述待处理数据集进行处理,获取上述目标深度学习框架对应的目标数据集。
[0030]本专利技术第二方面提供一种图像数据处理装置,其中,上述装置包括:
[0031]待处理图像数据获取模块,用于获取待处理图像数据,并获取多个读取工具中的一个目标读取工具,其中,上述读取工具包括至少一个预处理图像读取库和多个预处理深度学习框架;
[0032]预处理模块,用于基于上述目标读取工具读取上述待处理图像数据,获取预处理图像数据;
[0033]目标数据操作类获取模块,用于获取多个数据操作类中的至少一个目标数据操作类,并获取多个上述预处理深度学习框架中的一个目标深度学习框架,其中,每一个上述预处理图像读取库和每一个上述预处理深度学习框架中都分别包括所有上述数据操作类对应的后端处理函数;
[0034]数据处理模块,用于基于上述预处理图像数据的格式、上述目标数据操作类以及上述目标深度学习框架对上述预处理图像数据进行处理,获取目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像数据处理方法,其特征在于,所述方法包括:获取待处理图像数据,并获取多个读取工具中的一个目标读取工具,其中,所述读取工具包括至少一个预处理图像读取库和多个预处理深度学习框架;基于所述目标读取工具读取所述待处理图像数据,获取预处理图像数据;获取多个数据操作类中的至少一个目标数据操作类,并获取多个所述预处理深度学习框架中的一个目标深度学习框架,其中,每一个所述预处理图像读取库和每一个所述预处理深度学习框架中都分别包括所有所述数据操作类对应的后端处理函数;基于所述预处理图像数据的格式、所述目标数据操作类以及所述目标深度学习框架对所述预处理图像数据进行处理,获取目标图像数据,其中,所述目标图像数据的格式与所述目标深度学习框架对应。2.根据权利要求1所述的图像数据处理方法,其特征在于,所述获取待处理图像数据,并获取多个读取工具中的一个目标读取工具,包括:获取待处理图像数据,并获取目标对象输入的目标读取工具选择指令;基于所述目标读取工具选择指令从所有所述读取工具中选择一个作为目标读取工具。3.根据权利要求1所述的图像数据处理方法,其特征在于,所述获取多个数据操作类中的至少一个目标数据操作类,并获取多个所述预处理深度学习框架中的一个目标深度学习框架,包括:获取目标对象输入的目标数据操作类选择指令,基于所述目标数据操作类选择指令从所有所述数据操作类中选择至少一个作为目标数据操作类;获取目标对象输入的目标深度学习框架选择指令,基于所述目标深度学习框架选择指令从所有所述预处理深度学习框架中选择一个作为目标深度学习框架。4.根据权利要求1所述的图像数据处理方法,其特征在于,所述预处理图像读取库包括预处理后的OpenCV、预处理后的Python图像库和预处理后的NumPy,所述预处理深度学习框架包括预处理后的TensorFlow、预处理后的PaddlePaddle、预处理后的MindSpore以及预处理后的PyTorch。5.根据权利要求1所述的图像数据处理方法,其特征在于,每一个所述数据操作类对应一种待执行图像数据操作,所述待执行图像数据操作包括剪裁、中心剪裁、填充、归一化和标准化。6.根据权利要求1所述的图像数据处理方法,其特征在于,所述基于所述预处理图像数据的格式、所述目标数据操作类以及所述目标深度学习框架对所述预处理图像数据进行处理,获取目标图像数据,包括:基于所述预处理图像数据的格式、所述目标数据操作类以及所述目标深度学习框架获取目标后端处理函数;基于所述目标后端处理函数对所述预处理图像数据进行处理,获取目标图像数据。7.根据权利要求6所述的图像数据处理方法,其特征在于,所述基于所述预处理图像数据的格式、所述目标数据操作类以及所述目标深度学习框架获取目标后端处理函数,包括:获取与所述预处理图像数据的格式对应的一个预处理图像读取库或一个预处理深度学习框架,作为目标操作处理工具;当所述目标操作处理工具与所述目标深度学习框架相同时,获取所述目标操作处理工
具对应的目标后端处理函数,其中,所述目标后端处理函数包括所述目标操作处理工具中所有与所述目标数据操作类对应的后端处理函数;当所述目标操作处理工具与所述目标深度学习框架不相同时,获取所述目标操...

【专利技术属性】
技术研发人员:韩佳容董豪赖铖
申请(专利权)人:鹏城实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1