图像数据处理方法、存储介质、处理器及系统技术方案

技术编号:33727242 阅读:12 留言:0更新日期:2022-06-08 21:21
本申请公开了一种图像数据处理方法、存储介质、处理器及系统。其中,该方法包括:获取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中。本申请解决了现有技术中由于无法有效的从图像中多个区域中筛选出有效区域所导致的区域标注成本高的技术问题。的技术问题。的技术问题。

【技术实现步骤摘要】
图像数据处理方法、存储介质、处理器及系统


[0001]本申请涉及图像识别领域,具体而言,涉及一种图像数据处理方法、存储介质、处理器及系统。

技术介绍

[0002]在算法开发过程中,一般假设测试数据和训练数据是独立同分布的,但在实际应用(如:遥感图像地物分类等)时,由于图像中数据类别繁多,且依据实际需求的不同通常会产生新类别的数据,因此在模型部署后其处理的数据往往不能被完全掌控,也即模型接收到的数据的分布可能不同于训练阶段的训练数据,而这种新类别的数据即为OOD(Out

of

Distribution)样本或称为异常样本。
[0003]为了实现对带有OOD样本的图像的识别,现有的相关技术会依据实际需求而额外收集特定图像并标注特定图像中的所有区域,然后进行模型训练。这种方法由于无法有效的从图像中多个区域中筛选出有效区域,从而提高了区域标注成本,进而降低了图像识别效率。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种图像数据处理方法、存储介质、处理器及系统,以至少解决现有技术中由于无法有效的从图像中多个区域中筛选出有效区域所导致的区域标注成本高的技术问题。
[0006]根据本申请实施例的一个方面,提供了一种图像数据处理方法,包括:获取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
[0007]进一步地,图像数据处理方法还包括:基于预设的机器学习模型对待识别图像的图像数据进行计算,得到至少一个区域所对应的均值和方差值,其中,分布数据至少包括均值和方差值,均值表征了至少一个区域的特征信息,方差值的大小表征至少一个区域为第一区域类型的概率。
[0008]进一步地,图像数据处理方法还包括:在至少一个区域中存在方差值大于预设阈值的第一目标区域时,识别第一目标区域的区域类型为第一区域类型;在至少一个区域中存在方差值小于或等于预设阈值的第二目标区域时,识别第二目标区域的区域类型为第二区域类型,其中,第二区域类型所对应的区域中的对象存储在预设存储区域中。
[0009]进一步地,图像数据处理方法还包括:在识别第一目标区域的区域类型为第一区域类型之后,获取第一目标区域所对应的第一均值以及第二区域类型所对应区域的第二均值;比对第一均值与第二均值,从预设存储区域存储的区域数据中确定与第一目标区域相
似度最高的目标区域;确定目标区域所对应的区域类型为第一目标区域所对应的初始标注类型。
[0010]进一步地,图像数据处理方法还包括:在确定目标区域所对应的区域类型为第一目标区域所对应的初始标注类型之后,响应更新指令,对第一目标区域的初始标注类型进行标注,得到标注区域;基于标注区域对预设数据集中的数据进行更新,其中,预设数据集用于对机器学习模型进行优化训练。
[0011]进一步地,图像数据处理方法还包括:在识别第一目标区域的区域类型为第一区域类型之后,响应删除指令,从至少一个区域中删除第一区域类型所对应的区域。
[0012]进一步地,图像数据处理方法还包括:在根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型之前,从预设的历史记录中获取第一区域类型所对应的区域的第一分布信息以及第二区域类型所对应的区域的第二分布信息;基于第一分布信息以及第二分布信息确定预设阈值。
[0013]进一步地,图像数据处理方法还包括:在基于预设的机器学习模型对待识别图像的图像数据进行计算,得到至少一个区域所对应的均值和方差值之后,对至少一个区域所对应的方差值进行重采样处理,得到缩放系数;对至少一个区域所对应的均值进行分类计算,得到至少一个区域所对应的分数值;计算缩放系数与分数值之间的比值,得到目标分数值;基于目标分数值计算机器学习模型对应的损失函数值;在损失函数值满足预设条件时,对机器学习模型的网络参数进行优化处理。
[0014]根据本申请实施例的另一方面,还提供了一种图像数据处理方法,包括:读取待识别图像,其中,待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;响应图像识别指令,显示至少一个区域所对应的分布数据以及至少一个区域所对应的识别结果,其中,至少一个区域所对应的分布数据是通过对待识别图像的图像数据进行处理得到的,识别结果是根据至少一个区域所对应的分布数据对至少一个区域进行识别所得到的,识别结果表征至少一个区域的区域类型是否为第一区域类型,第一区域类型所对应的区域中的对象未存储在预设存储区域中。
[0015]根据本申请实施例的另一方面,还提供了一种图像数据处理方法,包括:云服务器接收终端设备发送的包含至少一个区域的待识别图像,其中,每个区域中存在至少一个对象;云服务器对待识别图像的图像数据进行处理,得到至少一个区域所对应的分布数据;云服务器根据至少一个区域所对应的分布数据确定至少一个区域的区域类型是否为第一区域类型,得到识别结果,其中,第一区域类型所对应的区域中的对象未存储在预设存储区域中;云服务器将识别结果返回至终端设备上。
[0016]进一步地,图像数据处理方法还包括:在云服务器将识别结果返回至终端设备上之后,云服务器获取终端设备对至少一个区域中的第一区域类型的区域进行标注的标注结果,并基于标注后的第一区域类型的区域对预设数据集进行更新,以对机器学习模型进行优化训练。
[0017]根据本申请实施例的另一方面,还提供了一种图像数据处理方法,包括:获取待识别的遥感图像,其中,遥感图像中包含有至少一个遥感对象;对遥感图像的图像像素进行处理,得到至少一个遥感对象所对应的分布数据;根据至少一个遥感对象所对应的分布数据确定至少一个遥感对象的对象类型是否为第一对象类型,其中,第一对象类型所对应的对
象未存储在预设存储区域中。
[0018]进一步地,至少一个遥感对象至少包括如下之一:遥感地物对象、建筑物对象、遥感水体对象。
[0019]根据本申请实施例的另一方面,还提供了一种图像数据处理方法,包括:获取待识别图像,其中,待识别图像中包含有至少一个物品;对待识别图像的图像像素进行处理,得到至少一个物品所对应的分布数据;根据至少一个物品所对应的分布数据识别至少一个物品所对应的物品类型;基于物品类型确定至少一个物品是否为违规物品。
[0020]根据本申请实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的图像数据处理方法。
[0021]根据本申请实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的图像数据处理方法。
[0022]根据本申请实施例的另一方面,还提供了一种识别图像的系统,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像数据处理方法,其特征在于,包括:获取待识别图像,其中,所述待识别图像中包含有至少一个区域,每个区域中存在至少一个对象;对所述待识别图像的图像数据进行处理,得到所述至少一个区域所对应的分布数据;根据所述至少一个区域所对应的分布数据确定所述至少一个区域的区域类型是否为第一区域类型,其中,所述第一区域类型所对应的区域中的对象未存储在预设存储区域中。2.根据权利要求1所述的方法,其特征在于,对所述待识别图像的图像数据进行处理,得到所述至少一个区域所对应的分布数据,包括:基于预设的机器学习模型对所述待识别图像的图像数据进行计算,得到所述至少一个区域所对应的均值和方差值,其中,所述分布数据至少包括所述均值和所述方差值,所述均值表征了所述至少一个区域的特征信息,所述方差值的大小表征所述至少一个区域为所述第一区域类型的概率。3.根据权利要求2所述的方法,其特征在于,根据所述至少一个区域所对应的分布数据确定所述至少一个区域的区域类型是否为第一区域类型,包括:在所述至少一个区域中存在方差值大于预设阈值的第一目标区域时,识别所述第一目标区域的区域类型为所述第一区域类型;在所述至少一个区域中存在方差值小于或等于所述预设阈值的第二目标区域时,识别所述第二目标区域的区域类型为第二区域类型,其中,所述第二区域类型所对应的区域中的对象存储在所述预设存储区域中。4.根据权利要求3所述的方法,其特征在于,在识别所述第一目标区域的区域类型为所述第一区域类型之后,所述方法还包括:获取所述第一目标区域所对应的第一均值以及所述第二区域类型所对应区域的第二均值;比对所述第一均值与所述第二均值,从所述预设存储区域存储的区域数据中确定与所述第一目标区域相似度最高的目标区域;确定所述目标区域所对应的区域类型为所述第一目标区域所对应的初始标注类型。5.根据权利要求4所述的方法,其特征在于,在确定所述目标区域所对应的区域类型为所述第一目标区域所对应的初始标注类型之后,所述方法还包括:响应更新指令,对所述第一目标区域的初始标注类型进行标注,得到标注区域;基于所述标注区域对预设数据集中的数据进行更新,其中,所述预设数据集用于对所述机器学习模型进行优化训练。6.根据权利要求3所述的方法,其特征在于,在识别所述第一目标区域的区域类型为所述第一区域类型之后,所述方法还包括:响应删除指令,从所述至少一个区域中删除所述第一区域类型所对应的区域。7.根据权利要求3所述的方法,其特征在于,在根据所述至少一个区域所对应的分布数据确定所述至少一个区域的区域类型是否为第一区域类型之前,所述方法还包括:从预设的历史记录中获取所述第一区域类型所对应的区域的第一分布信息以及所述第二区域类型所对应的区域的第二分布信息;基于所述第一分布信息以及所述第二分布信息确定所述预设阈值。

【专利技术属性】
技术研发人员:商磊黄谋潇孙佰贵杨喆王志斌李昊
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1