图像数据处理及智能标注方法和系统、设备与可存储介质技术方案

技术编号:34565849 阅读:27 留言:0更新日期:2022-08-17 12:55
本发明专利技术公开了图像数据处理及智能标注方法和系统、设备与可存储介质,属于计算机视觉技术领域。对采集到的待标注图像数据依次进行数据清洗和预处理;将预处理后的待标注图像数据输入至图像数据标注处理系统,执行图像数据标注处理方法;输出待标注图像数据的分类、定位和分割伪标签,作为标注图像数据;人工审核标注图像数据,完成数据校对和数据统计,修改错误并补充遗漏的标注,形成校准审核后的标注图像数据;导出校准审核后的标注图像数据。针对图像数据标注中存在的标注效率低,准确率低,成本高的技术问题,本发明专利技术可对大量测试数据输出伪标签,极大地减少了标注的交互过程,提升了数据的标注效率和准确率,降低了标注成本。本。

【技术实现步骤摘要】
图像数据处理及智能标注方法和系统、设备与可存储介质


[0001]本专利技术涉及计算机视觉
,尤其涉及图像数据处理及智能标注方法和系统、设备与可存储介质。

技术介绍

[0002]随着人工智能行业的发展,数据作为人工智能的底层支撑资源,需要大量带有属性标签的图片以供深度学习算法学习,因此面临着需要大量人工标注数据的问题,随之也衍生了一些智能化标注系统。根据对图像的建模方法,目前应用于智能标注图像的系统大致可分为基于判别式、生成式和半监督方式。基于判别式标注模型对图像建模分析,通过训练分类器提取图像低层视觉特征将待标注数据分类为特征相似性最大的类别;基于生成式标注模型通过在图像和标签之间建立关联模型,根据类别的后验概率大小确定待标注图像的标注;半监督标注模型通过训练过程中联合使用有标签数据和无标签数据以提升标注模型的泛化能力。现有半自动标注技术无针对性,预测标签精确率低,需要大量的人工交互工作以实现精准标注,本质上无法有效地提升各类应用场景下生成的海量图像数据的标注效率。
[0003]现有通用的图像数据标注技术方式大多以适应不同应用行业为目的,包括自动驾驶、智能安防和智慧医疗等,虽具泛化性但本质上无法达到智能化标注,主要依靠人力来完成,标注成本高,相对复杂且耗时;目前基于智能算法标注方式标注速度快,成本相对较低,但所应用的算法对于涉及高层语义的目标识别和提取效果不佳,致使对于待标注数据的标签预测结果准确度较低,标注质量较差,进而使得人工标注占比大于机器标注占比,标注效率低。尤其对于实现自动驾驶所需的分割标注数据,需要标注图像中每个目标的精细边缘,则要消耗大量的人工成本,现有的标注方式难以实现此类需求。此外,基于众包模式数据标注方式也会有隐私泄露的风险,造成用户数据缺乏安全性的问题,且从数据采集到数据交付周期较长等。

技术实现思路

[0004]1.专利技术要解决的技术问题
[0005]针对图像数据标注中存在的标注效率低,准确率低,成本高的技术问题,本专利技术提供了图像数据处理及智能标注方法和系统、设备与可存储介质。可实现一种高精度的定位及分割算法,对大量测试数据输出伪标签,极大地减少了图像标注的交互过程,提升了数据的标注效率和准确率,降低了标注成本。
[0006]2.技术方案
[0007]为解决上述问题,本专利技术提供的技术方案为:
[0008]一种图像数据处理方法,包括:S101、将采集到的图像数据进行数据清洗后形成的数据集A进行人工标注后作为图像训练集A;S102、对预处理后的数据集A的图像进行线性变换,分割成若干块,将块映射成像素点,作为特征图一;特征图一经过N个阶段模块逐步提取
深层特征并输出特征图二,特征图二输入动态卷积注意力模块进一步增强尺度、空间和任务感知能力,经特征金字塔输出不同尺寸的特征图三;S103、对特征图三下采样,应用多层感知机产生掩模预测;对掩模预测的分割掩模进行上采样并采样不确定点,使用多层感知机对采样点独立预测分割标签;重复步骤S102和S103,迭代训练,直至生成的伪标签与图像训练集A真实标签差异最小化为止,步骤S102和S103形成了一种图像数据标注处理方法;其中,阶段模块包括块合并和swin transformer block,所述swin transformer block包括LN,MLP,Window Attention和Shifted Window Attention;N为整数。对大量测试数据输出伪标签,极大地减少了图像标注的交互过程,提升了数据的标注效率和准确率,降低了标注成本。
[0009]进一步的,所述动态卷积注意力模块包括空间感知注意力、尺度感知注意力和任务感知注意力。
[0010]进一步的,步骤S103中,采用双线性插值对特征图三下采样;采用双线性插值对掩模预测的分割掩模进行上采样。
[0011]进一步的,空间感知注意力使用可变形卷积让注意力学习稀疏特征,然后聚合不同层上相同空间位置的特征,尺度感知注意力基于语义重要性动态地融合不同尺度的特征,任务感知注意力动态地开启或关闭特征图二的通道来适应不同的任务。
[0012]一种图像数据处理系统,包括:样本单元,用于将采集到的图像数据进行数据清洗后形成的数据集A进行人工标注后作为图像训练集A;特征提取单元,用于对预处理后的数据集A的图像进行线性变换,分割成若干块,将块映射成像素点,作为特征图一;经过N个阶段模块对特征图一逐步提取深层特征得到特征图二,特征图二输入动态卷积注意力模块进一步增强尺度、空间和任务感知能力,经特征金字塔输出不同尺寸的特征图三;标签生成单元,用于对特征图三下采样,应用多层感知机产生掩模预测;对掩模预测的分割掩模进行上采样并采样不确定点,使用多层感知机对采样点独立预测分割标签;迭代训练单元,用于重复执行特征提取单元和标签生成单元内容,直至与图像训练集A真实标签差异最小化为止;迭代训练完成后生成的特征提取单元和标签生成单元构成了一种图像数据标注处理系统;其中,阶段模块包括块合并和swin transformer block,所述swin transformer block包括LN,MLP,Window Attention和Shifted Window Attention;N为整数。
[0013]一种图像数据智能标注方法,包括:S201、对采集到的待标注图像数据依次进行数据清洗和预处理;S202、将预处理后的待标注图像数据输入至以上所述系统中的一种图像数据标注处理系统,执行根据以上任一项技术方案所述方法生成的一种图像数据标注处理方法;输出待标注图像数据的分类、定位和分割伪标签,作为标注图像数据;S203、人工审核标注图像数据,完成数据校对和数据统计,修改错误并补充遗漏的标注,形成校准审核后的标注图像数据;S204、导出校准审核后的标注图像数据。
[0014]进一步的,所述预处理过程依次包括归一化和数据增强。
[0015]一种图像数据智能标注系统,包括:数据清洗单元,用于对采集到的待标注图像数据进行数据清洗;预处理单元,用于对经过数据清洗的待标注图像数据,进行预处理;标注图像数据单元,用于将预处理后的待标注图像数据输入至以上所述的图像数据标注处理系统,执行以上任一项所述方法生成的一种图像数据标注处理方法;输出待标注图像数据的分类、定位和分割伪标签,作为标注图像数据;人工修正单元,用于人工审核标注图像数据,
完成数据校对和数据统计,修改错误并补充遗漏的标注,形成校准审核后的标注图像数据;图像数据导出单元,用于导出经人工修正单元校准审核后的标注图像数据。
[0016]此外,本专利技术提供了一种设备,所述设备包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如以上所述的方法。
[0017]相应地,本专利技术提供了一种存储有计算机程序的存储介质,该程序被处理器执行时实现如以上任一项所述的方法。
[0018]3.有益效果
[0019]采本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像数据处理方法,其特征在于,包括:S101、将采集到的图像数据进行数据清洗后形成的数据集A进行人工标注后作为图像训练集A;S102、对预处理后的数据集A的图像进行线性变换,分割成若干块,将块映射成像素点,作为特征图一;特征图一经过N个阶段模块逐步提取深层特征并输出特征图二,特征图二输入动态卷积注意力模块进一步增强尺度、空间和任务感知能力,经特征金字塔输出不同尺寸的特征图三;S103、对特征图三下采样,应用多层感知机产生掩模预测;对掩模预测的分割掩模进行上采样并采样不确定点,使用多层感知机对采样点独立预测分割标签;重复步骤S102和S103,迭代训练,直至生成的伪标签与图像训练集A真实标签差异最小化为止,步骤S102和S103形成了一种图像数据标注处理方法;其中,阶段模块包括块合并和swin transformer block,所述swin transformer block包括LN,MLP,Window Attention和Shifted Window Attention;N为整数。2.根据权利要求1所述的方法,其特征在于,所述动态卷积注意力模块包括空间感知注意力、尺度感知注意力和任务感知注意力。3.根据权利要求1所述的方法,其特征在于,步骤S103中,采用双线性插值对特征图三下采样;采用双线性插值对掩模预测的分割掩模进行上采样。4.根据权利要求2所述的方法,其特征在于,空间感知注意力使用可变形卷积让注意力学习稀疏特征,然后聚合不同层上相同空间位置的特征,尺度感知注意力基于语义重要性动态地融合不同尺度的特征,任务感知注意力动态地开启或关闭特征图二的通道来适应不同的任务。5.一种图像数据处理系统,其特征在于,包括:样本单元,用于将采集到的图像数据进行数据清洗后形成的数据集A进行人工标注后作为图像训练集A;特征提取单元,用于对预处理后的数据集A的图像进行线性变换,分割成若干块,将块映射成像素点,作为特征图一;经过N个阶段模块对特征图一逐步提取深层特征得到特征图二,特征图二输入动态卷积注意力模块进一步增强尺度、空间和任务感知能力,经特征金字塔输出不同尺寸的特征图三;标签生成单元,用于对特征图三下采样,应用多层感知机产生掩模预测;对掩模预测的分割掩模进行上采样并采样不确定点,使用多层感知机对采样点独立预测分割标签;迭代训练单元,用于重复执行特征提取单元和标签生成单元内容,直至与...

【专利技术属性】
技术研发人员:杜松显卢江涛唐伟王家奇孟平
申请(专利权)人:杭州野乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1