特定领域的人类模型协同注释工具制造技术

技术编号：33719829 阅读：15 留言：0更新日期：2022-06-08 21:11

一种用于训练人类注释器的人类模型协同注释系统，包括：数据库，所述数据库存储先前由专家人类注释器和/或机器学习注释器注释的图像；显示器，所述显示器显示从所述数据库中选择的图像；注释系统，所述注释系统使所述人类注释器注释呈现在所述显示器上的图像；注释训练系统。所述注释训练系统：从所述数据库中选择图像样本以便由所述人类注释器注释；从所述注释系统接收一个或多个建议的注释；将所述人类注释器的一个或多个建议的注释与所述专家人类注释器或所述机器学习注释器对所述图像样本的先前注释进行比较；在所述显示器上呈现注意力图以使所述人类注释器注意到通过所述比较识别的任何注释错误；根据在所述比较步骤中识别的任何错误从所述数据块中选择下一个训练图像样本。训练图像样本。训练图像样本。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】特定领域的人类模型协同注释工具

[0001]本申请涉及注释工具，具体涉及特定领域的人类模型协同注释工具，这些工具训练人类注释器和机器学习系统，以提高特定领域的图像标记过程的效率。

技术介绍

[0002]在医学成像领域，深度学习被广泛用于解决分类、检测和分割问题。标签(注释)数据对于训练深度学习模型至关重要。但是，医学图像数据类型因使用的成像设备类型和正在检查的解剖/组织而异，这增加了标记此类特定领域数据的难度。
[0003]特定领域的图像注释需要受过专业训练和具有领域知识的注释器。注释器的经验水平在很大程度上影响注释质量。不幸的是，缺乏有经验的注释器来标记不同的生物医学数据，这在提供高效的评估和治疗方面造成了问题。
[0004]目前，有几种通用标记工具用于标记图像。一组标记工具使用手绘注释。例如，LabelIMG工具支持边界框和一类标记。VGG图像注释器具有添加对象和图像属性或标记的选项。其它标记工具，如Supervise.ly和Labelbox，使用模型提供语义分割，并帮助预测标签，以便通过人工确认进行模型训练。其它标记工具使用主动学习或强化学习来训练使用少量标记图像的模型。主动学习模型选择不确定的示例，并寻求人类审核人的帮助，以完成标记。为了产生更准确的预测，机器学习模型被用于AWS SageMaker Ground Truth和华为云ModelArts等系统。这些系统提供了注释工具，这些工具选择图像来显示人类注释器，并使用新标记图像来进一步训练机器学习模型。Polygon RNN++分割工具依次...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于训练人类注释器以注释图像的训练方法，其特征在于，包括：将图像样本呈现给人类注释器用于注释，其中，所述图像样本先前已经由专家人类注释器和机器学习注释器中的至少一个注释；从所述人类注释器接收一个或多个建议的注释；将所述人类注释器的一个或多个建议的注释与所述专家人类注释器或所述机器学习注释器对所述图像样本的先前注释进行比较；呈现注意力图以使所述人类注释器注意到通过所述比较识别的注释错误；根据在所述比较中识别的任何错误选择下一个图像样本。2.根据权利要求1所述的方法，其特征在于，还包括根据所述比较使用加权函数和数字度量来评估所述人类注释器的注释性能。3.根据权利要求2所述的方法，其特征在于，还包括在所述人类注释器被评估为具有高于阈值的注释性能时，呈现用于由所述人类注释器注释的图像样本，并将来自所述人类注释器的注释图像样本添加到图像样本池，所述图像样本池包括先前由所述专家人类注释器或所述机器学习注释器注释的图像样本。4.根据权利要求3所述的方法，其特征在于，来自所述人类注释器的添加到所述池的所述注释图像样本包括基于所述人类注释器的所述注释性能的权重。5.根据权利要求1所述的方法，其特征在于，还包括当所述人类注释器的注释性能高于所述人类注释器已经被训练过的类型的注释的预定水平时，认证所述人类注释器用于未来的注释任务。6.根据权利要求1所述的方法，其特征在于，还包括针对同一组图像比较多个人类注释器的注释性能，以建立所述多个人类注释器的质量度量。7.根据权利要求1所述的方法，其特征在于，呈现注意力图以使所述人类注释器注意到通过所述比较识别的注释错误包括利用所述注意力图在显示器上提供对所述注释错误的个性化解释。8.根据权利要求1所述的方法，其特征在于，所述待注释的图像包括医学图像、地理图像和行业图像中的至少一个。9.一种人类模型协同注释系统，其特征在于，包括：数据库，所述数据库存储先前由专家人类注释器和机器学习注释器中的至少一个注释的图像；显示器，所述显示器显示从所述数据库中选择的图像；注释系统，所述注释系统用于使人类注释器能够注释呈现在所述显示器上的图像；注释训练系统，所述注释训练系统：从所述数据库中选择图像样本以显示在所述显示器上，以便由所述人类注释器注释；从所述注释系统接收一个或多个建议的注释；将所述人类注释器的一个或多个建议的注释与所述专家人类注释器或所述机器学习注释器对所述图像样本的先前注释进行比较；在所述显示器上呈现注意力图以使所述人类注释器注意到通过所述比较识别的任何注释错误；根据在所述比较中识别的任何错误从所述数据块中选择下一个图像样本。10.根据权利要求9所述的系统，其特征在于，所述注释训练系统通过将加权函数和数字度量应用于将所述人类注...

【专利技术属性】
技术研发人员：罗睿，罗杰波，陈林，
申请(专利权)人：华为云计算技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人