本发明专利技术公开了一种图像标注方法和装置。方法包括:从输入图像中截取目标区域图像,在所述输入图像内将所述目标区域图像向外扩充以获取包含背景信息的目标区域补充图像,基于深度神经网络分别提取目标区域图像的图像特征和目标区域补充图像的图像特征;当目标区域图像和目标区域补充图像被判定属于不同类时,基于目标区域图像的图像特征与目标区域补充图像的图像特征之间的差值,以及目标区域图像的图像特征的聚类距离值与目标区域补充图像的图像特征的聚类距离值之间的差值,生成校正系数,利用所述校正系数校正目标区域图像的图像特征的聚类距离值。本发明专利技术进行双目标区域特征提取,增加包含边缘背景信息的补充目标区域特征,提升图像标注精度。
An image annotation method and device
【技术实现步骤摘要】
一种图像标注方法和装置
本专利技术涉及图像处理
,尤其涉及一种图像标注方法和装置。
技术介绍
随着人工智能与大数据技术的快速发展,越来越多的产品开始向智能化发展,数据是智能化产品与应用的基础,从海量数据中挖掘出准确的数据对于人工智能的发展具有重要意义。图像是人工智能领域一类重要的数据类型,通过互联网或摄像头获取的图像均具有数量巨大、种类繁多且杂乱无序的特点,无法在人工智能技术中直接应用。因此,如何快速准确的进行图像的筛选与标注是目前亟待解决的问题。通常使用聚类算法进行图像的标注,主要基于图像原始像素或特征表示,计算图像间距离或相似度,再通过K-means算法、基于模糊C均值等常用聚类算法进行图像聚类与标注。现有技术中,通常对目标区域进行图像特征提取,基于所提取特征计算图像间距离或相似度,再利用常用聚类算法完成对图像聚类分类,进而完成对图像的标注。此类方法中,距离或相似度的计算依赖于图像特征空间表示,现有技术中通常仅基于图像中目标区域提取特征,而同一聚类目标在不同图像中通常存在一定程度的细节差异,这些差异将直接影响相似度计算与聚类结果,最终导致图像标注的准确率并不理想。
技术实现思路
本专利技术实施例提出一种图像标注方法和装置,从而提高图像标注的准确率。本专利技术实施方式的技术方案如下:一种图像标注方法,包括:从输入图像中截取目标区域图像,在所述输入图像内将所述目标区域图像向外扩充以获取包含背景信息的目标区域补充图像,基于深度神经网络(DNN)分别提取目标区域图像的图像特征和目标区域补充图像的图像特征;当目标区域图像和目标区域补充图像被判定属于不同类时,基于目标区域图像的图像特征与目标区域补充图像的图像特征之间的差值,以及目标区域图像的图像特征的聚类距离值与目标区域补充图像的图像特征的聚类距离值之间的差值,生成校正系数,利用所述校正系数校正目标区域图像的图像特征的聚类距离值。在一个实施方式中,所述基于目标区域图像的图像特征与目标区域补充图像的图像特征之间的差值,以及目标区域图像的图像特征的聚类距离值与目标区域补充图像的图像特征的聚类距离值之间的差值,生成校正系数包括:计算校正系数A,其中:其中:目标区域图像的图像特征为ei;目标区域补充图像的图像特征为e’i;N为深度神经网络的特征维度;目标区域图像的图像特征的聚类距离值为sj;目标区域补充图像的图像特征的聚类距离值为sh;目标区域图像被判定为kj类;目标区域补充图像被判定为kh类,其中j≠h;i为特征维度编号。在一个实施方式中,所述利用所述校正系数校正目标区域图像的图像特征的聚类距离值包括:计算sj的校正值s'j,其中s'j=A·sj。在一个实施方式中,还包括:将所述校正值s’j与预定距离阈值进行比较,其中当校正值s’j低于等于所述距离阈值时,继续判定目标区域图像属于kj类;当校正值s’j大于所述距离阈值时,放弃将目标区域图像判定为kj类的聚类结果。在一个实施方式中,还包括:当目标区域图像和目标区域补充图像被判定属于相同类时,计算每个类的平均值,并将该平均值作为该类的新聚类中心。一种图像标注装置,包括:双目标区域表征模块,用于从输入图像中截取目标区域图像,在所述输入图像内将所述目标区域图像向外扩充以获取包含背景信息的目标区域补充图像,基于深度神经网络分别提取目标区域图像的图像特征和目标区域补充图像的图像特征;聚类模块,用于当目标区域图像和目标区域补充图像被判定属于不同类时,基于目标区域图像的图像特征与目标区域补充图像的图像特征之间的差值,以及目标区域图像的图像特征的聚类距离值与目标区域补充图像的图像特征的聚类距离值之间的差值,生成校正系数,利用所述校正系数校正目标区域图像的图像特征的聚类距离值。在一个实施方式中,聚类模块,用于计算校正系数A,其中:其中:目标区域图像的图像特征为ei;目标区域补充图像的图像特征为e’i;N为深度神经网络的特征维度;目标区域图像的图像特征的聚类距离值为sj;目标区域补充图像的图像特征的聚类距离值为sh;目标区域图像被判定为kj类;目标区域补充图像被判定为kh类,其中j≠h;i为特征维度编号。在一个实施方式中,聚类模块,用于计算sj的校正值s'j,其中s'j=A·sj。在一个实施方式中,聚类模块,还用于将所述校正值s’j与预定距离阈值进行比较,其中当校正值s’j低于等于所述距离阈值时,继续判定目标区域图像属于kj类;当校正值s’j大于所述距离阈值时,放弃将目标区域图像判定为kj类的聚类结果。在一个实施方式中,聚类模块,还用于当目标区域图像和目标区域补充图像被判定属于相同类时,计算每个类的平均值,并将该平均值作为该类的新聚类中心。一种图像标注装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上任一项所述的方法。一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上任一项所述的方法。从上述技术方案可以看出,本专利技术实施方式中,从输入图像中截取目标区域图像,在输入图像内将目标区域图像向外扩充以获取包含背景信息的目标区域补充图像,基于深度神经网络分别提取目标区域图像的图像特征和目标区域补充图像的图像特征;当目标区域图像和目标区域补充图像被判定属于不同类时,基于目标区域图像的图像特征与目标区域补充图像的图像特征之间的差值,以及目标区域图像的图像特征的聚类距离值与目标区域补充图像的图像特征的聚类距离值之间的差值,生成校正系数,利用校正系数校正目标区域图像的图像特征的聚类距离值。由此可见,本专利技术进行双目标区域特征提取,增加包含边缘背景信息的补充目标区域特征,充分利用外边界背景补偿信息、减小不同图像中同一目标区域差异对聚类结果影响,提升聚类结果准确度。而且,本专利技术还基于所增加的补充目标区域特征引入校正系数项,对聚类进行辅助计算,提升图像标注精度。附图说明图1为本专利技术图像标注方法的流程图。图2为本专利技术图像标注装置的结构图。图3为本专利技术的图像标注方法的处理示意图。图4为本专利技术的双目标区域表征模块的处理示意图。图5为本专利技术的聚类模块的处理示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步的详细描述。为了描述上的简洁和直观,下文通过描述若干代表性的实施方式来对本专利技术的方案进行阐述。实施方式中大量的细节仅用于帮助理解本专利技术的方案。但是很明显,本专利技术的技术方案实现时可以不局限于这些细节。为了避免不必要地模糊了本专利技术的方案,一些实施方式没有进行细致地描述,而是仅给出了框架。下文中,“包括”是指“包括但不限于”,“根据……”是指“至少根据……,但不限于仅根据……”。由于汉语的语言习惯,下文中没有特别指出一个成分的数量时,意味着该成分可以是一个本文档来自技高网...
【技术保护点】
1.一种图像标注方法,其特征在于,包括:/n从输入图像中截取目标区域图像,在所述输入图像内将所述目标区域图像向外扩充以获取包含背景信息的目标区域补充图像,基于深度神经网络DNN分别提取目标区域图像的图像特征和目标区域补充图像的图像特征;/n当目标区域图像和目标区域补充图像被判定属于不同类时,基于目标区域图像的图像特征与目标区域补充图像的图像特征之间的差值,以及目标区域图像的图像特征的聚类距离值与目标区域补充图像的图像特征的聚类距离值之间的差值,生成校正系数,利用所述校正系数校正目标区域图像的图像特征的聚类距离值。/n
【技术特征摘要】
1.一种图像标注方法,其特征在于,包括:
从输入图像中截取目标区域图像,在所述输入图像内将所述目标区域图像向外扩充以获取包含背景信息的目标区域补充图像,基于深度神经网络DNN分别提取目标区域图像的图像特征和目标区域补充图像的图像特征;
当目标区域图像和目标区域补充图像被判定属于不同类时,基于目标区域图像的图像特征与目标区域补充图像的图像特征之间的差值,以及目标区域图像的图像特征的聚类距离值与目标区域补充图像的图像特征的聚类距离值之间的差值,生成校正系数,利用所述校正系数校正目标区域图像的图像特征的聚类距离值。
2.根据权利要求1所述的图像标注方法,其特征在于,所述基于目标区域图像的图像特征与目标区域补充图像的图像特征之间的差值,以及目标区域图像的图像特征的聚类距离值与目标区域补充图像的图像特征的聚类距离值之间的差值,生成校正系数包括:
计算校正系数A,其中:
其中:目标区域图像的图像特征为ei;目标区域补充图像的图像特征为e’i;N为深度神经网络的特征维度;目标区域图像的图像特征的聚类距离值为sj;目标区域补充图像的图像特征的聚类距离值为sh;目标区域图像被判定为kj类;目标区域补充图像被判定为kh类,其中j≠h;i为特征维度编号。
3.根据权利要求2所述的图像标注方法,其特征在于,所述利用所述校正系数校正目标区域图像的图像特征的聚类距离值包括:
计算sj的校正值s'j,其中s'j=A·sj。
4.根据权利要求3所述的图像标注方法,其特征在于,还包括:
将所述校正值s’j与预定距离阈值进行比较,其中当校正值s’j低于等于所述距离阈值时,继续判定目标区域图像属于kj类;当校正值s’j大于所述距离阈值时,放弃将目标区域图像判定为kj类的聚类结果。
5.根据权利要求1所述的图像标注方法,其特征在于,还包括:
当目标区域图像和目标区域补充图像被判定属于相同类时,计算每个类的平均值,并将该平均值作为该类的新聚类中心。
6.一种图像标注装置,其特征在于,包括:
双目标区域表征模块,用于从输入图像...
【专利技术属性】
技术研发人员:韩璐,
申请(专利权)人:普天信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。