一种用于确定标签的方法与设备技术

技术编号:28146657 阅读:19 留言:0更新日期:2021-04-21 19:32
本申请的目的是提供一种用于确定标签的方法,该方法包括:对于已训练的多个图像标签预测模型中的每个图像标签预测模型,通过该图像标签预测模型对无标签图像数据进行预测,得到所述无标签图像数据对应的预测标签及该预测标签对应的置信度,其中,所述每个图像标签预测模型对应的模型结构和/或模型参数量均不相同;若通过所述多个图像标签预测模型预测得到的多个预测标签满足预定的相似度且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签。本申请以较低成本将积累的大量无标签数据自动转换为有标签数据,能够扩充图像识别模型对应的训练数据集。训练数据集。训练数据集。

【技术实现步骤摘要】
一种用于确定标签的方法与设备


[0001]本申请涉及通信领域,尤其涉及一种用于确定标签的技术。

技术介绍

[0002]随着时代的发展,深度学习已广泛应用于各种领域且取得了巨大进度。深度学习在人脸识别、自动驾驶等图像识别领域所取得的巨大进步的基础之一是大量有标签的图像数据的积累,相对于近年来模型能力以及算力的提升,用于训练的有标签图像数据量仍处于一个较低水平,有标签图像数据的不足已经成为木桶原理中制约模型进一步提升的短板,有标签图像数据的增加能为最终模型性能带来巨大的提升,然后将大量无标签图像数据转换为有标签图像数据所需要的人工标注成本非常高。

技术实现思路

[0003]本申请的一个目的是提供一种用于确定标签的方法与设备。
[0004]根据本申请的一个方面,提供了一种用于确定标签的方法,该方法包括:
[0005]对于已训练的多个图像标签预测模型中的每个图像标签预测模型,通过该图像标签预测模型对无标签图像数据进行预测,得到所述无标签图像数据对应的预测标签及该预测标签对应的置信度,其中,所述每个图像标签预测模型对应的模型结构和/或模型参数量均不相同;
[0006]若通过所述多个图像标签预测模型预测得到的多个预测标签满足预定的相似度且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签。
[0007]根据本申请的一个方面,提供了一种用于确定标签的网络设备,该设备包括:
[0008]一一模块,用于对于已训练的多个图像标签预测模型中的每个图像标签预测模型,通过该图像标签预测模型对无标签图像数据进行预测,得到所述无标签图像数据对应的预测标签及该预测标签对应的置信度,其中,所述每个图像标签预测模型对应的模型结构和/或模型参数量均不相同;
[0009]一二模块,用于若通过所述多个图像标签预测模型预测得到的多个预测标签满足预定的相似度且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签。
[0010]根据本申请的一个方面,提供了一种用于确定标签的设备,其中,该设备包括:
[0011]处理器;以及
[0012]被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如下操作:
[0013]对于已训练的多个图像标签预测模型中的每个图像标签预测模型,通过该图像标签预测模型对无标签图像数据进行预测,得到所述无标签图像数据对应的预测标签及该预测标签对应的置信度,其中,所述每个图像标签预测模型对应的模型结构和/或模型参数量
均不相同;
[0014]若通过所述多个图像标签预测模型预测得到的多个预测标签满足预定的相似度且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签。
[0015]根据本申请的一个方面,提供了一种存储指令的计算机可读介质,所述指令在被执行时使得系统进行如下操作:
[0016]对于已训练的多个图像标签预测模型中的每个图像标签预测模型,通过该图像标签预测模型对无标签图像数据进行预测,得到所述无标签图像数据对应的预测标签及该预测标签对应的置信度,其中,所述每个图像标签预测模型对应的模型结构和/或模型参数量均不相同;
[0017]若通过所述多个图像标签预测模型预测得到的多个预测标签满足预定的相似度且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签。
[0018]根据本申请的一个方面,提供了一种计算机程序产品,包括计算机程序,当所述计算机程序被处理器执行时,执行如下方法:
[0019]对于已训练的多个图像标签预测模型中的每个图像标签预测模型,通过该图像标签预测模型对无标签图像数据进行预测,得到所述无标签图像数据对应的预测标签及该预测标签对应的置信度,其中,所述每个图像标签预测模型对应的模型结构和/或模型参数量均不相同;
[0020]若通过所述多个图像标签预测模型预测得到的多个预测标签满足预定的相似度且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签。
[0021]与现有技术相比,本申请可通过训练的多个图像标签预测模型中的每个图像标签预测模型对无标签图像数据进行预测,得到所述无标签图像数据对应的多个预测标签以及每个预测标签对应的置信度,若预测得到的多个预测标签满足预定的相似度且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签,从而以较低成本将积累的大量无标签数据自动转换为有标签数据,能够扩充图像识别模型对应的训练数据集,进而提高图像识别模型的识别准确率及识别效率。
附图说明
[0022]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0023]图1示出根据本申请一个实施例的一种应用于网络设备端的用于确定标签的方法流程图;
[0024]图2示出根据本申请一个实施例的一种用于确定标签的网络设备结构图;
[0025]图3示出可被用于实施本申请中所述的各个实施例的示例性系统。
[0026]附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
[0027]下面结合附图对本申请作进一步详细描述。
[0028]在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(例如,中央处理器(Central Processing Unit,CPU))、输入/输出接口、网络接口和内存。
[0029]内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(Random Access Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read Only Memory,ROM)或闪存(Flash Memory)。内存是计算机可读介质的示例。
[0030]计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase

Change Memory,PCM)、可编程随机存取存储器(Programmable Random Access Memory,PRAM)、静态随机存取存储器(Static Random

Access Memory,SRAM)、动态随机存取存储器(Dynamic Random Access Memory,DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于确定标签的方法,应用于网络设备端,其中,所述方法包括:对于已训练的多个图像标签预测模型中的每个图像标签预测模型,通过该图像标签预测模型对无标签图像数据进行预测,得到所述无标签图像数据对应的预测标签及该预测标签对应的置信度,其中,所述每个图像标签预测模型对应的模型结构和/或模型参数量均不相同;若通过所述多个图像标签预测模型预测得到的多个预测标签满足预定的相似度且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签。2.根据权利要求1所述的方法,其中,所述方法还包括:根据多个有标签图像数据对未训练的多个图像识别模型进行训练,得到已训练的多个图像标签预测模型,其中,所述多个图像识别模型分别对应不同的模型结构和/或模型参数量。3.根据权利要求1中所述的方法,其中,所述多个预测标签对应的置信度大于或等于第一预定置信度阈值包括所述多个预测标签对应的平均置信度大于或等于所述第一预定置信度阈值。4.根据权利要求3所述的方法,其中,所述多个预测标签对应的置信度大于或等于第一预定置信度阈值还包括所述多个预测标签对应的最小置信度大于或等于第二预定置信度阈值,所述第二预定置信度阈值小于所述第一预定置信度阈值。5.根据权利要求1所述的方法,其中,所述多个预测标签对应的置信度大于或等于第一预定置信度阈值包括每个预测标签对应的置信度均大于或等于所述第一预定置信度阈值。6.根据权利要求1所述的方法,其中,所述多个预测标签对应的置信度大于或等于第一预定置信度阈值包括所述多个预测标签中超过预定比例阈值的至少一个预测标签中的每个预测标签对应的置信度均大于或等于所述第一预定置信度阈值。7.根据权利要求1所述的方法,其中,所述若通过所述多个图像标签预测模型预测得到的多个预测标签满足预定的相似度且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签,包括:若所述多个预测标签均相同且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签。8.根据权利要求7所述的方法,其中,所述若所述多个预测标签均相同且所述多个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述多个预测标签中的一个预测标签确定为所述无标签图像数据的伪标签,包括:根据每个预测标签对应的置信度,从所述多个预测标签中剔除对应的置信度小于或等于第四置信度阈值的至少一个预测标签;若所述多个预测标签中剩余的至少两个预测标签均相同、所述至少两个预测标签相比于所述多个预测标签满足第一预定数量占比且所述至少两个预测标签对应的置信度大于或等于第一预定置信度阈值,将所述至少两个预测标签中的一个预测标签确定为所述无标签图像数...

【专利技术属性】
技术研发人员:侯永杰
申请(专利权)人:上海掌门科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1