一种构造训练数据集的方法和装置制造方法及图纸

技术编号:29134562 阅读:27 留言:0更新日期:2021-07-02 22:30
本发明专利技术公开了一种构造训练数据集的方法和装置,涉及计算机技术领域。该方法包括:从待标注数据集中随机选取两张待标注图像作为第一待标注图像和第二待标注图像,并确定第一待标注图像的第一基础美学标签和第二待标注图像的第二基础美学标签;将第一待标注图像和第二待标注图像作为输入数据,输入预训练的图像美学比较模型,得到第一评价因子和第二评价因子;根据第一评价因子和第二评价因子,更新所述第一基础美学标签和所述第二基础美学标签;重复上述步骤,直至重复次数达到阈值,将最终得到的基础美学标签作为待标注图像的最终美学标签,以得到训练数据集。该方法和装置降低了标注复杂度和标注成本,提高了可扩展性。

【技术实现步骤摘要】
一种构造训练数据集的方法和装置
本专利技术涉及计算机
,尤其涉及一种构造训练数据集的方法和装置。
技术介绍
图像美学评价衡量了一幅图像在人类眼中的视觉吸引力。目前,图像美学评价算法主要通过深度神经网络深度学习的方式,在大数据集上直接回归图像美学分数。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:在基于深度学习方法的方式中,深度神经网络需要在图像美学数据集上进行训练,而数据集的标注方法需要大量的人力成本。而且,对于不同类目的图像,需要针对每个类目的图像标注一个训练集,这将是一件成本非常昂贵的任务。
技术实现思路
有鉴于此,本专利技术实施例提供一种构造训练数据集的方法和装置,能够降低标注复杂度和标注成本,提高可扩展性。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种构造训练数据集的方法,包括:从待标注数据集中随机选取两张待标注图像作为第一待标注图像和第二待标注图像,并确定第一待标注图像的第一基础美学标签和第二待标注图像的第二基础美学标签;r>将所述第一待标注本文档来自技高网...

【技术保护点】
1.一种构造训练数据集的方法,其特征在于,包括:/n从待标注数据集中随机选取两张待标注图像作为第一待标注图像和第二待标注图像,并确定第一待标注图像的第一基础美学标签和第二待标注图像的第二基础美学标签;/n将所述第一待标注图像和第二待标注图像作为输入数据,输入预训练的图像美学比较模型,得到第一待标注图像的第一评价因子和第二待标注图像的第二评价因子;/n根据所述第一评价因子和所述第二评价因子,更新所述第一基础美学标签和所述第二基础美学标签;/n重复上述步骤,直至重复次数达到阈值,将最终得到的基础美学标签作为待标注图像的最终美学标签,以得到训练数据集。/n

【技术特征摘要】
1.一种构造训练数据集的方法,其特征在于,包括:
从待标注数据集中随机选取两张待标注图像作为第一待标注图像和第二待标注图像,并确定第一待标注图像的第一基础美学标签和第二待标注图像的第二基础美学标签;
将所述第一待标注图像和第二待标注图像作为输入数据,输入预训练的图像美学比较模型,得到第一待标注图像的第一评价因子和第二待标注图像的第二评价因子;
根据所述第一评价因子和所述第二评价因子,更新所述第一基础美学标签和所述第二基础美学标签;
重复上述步骤,直至重复次数达到阈值,将最终得到的基础美学标签作为待标注图像的最终美学标签,以得到训练数据集。


2.根据权利要求1所述的方法,其特征在于,确定第一待标注图像的第一基础美学标签和第二待标注图像的第二基础美学标签包括:
将第一待标注图像和第二待标注图像分别作为输入数据,输入预训练的基础美学评价模型,得到第一待标注图像的第一基础美学标签和第二待标注图像的第二基础美学标签。


3.根据权利要求1所述的方法,其特征在于,根据如下过程训练得到所述图像美学比较模型:
获取各类目的多组图像对,并通过人工方式对每一组图像对进行标注,以生成美学比较训练集;
对所述美学比较训练集进行训练,得到图像美学比较模型。


4.根据权利要求3所述的方法,其特征在于,对所述美学比较训练集进行训练,得到图像美学比较模型包括:
设置多种训练方法和多种模型复杂度;基于所述多种训练方法和多种模型复杂度,对所述美学比较训练集进行训练,得到多个图像美学比较模型。


5.根据权利要求4所述的方法,其特征在于,将所述第一待标注图像和第二待标注图像作为输入数据,输入预训练的图像美学比较模型,得到第一待标注图像的第一评价因子和第二待标注图像的第二评价因子包括:
将所述第一待标注图像和第二待标注图像作为输入数据,输入所述多个图像美学比较模型中的其中一个,得到第一待标注图像的第一评价因子和第二待标注图像的第二评价因子;
根据所述第一评价因子和所述第二评价因子,更新所述第一基础美学标签和所述第二基础美学标签包括:
根据所述第一评价因子和所述第二评价因子,更新所述第一基础美学标签和所述第二基础美学标签,将更新后的第一基础美...

【专利技术属性】
技术研发人员:刘通
申请(专利权)人:北京沃东天骏信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1