图像清晰度识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:31581628 阅读:18 留言:0更新日期:2021-12-25 11:25
本公开提供了一种基于深度学习的图像清晰度识别方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域。具体实现方案为:获取目标图像,将目标图像输入预先训练的清晰度识别网络,得到清晰度识别结果;清晰度识别网络包括:特征提取层、交叉注意力层、编码器层和输出层;特征提取层用于提取目标图像的低级语义特征和高级语义特征;交叉注意力层用于基于低级语义特征和高级语义特征进行交叉注意力运算;编码器层用于对拼接特征进行编码,得到编码特征;输出层用于基于编码特征,计算清晰度得分。能够使网络学习到低级语义特征和高级语义特征之间的关系,得到更为准确的清晰度识别结果。得到更为准确的清晰度识别结果。得到更为准确的清晰度识别结果。

【技术实现步骤摘要】
图像清晰度识别方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能
,尤其涉及计算机视觉和深度学习


技术介绍

[0002]在视频、图像的推荐搜索业务中,为了提升用户的使用体验,需要尽可能多的推送优质资源,尽可能少的推送低质资源。资源的质量涉及到很多方面,而清晰度是最为直观的特征之一。因此,如何将海量的视频、图像资源按照清晰度特征准确分类成为了推荐、搜索业务中需要迫切解决的问题。

技术实现思路

[0003]本公开提供了一种图像清晰度识别方法、装置、电子设备及存储介质。
[0004]根据本公开的一方面,提供了一种图像清晰度识别方法,包括:
[0005]获取目标图像,将所述目标图像输入预先训练的清晰度识别网络,得到清晰度识别结果;
[0006]其中,所述清晰度识别网络包括:特征提取层、交叉注意力层、编码器层和输出层;
[0007]所述特征提取层用于提取所述目标图像的低级语义特征和高级语义特征;
[0008]所述交叉注意力层用于基于所述低级语义特征和高级语义特征进行交叉注意力运算,并将运算得到的第一特征和第二特征拼接,得到拼接特征;
[0009]所述编码器层用于对所述拼接特征进行编码,得到编码特征;
[0010]所述输出层用于基于所述编码特征,计算清晰度得分。
[0011]根据本公开的另一方面,提供了一种清晰度识别网络训练方法,包括:
[0012]获取第一样本图像、所述第一样本图像的第一清晰度标签和初始网络,所述第一样本图像是预先生成的失真图像;所述初始网络包括特征提取层、交叉注意力层、编码器层和输出层;
[0013]基于所述第一样本图像以及所述第一清晰度标签对所述初始网络进行预训练,得到预训练网络。
[0014]根据本公开的另一方面,提供了一种图像清晰度识别装置,包括:
[0015]获取模块,用于获取目标图像,将所述目标图像输入预先训练的清晰度识别网络,得到清晰度识别结果;
[0016]其中,所述清晰度识别网络包括:特征提取层、交叉注意力层、编码器层和输出层;
[0017]所述特征提取层用于提取所述目标图像的低级语义特征和高级语义特征;
[0018]所述交叉注意力层用于基于所述低级语义特征和高级语义特征进行交叉注意力运算,并将运算得到的第一特征和第二特征拼接,得到拼接特征;
[0019]所述编码器层用于对所述拼接特征进行编码,得到编码特征;
[0020]所述输出层用于基于所述编码特征,计算清晰度得分。
[0021]根据本公开的另一方面,提供了一种清晰度识别网络训练装置,包括:
[0022]第一获取模块,用于获取第一样本图像、所述第一样本图像的第一清晰度标签和初始网络,所述第一样本图像是预先生成的失真图像;所述初始网络包括特征提取层、交叉注意力层、编码器层和输出层;
[0023]预训练模块,用于基于所述第一样本图像以及所述第一清晰度标签对所述初始网络进行预训练,得到预训练网络。
[0024]根据本公开的又一方面,提供了一种电子设备,包括:
[0025]至少一个处理器;以及
[0026]与所述至少一个处理器通信连接的存储器;其中,
[0027]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行图像清晰度识别方法。
[0028]根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行图像清晰度识别方法。
[0029]根据本公开的又一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现图像清晰度识别方法。
[0030]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0031]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0032]图1为本公开实施例提供的图像清晰度识别方法的一种流程示意图;
[0033]图2为本公开实施例提供的图像清晰度识别方法的一种示意图;
[0034]图3为本公开实施例提供的清晰度识别网络训练方法的一种流程示意图;
[0035]图4是用来实现本公开实施例的图像清晰度识别方法的装置的框图;
[0036]图5是用来实现本公开实施例的清晰度识别网络训练方法的装置的框图;
[0037]图6是用来实现本公开实施例的图像清晰度识别方法的电子设备的框图。
具体实施方式
[0038]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0039]传统的图像清晰度识别方案中,通常包括步骤:特征提取、特征选择和模型分类。
[0040]其中,特征提取表示:提取图像的亮度、分辨度、拉普拉斯变换等特征。
[0041]特征选择表示:利用上述提取到的特征,进行重复迭代实验,最终确定对清晰度分类有增益效果的特征。
[0042]模型分类表示:利用上述选择的特征,采用GBDT(Gradient Boosting Decision Tree,梯度提升决策树)、SVM(support vector machines,支持向量机)等传统机器学习对图像进行清晰度分类。
[0043]上述图像清晰度识别方案,处理流程复杂,无法实现端到端的清晰度识别,特征选
取及调参过程复杂,对选取特征的依赖极高,可操作性差,且清晰度识别准确率较低。
[0044]为了解决上述技术问题,本公开提供了一种图像清晰度识别方法、装置、电子设备及存储介质。
[0045]本公开的一个实施例中,提供了一种图像清晰度识别方法,方法包括:
[0046]获取目标图像,将所述目标图像输入预先训练的清晰度识别模型,得到清晰度识别结果;其中,所述清晰度识别模型包括:特征提取层、交叉注意力层、编码器层和输出层;
[0047]所述特征提取层用于提取所述目标图像的低级语义特征和高级语义特征;
[0048]所述交叉注意力层用于基于所述低级语义特征和高级语义特征进行交叉注意力运算,并将运算得到的第一特征和第二特征拼接,得到拼接特征;
[0049]所述编码器层用于对所述拼接特征进行编码,得到编码特征;
[0050]所述输出层用于基于所述编码特征,计算清晰度得分。
[0051]可见,本公开实施例中,采用深度学习的清晰度识别模型实现了端到端的图像清晰度识别,无需人工选取特征,处理流程简单,并且对清晰本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像清晰度识别方法,包括:获取目标图像,将所述目标图像输入预先训练的清晰度识别网络,得到清晰度识别结果;其中,所述清晰度识别网络包括:特征提取层、交叉注意力层、编码器层和输出层;所述特征提取层用于提取所述目标图像的低级语义特征和高级语义特征;所述交叉注意力层用于基于所述低级语义特征和高级语义特征进行交叉注意力运算,并将运算得到的第一特征和第二特征拼接,得到拼接特征;所述编码器层用于对所述拼接特征进行编码,得到编码特征;所述输出层用于基于所述编码特征,计算清晰度得分。2.根据权利要求1所述的方法,其中,所述特征提取层和交叉注意力层之间,还包括:位置编码层、展平层、多层感知器。3.根据权利要求1所述的方法,其中,所述编码器层包括:Transformer网络中的自注意力层和前馈神经网络层。4.根据权利要求1所述的方法,其中,所述输出层包括:线性变换层和回归层。5.一种清晰度识别网络训练方法,包括:获取第一样本图像、所述第一样本图像的第一清晰度标签和初始网络,所述第一样本图像是预先生成的失真图像;所述初始网络包括特征提取层、交叉注意力层、编码器层和输出层;基于所述第一样本图像以及所述第一清晰度标签对所述初始网络进行预训练,得到预训练网络。6.根据权利要求5所述的方法,还包括:获取第二样本图像;基于所述预训练网络,评估所述第二样本图像的清晰度等级;基于所述清晰度等级,从所述第二样本图像中筛选出特定清晰度等级的第三样本图像;基于所述第三样本图像和人工标注的第三样本图像的清晰度标签,对所述预训练网络进行微调,得到清晰度识别网络。7.一种图像清晰度识别装置,包括:获取模块,用于获取目标图像,将所述目标图像输入预先训练的清晰度识别网络,得到清晰度识别结果;其中,所述清晰度识别网络包括:特征提取层、交叉注意力层、编码器层和输出层;所述特征提取层用于提取所述目标图像的低级语义特征和高级语义特征;所述交叉注意力层用于基于所述低级语义特征和高级语义特征进行交叉注意力运算,并将运算得到的第...

【专利技术属性】
技术研发人员:郑磊波邓天生贠挺于天宝林赛群陈国庆
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1