【技术实现步骤摘要】
一种确定出一个图像批次高宽比的方法
[0001]本专利技术属于计算机图像处理领域,尤其涉及一种确定出一个图像批次高宽比的方法
。
技术介绍
[0002]在深度学习时,通常使用加速器
(
加速器由硬件和与之配套的软件构成,例如
GPU
套件或
TPU
套件
)
来加速运算,在处理图像相关的任务时,通常将多个图像数据组成一个批次一次输入到加速器中处理,其效率高于多次执行单个图像数据处理
。
在图像有关的应用场景中,一个批次的数据集可能包含各种不同分辨率和高宽比的图像,也可能包含具有不同尺寸的图像,加速器要求输入批次中的图像具有统一尺寸,因此需要对批次中的图像根据需要进行缩放和
/
或填充到同样大小的尺寸
。
为充分利用算力资源,批次中图像像素所占的比例应该尽量大,填充区域的比例应该最小
。
因此,如何选择合适的缩放后批次分辨率是一个值得研究的问题
。
[0003]当前在深度学习系统中,普遍采样的方法是基线方法,简记为
baseline
,先设置一个最大尺寸
MaxSize,
如令
MaxSize
=
640
像素,对批次内的每个图像,将其宽度和高度中较大的维度缩放到该最大尺寸,缩放维持高宽比不变,则较小的维度必然小于最大尺寸,最后统计所有缩放后图像的最大宽度和高度,作为批次的输入维度
。
[0
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种确定出一个图像批次高宽比的方法,其特征在于:将一个图像批次的分辨率记为
(h
,
w)
,一个图像批次高宽比记为
P
,
P
=
h/w
;获取一个批次内每张图像的分别率,第
i
张图像的分辨率记为
(Hi
,
Wi)
,第
i
张图像的高宽比为
Ri
,
Ri
=
Hi/Wi
;根据如下公式一确定出
p
值,公式一:
2.
根据权利要求1所述的确定出一个图像批次高宽比的方法,其特征在于:上述公式一的求解方法,包括以下步骤,
a、
对将一个图像批次中的所有图像的
Ri
值从小到大极性排序,得到数列
R1≤R1...≤R
N
,可知
R1≤p≤R
N
;
b、
将一个批次内的所有图像缩放后的平均图像占比记为
y(p)
,设最优
技术研发人员:田泽康,邓卉,危明,
申请(专利权)人:易视腾科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。