一种确定出一个图像批次高宽比的方法技术

技术编号:39574574 阅读:7 留言:0更新日期:2023-12-03 19:26
本发明专利技术公开了一种确定出一个图像批次高宽比的方法,将一个图像批次的分辨率记为

【技术实现步骤摘要】
一种确定出一个图像批次高宽比的方法


[0001]本专利技术属于计算机图像处理领域,尤其涉及一种确定出一个图像批次高宽比的方法


技术介绍

[0002]在深度学习时,通常使用加速器
(
加速器由硬件和与之配套的软件构成,例如
GPU
套件或
TPU
套件
)
来加速运算,在处理图像相关的任务时,通常将多个图像数据组成一个批次一次输入到加速器中处理,其效率高于多次执行单个图像数据处理

在图像有关的应用场景中,一个批次的数据集可能包含各种不同分辨率和高宽比的图像,也可能包含具有不同尺寸的图像,加速器要求输入批次中的图像具有统一尺寸,因此需要对批次中的图像根据需要进行缩放和
/
或填充到同样大小的尺寸

为充分利用算力资源,批次中图像像素所占的比例应该尽量大,填充区域的比例应该最小

因此,如何选择合适的缩放后批次分辨率是一个值得研究的问题

[0003]当前在深度学习系统中,普遍采样的方法是基线方法,简记为
baseline
,先设置一个最大尺寸
MaxSize,
如令
MaxSize

640
像素,对批次内的每个图像,将其宽度和高度中较大的维度缩放到该最大尺寸,缩放维持高宽比不变,则较小的维度必然小于最大尺寸,最后统计所有缩放后图像的最大宽度和高度,作为批次的输入维度

[0004]为了提高处理数据的效率,缩放后的图像尽量“紧实”,即图像内容的平均占比尽量高,填充部分的占比尽量小,这就需要确定出一个图像批次尽可能好的高宽比

现有显然基线方法并不符合上述原则,举例来说,若一个批次中大部分图像都是高度大于宽度,仅有一幅图像宽度大于高度,则最终高宽比就为1:1,造成大部分图像需要较多的填充,浪费的算力资源较多

[0005]综上,现有的一个图像批次高宽比计算的方法存在会浪费算力资源较多的缺陷


技术实现思路

[0006]本专利技术的目的在于,提供一种确定出一个图像批次高宽比的方法

本专利技术具有可以减少算力资源浪费的优点

[0007]本专利技术的技术方案:一种确定出一个图像批次高宽比的方法,将一个图像批次的分辨率记为
(h

w)
,一个图像批次高宽比记为
P

P

h/w

[0008]获取一个批次内每张图像的分别率,第
i
张图像的分辨率记为
(Hi

Wi)
,第
i
张图像的高宽比为
Ri

Ri

Hi/Wi

[0009]根据如下公式确定出
p
值:
[0010][0011]前述的确定出一个图像批次高宽比的方法中,上述公式一的求解方法,包括以下步骤,
[0012]a、
对将一个图像批次中的所有图像的
Ri
值从小到大极性排序,得到数列
R1≤R1...≤R
N
,可知
R1≤p≤R
N

[0013]b、
将一个批次内的所有图像缩放后的平均图像占比记为
y(p)
,设最优
p
值位于
R
k

R
k+1
之间,即
R
k
≤p≤R
k+1
,此时有公式二,
[0014][0015]c、
对公式二进行一阶求导,得公式三,
[0016][0017]d、
二阶求导,得公式四,
[0018][0019]e、
二阶导数恒为正,说明在区间
(R
k

R
k+1
)
内具有最小值,最大值的候选为端点处,即
p

R
k

p

R
k+1
,也就是说要找到最优
p
值,只需要计算
p∈{R1,R2,..,R
N
}
当中的最大
y(p)
值,其对应的
p
值即为最优解,得公式五,
[0020][0021]f、
根据公式五和公式二可以得公式一:
[0022][0023]与现有技术相比,本专利技术给出了得到最佳
p
值,即最佳高宽比的计算公式,按照公式得到的
p
值下,批次中图像像素所占的比例实现了最大化,相应的填充区域的比例实现了最小化,避免了算力资源的浪费

因此,本专利技术具有可以减少算力资源浪费的优点

附图说明
[0024]图1是实施例1中
y(p)
函数的多峰示意图

[0025]图2是实施例1中
y(p)
函数的单峰示意图

[0026]图3是实验与对比2中按照现有方法确定
p
值后对各个图像缩放填充的示意图

[0027]图4是实验与对比2中按照本专利技术确定
p
值后对各个图像缩放填充的示意图

具体实施方式
[0028]下面结合附图和实施例对本专利技术作进一步的说明,但并不作为对本专利技术限制的依


[0029]实施例
1(
最佳实施例
)。
分析:设一个批次中包含
N
个图像
{I1,I2.....I
N
}
,各个图像的高度和宽度分别为
{(H1,
W1)

(H2,W2),...,(H
N
,W
N
)}。
要求得到最佳的批次分辨率
(h

w)
,使缩放后图像内容占总面积的平均比值
(
简称为平均利用率
)
最高,即可最大化的减少算力资源的浪费

[0030]令批次的高宽比为
P

P

h/w
;令第
i
个图像的高宽比为
R
i

R
i

H
i
/W
i

对第
i
个图像而言,缩放比例
S
i

min(h/H
i

w/W
i...

【技术保护点】

【技术特征摘要】
1.
一种确定出一个图像批次高宽比的方法,其特征在于:将一个图像批次的分辨率记为
(h

w)
,一个图像批次高宽比记为
P

P

h/w
;获取一个批次内每张图像的分别率,第
i
张图像的分辨率记为
(Hi

Wi)
,第
i
张图像的高宽比为
Ri

Ri

Hi/Wi
;根据如下公式一确定出
p
值,公式一:
2.
根据权利要求1所述的确定出一个图像批次高宽比的方法,其特征在于:上述公式一的求解方法,包括以下步骤,
a、
对将一个图像批次中的所有图像的
Ri
值从小到大极性排序,得到数列
R1≤R1...≤R
N
,可知
R1≤p≤R
N

b、
将一个批次内的所有图像缩放后的平均图像占比记为
y(p)
,设最优

【专利技术属性】
技术研发人员:田泽康邓卉危明
申请(专利权)人:易视腾科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1