一种面向文本定位的单内核HOG高效异构加速方法技术

技术编号:33131140 阅读:63 留言:0更新日期:2022-04-17 00:48
本发明专利技术公开了一种面向文本定位的单内核HOG高效异构加速方法,其包括为每个像素分配一个工作项,并对每个像素周围的像素进行卷积,对卷积后的像素进行幅度和相位计算,通过双线性插值算法计算得到像素的离散梯度方向,并保存在硬件的局部内存中,释放为像素分配的工作项;为每个cell单元分配一个工作项,并进行硬件的全局索引;计算离散梯度方向的投票结果,完成每行像素的统计;对统计的像素进行归一化以及求和,组合成一个HOG特征向量,得到图像的特征向量;在异构平台对该方法加以实现,完成异构加速。本发明专利技术满足了文本定位实时性以及低能耗的需求,能够进一步提高场景字符识别技术的可靠性。技术的可靠性。技术的可靠性。

【技术实现步骤摘要】
一种面向文本定位的单内核HOG高效异构加速方法


[0001]本专利技术涉及场景字符识别领域,具体涉及一种面向文本定位的单内核HOG高效异构加速方法。

技术介绍

[0002]随着智能手持设备的广泛普及与人工智能高速发展,图像和视频成为主要的媒体信息传递方式。媒体信息中包含了大量的自然场景,其中的文字信息具有重要的应用价值。从自然场景中精确且快速的提取出文字信息有着重要的意义,在这其中,文本定位技术成为一大重点。
[0003]由于文本定位面临着高复杂度的实现算法和持续增长的数据等问题,文本定位算法的实时性受到了挑战。HOG(Histogram of Oriented Gradient,方向梯度直方图)算法是文本定位计算中最常用的算法。现有的多内核HOG加速方案是在设备端通过多个内核进行全局同步,实现HOG特征的像素梯度计算、cell梯度统计和block归一化。但是会产生高代价的循环运算,带来的全局同步和全局内存的访存开销也很大。在异构系统的实现中,多内核加速方案会带来较严重的能耗问题。

技术实现思路

[0004]针对现有技术本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向文本定位的单内核HOG高效异构加速方法,其特征在于,包括以下步骤:S1、获取灰度图像的像素,并为每个像素分配一个工作项;其中Cx
×
Cy个大小统一的连通像素区域组成一个cell单元;S2、在各个工作项中,利用差分模板及其转置对每个像素周围的像素进行行卷积与列卷积;S3、对卷积后的像素进行幅度和相位计算;S4、利用得到的幅度和相位,通过双线性插值算法计算得到像素的离散梯度方向,并保存在硬件的局部内存中,释放为像素分配的工作项;S5、为每个cell单元分配一个工作项,并进行硬件的全局索引;S6、创建用于统计像素离散梯度方向的统计变量,将每个像素所处的离散梯度方向直接并行加到统计变量中,并用一组变量对应计算一个cell单元中每行像素的离散梯度方向的投票结果,完成每行像素的统计,得到每个cell单元中不同离散梯度方向的个数;S7、进行硬件的局部内存同步,基于投票结果,利用每个工作项统计cell中一行的像素,并进行并行规约得到所有cell单元的梯度统计,将梯度统计的离散梯度结果保存在硬件的局部内存中,释放为cell单元分配的工作项;S8、利用一个工作项计算一个cell单元梯度统计后的离散梯度的归一化,将每个cell单元归一化后的结果求和,得到与每个cell单元对应的和值,将属于同一个block中的每个cell单元对应的和值缓存至硬件的局部内存中,并进行硬件的局部同步,得到每个block的局部方向梯度;其中...

【专利技术属性】
技术研发人员:阎波张国宁孙王超陈俊希覃昊洁
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1