【技术实现步骤摘要】
一种面向文本定位的单内核HOG高效异构加速方法
[0001]本专利技术涉及场景字符识别领域,具体涉及一种面向文本定位的单内核HOG高效异构加速方法。
技术介绍
[0002]随着智能手持设备的广泛普及与人工智能高速发展,图像和视频成为主要的媒体信息传递方式。媒体信息中包含了大量的自然场景,其中的文字信息具有重要的应用价值。从自然场景中精确且快速的提取出文字信息有着重要的意义,在这其中,文本定位技术成为一大重点。
[0003]由于文本定位面临着高复杂度的实现算法和持续增长的数据等问题,文本定位算法的实时性受到了挑战。HOG(Histogram of Oriented Gradient,方向梯度直方图)算法是文本定位计算中最常用的算法。现有的多内核HOG加速方案是在设备端通过多个内核进行全局同步,实现HOG特征的像素梯度计算、cell梯度统计和block归一化。但是会产生高代价的循环运算,带来的全局同步和全局内存的访存开销也很大。在异构系统的实现中,多内核加速方案会带来较严重的能耗问题。
技术实现思路
[0 ...
【技术保护点】
【技术特征摘要】
1.一种面向文本定位的单内核HOG高效异构加速方法,其特征在于,包括以下步骤:S1、获取灰度图像的像素,并为每个像素分配一个工作项;其中Cx
×
Cy个大小统一的连通像素区域组成一个cell单元;S2、在各个工作项中,利用差分模板及其转置对每个像素周围的像素进行行卷积与列卷积;S3、对卷积后的像素进行幅度和相位计算;S4、利用得到的幅度和相位,通过双线性插值算法计算得到像素的离散梯度方向,并保存在硬件的局部内存中,释放为像素分配的工作项;S5、为每个cell单元分配一个工作项,并进行硬件的全局索引;S6、创建用于统计像素离散梯度方向的统计变量,将每个像素所处的离散梯度方向直接并行加到统计变量中,并用一组变量对应计算一个cell单元中每行像素的离散梯度方向的投票结果,完成每行像素的统计,得到每个cell单元中不同离散梯度方向的个数;S7、进行硬件的局部内存同步,基于投票结果,利用每个工作项统计cell中一行的像素,并进行并行规约得到所有cell单元的梯度统计,将梯度统计的离散梯度结果保存在硬件的局部内存中,释放为cell单元分配的工作项;S8、利用一个工作项计算一个cell单元梯度统计后的离散梯度的归一化,将每个cell单元归一化后的结果求和,得到与每个cell单元对应的和值,将属于同一个block中的每个cell单元对应的和值缓存至硬件的局部内存中,并进行硬件的局部同步,得到每个block的局部方向梯度;其中...
【专利技术属性】
技术研发人员:阎波,张国宁,孙王超,陈俊希,覃昊洁,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。