【技术实现步骤摘要】
图像处理方法及装置、设备和介质
[0001]本公开涉及计算机
,尤其涉及芯片技术
、
人工智能技术和图像处理
,具体涉及一种图像处理方法
、
装置
、
电子设备
、
计算机可读存储介质和计算机程序产品
。
技术介绍
[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为
(
如学习
、
推理
、
思考
、
规划等
)
的学科,既有硬件层面的技术也有软件层面的技术
。
人工智能硬件技术一般包括如传感器
、
专用人工智能芯片
、
云计算
、
分布式存储
、
大数据处理等技术;人工智能软件技术主要包括计算机视觉技术
、
语音识别技术
、
自然语言处理技术以及机器学习
/
深度学习
、
大数据处理技术
、
知识图谱技术等几大方向
。
[0003]随着人工智能技术的发展,越来越多的应用基于人工智能技术取得了远超过传统算法的效果
。
深度学习是数据密集型算法和计算密集型算法,为了提高基于人工智能技术进行图像处理的效率,需要合理充分地利用图像处理装置的硬件资源,减少冗余开销
。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法
...
【技术保护点】
【技术特征摘要】
1.
一种图像处理方法,包括:获取与输入图像对应的特征图,所述特征图包括多个通道;将所述多个通道划分为多个通道组,所述多个通道组中的每个通道组包括至少一个通道;获取与所述多个通道组分别对应的多个卷积核;将所述多个卷积核划分为多个卷积核组,所述多个卷积核组中的每个卷积核组包括多个卷积核;针对所述多个卷积核组中的每个卷积核组,获取多个目标通道组,所述多个目标通道组与该卷积核组包括的多个卷积核分别对应;确定该卷积核组的组通道数,所述组通道数指示所述多个目标通道组的通道数之和;针对该卷积核组中的每个卷积核,确定相应的转换卷积核,所述转换卷积核的通道数等于所述组通道数;以及基于多个转换卷积核,并行地执行针对所述多个目标通道组的卷积计算
。2.
如权利要求1所述的方法,其中,所述多个目标通道组是利用数据搬运单元获取的,所述将所述多个卷积核划分为多个卷积核组包括:确定所述数据搬运单元的最大搬运数据量;确定所述多个通道组中的每个通道组的通道数据量;以及基于所述最大搬运数据量的所述每个通道组的通道数据量,将所述多个卷积核划分为多个卷积核组,以使得每个卷积核组相应的多个目标通道组的通道数据量之和与所述最大搬运数据量的差值最小
。3.
如权利要求1或2所述的方法,还包括:将所述多个卷积核组划分为多个集合,所述多个集合中的每个集合包括多个卷积核组,其中,所述基于多个转换卷积核,并行地执行针对所述多个目标通道组的卷积计算包括:针对所述多个集合中的每个集合,基于该集合中的每个卷积核组相应的多个转换卷积核,并行地执行针对该集合中的每个卷积核组相应的多个目标通道组的卷积计算
。4.
如权利要求3所述的方法,其中,所述卷积计算是利用卷积计算单元获取的,所述将所述多个卷积核组划分为多个集合包括:确定所述卷积计算单元能够并行计算的卷积核数量的最大值
Max
;利用搜索算法遍历
[1
,
Max]
区间,以从
[1
,
Max]
区间中确定每个集合所包括的卷积核数量的目标值,其中,当每个集合所包括的卷积核数量为所述目标值时,针对所述输入图像的图像处理的计算量最小;以及基于所述目标值,将所述多个卷积核组划分为多个集合
。5.
如权利要求1‑4中任一项所述的方法,其中,所述针对该卷积核组中的每个卷积核,确定相应的转换卷积核包括:基于该卷积核的通道数和所述组通道数,确定至少一个填充通道,其中,所述填充通道中的每个填充元素为零;以及
拼接该卷积核和所述至少一个填充通道,以得到所述转换卷积核
。6.
一种图像处理装置,包括:第一获取单元,被配置为获取与输入图像对应的特征图,所述特征图包括多个通道;第一分组单元,被配置为将所述多个通道划分为多个通道组,所述多个通道组中的每个通道组包括至少一个通道;第二获取单元,被配置为获取与所述多个通道组分别对应的多个卷积核;第二分组单元,被配置为将所述多个卷积核划分为多个卷积核组,所述多个卷积核组中的每个卷积核组包括多个卷积核;第三获取单元,被配置为针对所述多个卷积核组中的每个卷积核组,获取多个目标通...
【专利技术属性】
技术研发人员:谢夏婷,施佳鑫,李浩洋,
申请(专利权)人:昆仑芯北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。