在多核心图像处理器上配置应用软件制造技术

技术编号:22007117 阅读:32 留言:0更新日期:2019-08-31 07:26
描述了一种方法。该方法包括计算针对将在图像处理器上执行的、具有多个内核的程序的内核到内核连接的数据传输量度。所述图像处理器包括多个处理核心和连接所述多个处理核心的网络。所述内核到内核连接中的每一个包括要在所述处理核心中的一个处理核心上执行的生产内核以及要在所述处理核心中的另一个处理核心上执行的消费内核。所述消费内核用于对由所述生产内核生成的数据进行操作。所述方法还包括基于所计算的数据传输量度来将多个内核中的内核指派给所述处理核心中的相应处理核心。

Configuration of application software on multi-core image processor

【技术实现步骤摘要】
【国外来华专利技术】在多核心图像处理器上配置应用软件
本专利技术的领域总体上涉及计算科学,更具体地涉及在多核心图像处理器上配置应用软件。
技术介绍
图像处理通常涉及处理组织成阵列的像素值。这里,以空间方式组织的二维阵列捕获图像的二维性质(附加维度可以包括时间(例如,二维图像的序列)和数据类型(例如,颜色))。在通常情况下,阵列排列的像素值是由相机提供,该相机生成了静止图像或帧的序列的相机以捕获运动的图像。传统的图像处理器通常落在两个极端的任一侧上。第一个极端执行处理任务,作为在通用处理器或类通用处理器(例如,具有向量指令增强的通用处理器)上执行的软件程序。虽然第一个极端通常提供了高度多功能的应用软件开发平台,但是它使用了更细粒度的数据结构结合相关联的开销(例如,指令获取和解码、处置片上和片外数据、前瞻性执行)最终导致在执行程序代码期间,每数据部件消耗的能量更大。第二个相反的极端将固定功能硬连线电路应用于更大的数据部件。使用直接应用于定制设计电路的较大(与更细粒度相对)数据部件大大降低了每数据部件的功耗。然而,使用定制设计的固定功能电路通常导致了处理器能够执行的有限任务集合。因此,第二个极端中缺乏(与第一本文档来自技高网...

【技术保护点】
1.一种方法,包括:针对将在图像处理器上执行的、包括多个内核的程序的内核到内核连接来计算数据传输量度,所述图像处理器包括多个处理核心和连接所述多个处理核心的网络,所述内核到内核连接中的每一个包括要在所述处理核心中的一个处理核心上执行的生产内核以及要在所述处理核心中的另一个处理核心上执行的消费内核,所述消费内核用于在由所述生产内核生成的数据上进行操作;以及,基于所计算的数据传输量度,将所述多个内核中的内核指派给所述处理核心中的相应处理核心。

【技术特征摘要】
【国外来华专利技术】2017.05.12 US 15/594,5291.一种方法,包括:针对将在图像处理器上执行的、包括多个内核的程序的内核到内核连接来计算数据传输量度,所述图像处理器包括多个处理核心和连接所述多个处理核心的网络,所述内核到内核连接中的每一个包括要在所述处理核心中的一个处理核心上执行的生产内核以及要在所述处理核心中的另一个处理核心上执行的消费内核,所述消费内核用于在由所述生产内核生成的数据上进行操作;以及,基于所计算的数据传输量度,将所述多个内核中的内核指派给所述处理核心中的相应处理核心。2.如权利要求1所述的方法,其中,所述图像处理器进一步包括多个缓冲器部件,所述缓冲器部件用于存储和转发所述内核到内核连接的数据。3.如权利要求2所述的方法,其中,所述缓冲器部件进一步包括线缓冲器部件,所述线缓冲器部件用于存储和转发内核到内核连接的图像的线组。4.如任一前述权利要求所述的方法,其中,计算所述数据传输量度进一步包括:基于在所述网络内在生产内核与消费内核之间的节点跳的数目来向所述内核到内核连接指派权重。5.如任一前述权利要求所述的方法,其中,计算所述数据传输量度进一步包括:基于通过所述网络在生产内核与消费内核之间传输的图像的大小来向所述内核到内核连接指派权重。6.如任一前述权利要求中所述的方法,其中,将内核指派给所述处理核心中的相应处理核心进一步包括:计算所述程序的不同配置的权重,所述程序的每个配置包括对所述处理核心的内核指派的不同集合,其中,特定配置的权重的计算是基于针对所述特定配置的特定内核到内核连接所计算的所述数据传输量度的子集;以及,选择具有最佳权重的所述配置中的一个配置。7.一种包含程序代码的非暂时性机器可读存储介质,所述程序代码在由计算系统处理时致使所述计算系统执行方法,所述方法包括:针对将在图像处理器上执行的、包括多个内核的程序的内核到内核连接来计算数据传输量度,所述图像处理器包括多个处理核心和连接所述多个处理核心的网络,所述内核到内核连接中的每一个包括将在所述处理核心中的一个处理核心上执行的生产内核以及将在所述处理核心中的另一个处理核心上执行的消费内核,所述消费内核用于对由所述生产内核生成的数据进行操作;以及,基于所计算的数据传输量度,将所述多个内核中的内核指派给所述处理核心中的相应处理核心。8.如权利要求7所述的非暂时性机器可读存储介质,其中,所述图像处理器包括多个缓冲器部件,所述缓冲器部件用于存储和转发所述内核到内核连接的数据。9.如权利要求8所述的非暂时性机器可读存储介质,其中,所述缓冲器部件进一步包括线缓冲器部件,所述线缓冲器部件用于存储和转发内核到内核连接的图像的线组。10.如权利要求7至9中的任一项所述的非暂时性机器可读存储介质,其中,计算所述数据传输量度进一步包括:基于在所述网络内在生产内核与消费内核之间的节点跳的数目来向所述内核到内核连...

【专利技术属性】
技术研发人员:朴贤哲阿尔伯特·迈克斯纳
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1