一种基于SGDMA的图像分割处理装置制造方法及图纸

技术编号:7551628 阅读:225 留言:0更新日期:2012-07-13 23:59
本发明专利技术公开一种基于SGDMA的图像分割处理装置,包括DMA控制器、连接至DMA控制器的外存储器、通过总线连接至DMA控制器的显存/内存、连接至显存/内存的GPU;此外,还包括图像分割控制器,该图像分割控制器接于DMA控制器和外存储器之间,用于预先将外部存储器中的整幅图像数据分割成块,之后由DMA控制器传输到显存/内存,再由GPU进行后续处理。本发明专利技术在DMA传输前即对图像数据进行分割,由此仅向每个GPU传输特定数据,可提高总线及外部存储器带宽利用率。

【技术实现步骤摘要】

本专利技术涉及数字图像处理技木,尤其涉及一种基于SGDMA的图像分割处理装置, 其特別适用于大型数字拼接显示墙领域。
技术介绍
DMA (Direct Memory Access,直接内存存取)是高速数据传输的ー种理想方式, DMA方式将数据在内存与I/O设备之间直接传输,其数据操作由DMA控制器完成而不需更 CPU的參与,因而大大地提高了 CPU的利用率。DMA有两种实现方式一种是块传输式DMA (block DMA)方式;另ー种是 SGDMA (Scatter Gather DMA,分散聚合式DMA)方式,可以将非连续存储的数据搬移到连续地址空间,反之也行。DMA传输数据的过程中通常要求源物理地址和目标物理地址是连续的,但在某些应用中会出现源物理地址和目标物理地址不连续的情况,则DMA传输要分成多次完成。针对这类应用,SGDMA方式通过ー个DMA链表描述物理不连续的存储器。DMA控制器传输完一块物理连续的数据后,根据DMA链表传输下ー块物理连续的数据,最后发起一次中断。目前,DMA已得到广泛应用。比如,在图像处理领域,现有的图像处理过程大致如下采集图像数据,用 DMA 方式通过 PCIE (Peripheral Component Interconnection Express,外设组件互连标准扩展)总线将采集到的图像数据传送到显存或者内存,然后利用GPU (Graphic Processing Unit,图形处理器)或者CPU对图像数据进行处理。对于大型数字拼接显示墙领域来说,则需要多个GPU同时处理ー副完整的图像, 每个GPU只需要处理其中的ー小块数据。因此,图像分割技术在这种情况下显得尤为重要, 简述如下。请參见图1,是现有图像分割处理装置的示意图。该图像分割处理装置包括数据采集器101,用于将采集视频解码芯片100解码后的图像数据,并将采集的图像数据存储到外部存储器104中;DMA控制器102,用于将存储在外部存储器104中的图像数据传输到显存/内存105中;CPU 107,可以将DMA链表(具体结构形式请參见图2、存储到外部存储器 104或显存/内存105中;GPU 108,用做图像处理,其中包含图像分割器106,用于实现对图像的分割。如图1所示,由于有多个单元会对外部存储器104进行读写操作,因此,为了避免产生冲突,可以通过仲载器103来控制这些不同单元对外部存储器104的操作。具体而言, 在数据采集器101和DMA控制器102对外部存储器104进行读写操作吋,由仲裁器103用于分配读写操作的控制权。例如,若数据采集器101向外部存储器104发起读写请求,而DMA 控制器102未发起读写请求,此时仲裁器103将外部存储器104的读写控制权分配给数据采集器101 ;若数据采集器101和DMA控制器102同时发起读写请求,此时仲裁器103可以优先将读写控制器权分配给DMA控制器102。需要说明的是,上述图像分割处理装置中的DMA控制器102、数据采集器101、仲裁器103都可以由FPGA(Field Programmable Gate Array,现场可编程门陈列)来实现。如图2所示,上述DMA链表可以由CPU 107根据需要传输的数据的外部存储地址、 数据大小、以及显存或内存的地址等信息而预先生成。如图2所示,该DMA链表可以是单向结构或环形结构,其中包括数据源地址和数据目的地址。还可进一步包括控制字和下一节点指针等信息,其中控制字中包含数据位宽、数据块大小、当前块传输结束是否引发中断等控制信息。DMA块传输可看作是只含有一个节点,且下一节点指针总是指向当前节点的散列传输。由前文可知,现有技术在分割处理一副完整图像时,是其将一副图像数据完整地同时传送到每个GPU 108,然后由GPU 108完成图像的分割功能。这种图像分割方式的缺点是(1)该分割方法将一副图像数据完整地传送到每个GPU,而实际上每一 GPU需要的只是其中的一部分数据,这导致数据在传输过程中需要占用总线的带宽,因此,这种方法导致总线上带宽的利用率较低;(2)图像数据是从外部存储器取出来的,过多的无效数据也会降低外部存储器的带宽利用率;(3)由GPU实现图像分割功能,增加了 GPU编程的复杂度。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于SGDMA的图像分割处理装置,可以提高带宽利用率。为解决以上技术问题,本专利技术的技术方案是,一种基于SGDMA的图像分割处理装置,包括DMA控制器、连接至DMA控制器的外存储器、通过总线连接至DMA控制器的显存/ 内存、连接至显存/内存的GPU,包括图像分割控制器,该图像分割控制器接于DMA控制器和外存储器之间,用于预先将外部存储器中的整幅图像数据分割成块,之后由DMA控制器传输到显存/内存,再由GPU进行后续处理。较优地,包括数据采集器,用于采集整幅图像数据,并存储到外部存储器中。较优地,包括视频解码芯片,该视频解码芯片与数据采集器连接,用于对获取的视频信号进行解码,向数据采集器输出整幅图像数据。较优地,包括仲裁器,该仲裁器接于数据采集器和图像分割控制器之间,用于分配数据采集器和DMA控制器对外部存储器的读写操作控制权,在DMA控制器取得对外部存储器的读写操作控制权时,启动图像分割控制器分割外部存储器中的整幅图像数据。较优地,DMA控制器、图像分割控制器、数据采集器及仲裁器集成于FPGA中。较优地,外存储器或显存/内存中存储整幅图像的DMA链表,其中每个DMA链表节点中包括数据源地址和目的地址,以便图像分割控制器将数据源地址的图像数据分割成块,由DMA控制器传输到显存/内存后,再由目的地址对应的GPU进行后续处理。较优地,包括通过总线连接至DMA控制器的CPU,用于根据需要传输数据的外部存储地址、数据大小以及显存或内存的地址信息,预先生成并存储该DMA链表。较优地,DMA链表为单向结构或环形结构。较优地,每个DMA链表节点中包括控制字和下一节点指针,其中控制字中包含数据位宽、数据块大小、当前块传输结束是否引发中断的控制信息。较优地,每个DMA链表节点中,下一节点指针总是指向当前节点。与现有技术相比,本专利技术在DMA传输前即对图像数据进行分割,可以取得包括但不仅限于以下有益效果(1)提高总线带宽的利用效率。在DMA传输前即对图像数据进行分割,仅向每个 GPU传输特定数据,而不是向每个GPU传输完整的图像数据,因此可减少传输数据量,使得总线带宽利用率提高;(2)提高外部存储器的带宽利用率。DMA传输前即对图像数据进行分割,数据针对性強,从外存储器读取的无效数据減少,这无疑会提高外部存储器的带宽利用率。附图说明图1是现有图像分割处理装置的示意图;图2是现有图像分割处理方法中DMA链表的数据结构图;图3是本专利技术基于SGDMA的图像分割处理装置的示意图。具体实施例方式本专利技术的核心思想是,设置图像分割控制器,在DMA传输前即对图像数据进行分割,实现仅向GPU传输对应区域的部分图像数据,因而可提高总线带宽的利用效率和外部存储器的带宽利用效率。为了使本领域的技术人员更好地理解本专利技术的技术方案,下面结合附图和具体实施例对本专利技术作进ー步的详细说明。參见图3,表示本专利技术基于SGDMA的图像分割处本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:兰进城景博曹捷林文富
申请(专利权)人:广东威创视讯科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术