一种降低纹理单元访问量的方法、装置及计算机存储介质制造方法及图纸

技术编号:22077860 阅读:23 留言:0更新日期:2019-09-12 14:53
本发明专利技术实施例公开了一种降低纹理单元访问量的方法、装置及计算机存储介质;该装置在GPU中与纹理单元对应设置,该装置包括:仲裁模块、请求缓存以及数据缓存。本发明专利技术实施例根据纹理坐标相同与否从所有纹理数据采样请求中确定第一纹理数据采样请求,并通过纹理单元针对该第一纹理数据采样请求进行响应,所得到的纹理数据同样能够作为与第一纹理数据采样请求所对应的第二纹理数据采样请求的响应。通过上述技术方案,避免出现纹理单元处理内容的冗余,降低纹理单元的处理功耗以及针对相同纹理坐标的纹理数据采样请求的响应时间。

A Method, Device and Computer Storage Medium for Reducing Texture Unit Access

【技术实现步骤摘要】
一种降低纹理单元访问量的方法、装置及计算机存储介质
本专利技术实施例涉及计算机图形
,尤其涉及一种降低纹理单元访问量的方法、装置及计算机存储介质。
技术介绍
图形处理器(GPU,GraphicsProcessingUnit)产生用于显示的视觉内容,例如,用于图形用户接口和视频游戏的内容。GPU可将二维或三维(3D)对象转换成可显示的二维(2D)像素表示。将关于3D对象的信息转换为可显示的位图被称为像素渲染,且要求相当大的存储器和处理电力。在一些示例中,GPU可以包括一或多个纹理单元(TexUnit,TextureUnit)以及一或多个着色器处理器;具体来说,着色器处理器通常采用单指令多线程处理器(SP,Single-InstructionMultiple-Thread),在基于图块渲染的GPU中,多个SP并行渲染各个图块内的场景。纹理单元可以用于进行纹理数据的寻址和滤波处理。着色器处理器可以接收来自纹理单元的滤波后的纹理并且实施图形渲染管线的着色器级以执行像素渲染。在常规的纹理单元访问方案中,当多个SP对同一纹理单元进行访问的情况下,即使多个SP访问相同的纹理坐标,纹理仍旧会对每个SP的纹理数据采样请求进行处理,从而造成了纹理单元处理内容的冗余,增加了纹理单元的处理功耗,延长了针对相同纹理坐标的纹理数据采样请求的响应时间。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种降低纹理单元访问量的方法、装置及计算机存储介质;避免产生纹理单元处理内容的冗余,降低纹理单元的处理功耗以及针对相同纹理坐标的纹理数据采样请求的响应时间。本专利技术实施例的技术方案是这样实现的:第一方面,本专利技术实施例提供了一种降低纹理单元访问量的装置,所述装置在GPU中与纹理单元对应设置,所述装置包括:仲裁模块、请求缓存以及数据缓存;其中,所述仲裁模块,经配置为:在当前节拍内,接收由多个SP向纹理单元发送的纹理数据采样请求;其中,所述纹理数据采样请求包括SP标识以及纹理坐标;将所述当前节拍内所接收到的所有纹理数据采样请求根据所述纹理坐标的相同与否划分为第一纹理数据采样请求和第二纹理数据采样请求;并将所述第一纹理数据采样请求传输至所述请求缓存32;其中,每个第一纹理数据采样请求均对应0个或至少一个第二纹理数据采样请求,且每个第二纹理数据采样请求均存在一个第一纹理数据采样请求与之对应;所述请求缓存,经配置为:向所述纹理单元发送所述第一纹理数据采样请求,以使得所述纹理单元生成与所述第一纹理数据采样请求对应的纹理数据;所述数据缓存,经配置为:接收所述纹理单元所生成的与所述第一纹理数据采样请求对应的纹理数据,并将与所述第一纹理数据采样请求对应的纹理数据反馈至所述仲裁模块;所述仲裁模块,还经配置为:将所述纹理数据按照纹理坐标返回至第一纹理数据采样请求以及第二纹理数据采样请求对应的SP标识所指示的SP。第二方面,本专利技术实施例提供了一种降低纹理单元访问量的方法,所述方法应用于第一方面所述的降低纹理单元访问量的装置,所述方法包括:在当前节拍内,仲裁模块接收由多个SP向纹理单元发送的纹理数据采样请求;其中,所述纹理数据采样请求包括SP标识以及纹理坐标;仲裁模块将所述当前节拍内所接收到的所有纹理数据采样请求根据所述纹理坐标的相同与否划分为第一纹理数据采样请求和第二纹理数据采样请求;并将所述第一纹理数据采样请求传输至所述请求缓存;其中,每个第一纹理数据采样请求均对应0个或至少一个第二纹理数据采样请求,且每个第二纹理数据采样请求均存在一个第一纹理数据采样请求与之对应;请求缓存向纹理单元发送所述第一纹理数据采样请求,以使得所述纹理单元生成与所述第一纹理数据采样请求对应的纹理数据;数据缓存接收所述纹理单元所生成的与所述第一纹理数据采样请求对应的纹理数据,并将与所述第一纹理数据采样请求对应的纹理数据反馈至所述仲裁模块;仲裁模块将所述纹理数据按照纹理坐标返回至第一纹理数据采样请求以及第二纹理数据采样请求对应的SP标识所指示的SP。第三方面,本专利技术实施例提供了一种计算机存储介质,所述计算机存储介质存储有降低纹理单元访问量的程序,所述降低纹理单元访问量的程序被至少一个处理器执行时实现第二方面所述的降低纹理单元访问量的方法的步骤。本专利技术实施例提供了一种降低纹理单元访问量的方法、装置及计算机存储介质;关于同一拍内针对纹理单元的纹理数据采样请求,如果纹理坐标相同,那么说明在同一拍内,不同的SP有着相同的访问需求。基于此,根据纹理坐标相同与否从所有纹理数据采样请求中确定第一纹理数据采样请求,并通过纹理单元针对该第一纹理数据采样请求进行响应,所得到的纹理数据同样能够作为与第一纹理数据采样请求所对应的第二纹理数据采样请求的响应。通过上述技术方案,避免出现纹理单元处理内容的冗余,降低纹理单元的处理功耗以及针对相同纹理坐标的纹理数据采样请求的响应时间。附图说明图1为本专利技术实施例提供的一种纹理单元内部处理流水线示意图;图2A为常规方案中纹理单元的处理流程示意图;图2B为本专利技术实施例提供的一种重复贴图的图像示意图;图3为本专利技术实施例提供的一种降低纹理单元访问量的装置组成示意图;图4为本专利技术实施例提供的一种示例性的架构示意图;图5为本专利技术实施例提供的一种仲裁模块进行比较的处理流程示意图;图6为本专利技术实施例提供的一种请求缓存的缓存行组成示意图;图7为本专利技术实施例提供的一种数据缓存的缓存行组成示意图;图8为本专利技术实施例提供的一种请求缓存进行比较的处理流程示意图;图9为本专利技术实施例提供的一种请求缓存进行缓存替换的示意图;图10为本专利技术实施例提供的一种降低纹理单元访问量的方法流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。当前,在常规方案中,纹理单元自身的内部处理流水线如图1所示,接收SP(SIMTProcessor)向纹理单元发送纹理数据采样请求,本专利技术实施例中以纹理数据采样请求为例,纹理单元根据纹理数据采样请求中所携带的纹理像素坐标通过地址计算模块(Address_cal)计算出纹理数据在纹理数据缓存(Tex_cache)中的地址,最后根据纹理采样方式通过纹理滤波器(Tex_filter)对该地址中的纹理数据进行过滤处理,从而获得滤波后的纹理数据。在一些示例中,纹理单元可以是硬件单元的专用集合,其专用于在纹理数据上操作,例如,专用于对纹理数据进行寻址,以及在纹理数据上执行纹理滤波,或经配置以计算纹理数据的点积及类似者。因此,纹理单元可以包含纹理数据高速缓冲存储器和运算逻辑器件(例如,加法器、乘法器和/或其它数字电路),以用于在纹理数据上执行寻址或运算。当多个SP对同一纹理单元进行访问的情况下,依然以纹理数据采样请求为例。在常规方案中,纹理单元的处理模式示意如图2A所示,纹理单元TexUnit在接收到多个SP,例如SP0至SP7,发送的纹理数据采样请求后,会对每一个纹理数据采样请求均按照图1所示的流水线进行处理。值得注意的是,对于多个SP访问相同纹理坐标的情形,即如图2B所示的示例图像,图像存在多个图块中有相同的椅子、灯台和柱子等纹理图像,在这些图块内会出现相同的纹理坐标。在如此单帧重复贴图基数大的模型场景中,纹理单元会针对相同的纹理坐标本文档来自技高网...

【技术保护点】
1.一种降低纹理单元访问量的装置,其特征在于,所述装置在GPU中与纹理单元对应设置,所述装置包括:仲裁模块、请求缓存以及数据缓存;其中,所述仲裁模块,经配置为:在当前节拍内,接收由多个SP向纹理单元发送的纹理数据采样请求;其中,所述纹理数据采样请求包括SP标识以及纹理坐标;将所述当前节拍内所接收到的所有纹理数据采样请求根据所述纹理坐标的相同与否划分为第一纹理数据采样请求和第二纹理数据采样请求;并将所述第一纹理数据采样请求传输至所述请求缓存32;其中,每个第一纹理数据采样请求均对应0个或至少一个第二纹理数据采样请求,且每个第二纹理数据采样请求均存在一个第一纹理数据采样请求与之对应;所述请求缓存,经配置为:向所述纹理单元发送所述第一纹理数据采样请求,以使得所述纹理单元生成与所述第一纹理数据采样请求对应的纹理数据;所述数据缓存,经配置为:接收所述纹理单元所生成的与所述第一纹理数据采样请求对应的纹理数据,并将与所述第一纹理数据采样请求对应的纹理数据反馈至所述仲裁模块;所述仲裁模块,还经配置为:将所述纹理数据按照纹理坐标返回至第一纹理数据采样请求以及第二纹理数据采样请求对应的SP标识所指示的SP...

【技术特征摘要】
1.一种降低纹理单元访问量的装置,其特征在于,所述装置在GPU中与纹理单元对应设置,所述装置包括:仲裁模块、请求缓存以及数据缓存;其中,所述仲裁模块,经配置为:在当前节拍内,接收由多个SP向纹理单元发送的纹理数据采样请求;其中,所述纹理数据采样请求包括SP标识以及纹理坐标;将所述当前节拍内所接收到的所有纹理数据采样请求根据所述纹理坐标的相同与否划分为第一纹理数据采样请求和第二纹理数据采样请求;并将所述第一纹理数据采样请求传输至所述请求缓存32;其中,每个第一纹理数据采样请求均对应0个或至少一个第二纹理数据采样请求,且每个第二纹理数据采样请求均存在一个第一纹理数据采样请求与之对应;所述请求缓存,经配置为:向所述纹理单元发送所述第一纹理数据采样请求,以使得所述纹理单元生成与所述第一纹理数据采样请求对应的纹理数据;所述数据缓存,经配置为:接收所述纹理单元所生成的与所述第一纹理数据采样请求对应的纹理数据,并将与所述第一纹理数据采样请求对应的纹理数据反馈至所述仲裁模块;所述仲裁模块,还经配置为:将所述纹理数据按照纹理坐标返回至第一纹理数据采样请求以及第二纹理数据采样请求对应的SP标识所指示的SP。2.根据权利要求1所述的装置,其特征在于,所述仲裁3可以包括一队列,所述队列,经配置为:按照SP标识顺序存储当前节拍内所接收到的由多个SP向纹理单元发送的纹理数据采样请求。3.根据权利要求2所述的装置,其特征在于,所述仲裁模块,经配置为:将所述当前节拍内所接收到的所有纹理数据采样请求按照优先级顺序对Queue内存储的纹理数据采样请求进行轮询;针对每个被轮询的纹理数据采样请求,若被轮询的纹理数据采样请求未被划分为第二纹理数据采样请求,则将所述被轮询的纹理数据采样请求划分为第一纹理数据采样请求,并将所述第一纹理数据采样请求中的纹理坐标与Queue内存储的纹理数据采样请求中的纹理坐标进行比较,获取与所述第一纹理数据采样请求具有相同纹理坐标的第二纹理数据采样请求;以及,将所述第一纹理数据采样请求传输至所述请求缓存;针对每个被轮询的纹理数据采样请求,若被轮询的纹理数据采样请求被划分为第二纹理数据采样请求,则按照优先级顺序轮询下一个纹理数据采样请求。4.根据权利要求1所述的装置,其特征在于,所述请求缓存为深度为n且符合先进先出策略的全相连结构,且所述请求缓存内的每行缓存数据包括SP标识以及所述SP标识指示的SP所发送的纹理数据采样请求中的纹理坐标;相应地,所述数据缓存为深度为n且符合先进先出策略的全相连结构,且所述数据缓存内的每行缓存数据包括SP标识以及相应于所述SP标识指示的SP所发送的纹理数据采样请求的纹理数据。5.根据权利要求4所述的装置,其特征在于,所述请求缓存,还经配置为:当接收到新的第一纹理数据采样请求后,按照纹理坐标将所述新的第一纹理数据采样请求与已缓存的第一纹理数据采样请求进行比较:相应于所述新的第一纹理数据采样请求与所述已缓存的第一纹理数据采样请求均不具有相同的纹理坐标,则按照FIFO策略缓存所述新的第一纹理数据采样请求;相应于所述已缓存的第一纹理数据采样请求中的一个与所述新的第一纹理数据采样请求具有相同的纹理坐标,则将与所述新的第一纹理数据采样请求具有相同的纹理坐标的已缓存的第一纹理数据采样请求对应的SP标识发送至数据缓存;相应地,所述数据缓存,还经配置为:接收请求缓存发送的SP标识,并将缓存的与所述SP标识对应的纹理数据反馈至仲裁模块。6.一种降低纹理单元访问量的方法,其特征在于,所述方法应用于权利要求1至5任一项所述的降低纹理单元访问量的装置,所...

【专利技术属性】
技术研发人员:刘世豪黄虎才
申请(专利权)人:西安博图希电子科技有限公司
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1