图形处理单元处理和高速缓存改进制造技术

技术编号：28490690 阅读：44 留言：0更新日期：2021-05-19 22:12

本申请公开了图形处理单元处理和高速缓存改进。本文中的实施例总体上涉及与关于GPU处理/高速缓存的功率、等待时间、带宽和/或性能问题有关的改进。根据一个实施例，系统包括产生方知识产权(IP)(例如，媒体IP)、计算核(例如，GPU或GPU的AI专用核)、在逻辑上插入在产生方IP与计算核之间的流式缓冲器。产生方IP可操作用于消耗来自存储器的数据并将结果输出到流式缓冲器。计算核可操作用于基于从流式缓冲器消耗的数据执行AI推断处理，并将AI推断处理结果输出到存储器。结果输出到存储器。结果输出到存储器。

全部详细技术资料下载

【技术实现步骤摘要】
图形处理单元处理和高速缓存改进
相关申请的交叉引用
[0001]本申请要求2019年11月15提交的美国临时申请号62/935,729的权益，该临时申请由此通过引用整体结合于此用于所有目的。

[0002]本文中描述的实施例总体上涉及图形处理单元(GPU)领域，更具体地涉及与关于GPU处理/高速缓存的功率、等待时间、带宽和/或性能问题有关的改进。

技术介绍

[0003]当前的GPU处理场景和高速缓存架构呈现出功率、等待时间、带宽和/或性能问题。例如，当前原子性约简(在类直方图应用中使用的某个种类的操作)在一处(例如，在共享本地存储器(SLM)中或在L3高速缓存中)被执行/保持，并消耗带宽且产生等待时间。
[0004]在其中计算机图形图像或视频在光学空间中通过规则网格被细分且随后单独地渲染网格或片的每个部分的分片渲染的上下文中，优势在于相比立即绘制整个帧的立即模式渲染系统，存储器和带宽的量减少。然而，当用于例如人工智能(AI)推断时，视频片的该使用模型具有劣势。视频片是大的，并且像素被写入动态随机存取存储...

【技术保护点】

【技术特征摘要】
1.一种方法，包括：由媒体知识产权IP从存储器读取数据单元；以及对于所述数据单元内的、图形处理单元GPU的人工智能AI专用核配置成要操作的数据的每个分析处理单元，通过以下步骤来促进由所述媒体IP和所述AI专用核进行的并行处理：由所述媒体IP对所述分析处理单元执行媒体处理；响应于第一信号，由所述媒体IP将所述媒体处理的结果写入流式缓冲器，所述流式缓冲器在逻辑上插入在所述媒体IP与所述AI专用核之间；经由第二信号向所述AI专用核通知与所述流式缓冲器中所述数据的可用性有关的信息；响应于所述第二信号，由所述AI专用核从所述流式缓冲器读取所述数据经由所述第一信号向所述媒体IP通知与所述AI专用核对所述数据的消耗有关的信息；由所述AI专用核对所述数据执行媒体分析处理；以及由所述AI专用核将所述媒体分析处理的结果写入所述存储器。2.根据权利要求1所述的方法，其中，所述流式缓冲器包括高速缓存、动态随机存取存储器、计算机系统的系统存储器、或专用图形存储器。3.根据权利要求1或2所述的方法，其中，所述向所述AI专用核通知与所述流式缓冲器中所述数据的可用性有关的信息由所述流式缓冲器执行。4.根据权利要求1或2所述的方法，其中，所述向所述AI专用核通知与所述流式缓冲器中所述数据的可用性有关的信息由所述媒体IP执行。5.根据权利要求1或2所述的方法，其中，所述向所述媒体IP通知与所述AI专用核对所述数据的消耗有关的信息由所述流式缓冲器执行。6.根据权利要求1或2所述的方法，其中，所述向所述媒体IP通知与所述AI专用核对所述数据的消耗有关的信息由所述AI专用核执行。7.根据权利要求1...

【专利技术属性】
技术研发人员：S，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人