【技术实现步骤摘要】
P扩展的向量化优化方法及装置
[0001]本申请涉及计算机
,尤其涉及一种P扩展的向量化优化方法及装置。
技术介绍
[0002]按照RISC
‑
V指令集的设计,其扩展分为基础指令和扩展指令,基础指令是必须实现的,扩展指令则可根据需求进行定制。其中,P扩展(Packed
‑
SIMD Instructions)通过加速计算,用多媒体指令集来增强处理器的算法处理能力,以更低的功耗和更加高的性能运行应用程序。
[0003]然而,现有的P扩展在处理大量的向量数据时,需要处理器相对较长的执行时间,不能发挥出处理器最好性能,同时也不能很好的优化程序的代码段和数据段大小。
技术实现思路
[0004]本申请提供一种P扩展的向量化优化方法及装置,用以解决现有技术中二进制指令编码文件过大以及处理向量数据时RISC
‑
V架构下处理器P扩展执行效率低下的缺陷,有助于减小二进制编码文件大小并提升处理器的执行效率。
[0005]本申请提供一种P扩展的向量化优化方法 ...
【技术保护点】
【技术特征摘要】
1.一种P扩展的向量化优化方法,其特征在于,包括:对目标循环结构进行P扩展的向量化可行性分析,得到所述目标循环结构的向量化可行性分析结果;基于所述向量化可行性分析结果,对所述目标循环结构进行至少一次P扩展的向量化,得到所述目标循环结构的P扩展中间表示;基于所述目标循环结构的P扩展中间表示进行指令选择,得到所述目标循环结构的P指令汇编。2.根据权利要求1所述的P扩展的向量化优化方法,其特征在于,所述对目标循环结构进行P扩展的向量化可行性分析,得到所述目标循环结构的向量化可行性分析结果,包括:获取所述目标循环结构的运行环境中的标量寄存器信息、所述目标循环结构的循环特性和所述目标循环结构的P扩展向量化特征;基于所述标量寄存器信息、所述循环特性和所述P扩展向量化特征,得到所述目标循环结构的向量化可行性分析结果。3.根据权利要求1或2所述的P扩展的向量化优化方法,其特征在于,所述基于所述向量化可行性分析结果,对所述目标循环结构进行至少一次P扩展向量化,得到所述目标循环结构的P扩展中间表示,包括:在所述向量化可行性分析结果为可向量化的情况下,对所述目标循环结构进行一次P扩展向量化,得到中间表示循环结构;对所述中间表示循环结构进行标准化,并对标准化后的中间表示循环结构进行P扩展的向量化可行性分析,得到新的向量化可行性分析结果;在所述新的向量化可行性分析结果为可向量化的情况下,对所述标准化后的中间表示循环结构进行至少一次P扩展向量化,直至出现P扩展向量化后得到的新的中间表示循环结构中没有可向量化数据,确定所述新的中间表示循环结构为所述目标循环结构的P扩展中间表示。4.根据权利要求3所述的P扩展的向量化优化方法,其特征在于,所述对所述目标循环结构进行一次P扩展向量化,得到中间表示循环结构,包括:对所述目标循环结构进行逐语句的P扩展向量化;基于每个语句的P扩展向量化的结果,确定每个语句的性能开销;将...
【专利技术属性】
技术研发人员:陈一,周乃彪,王全,操伟业,陈浩,王云,王宝兴,蒋科,王海江,陈健,
申请(专利权)人:北京奕斯伟计算技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。