编译器后端自动生成方法及系统技术方案

技术编号：39489237 阅读：20 留言：0更新日期：2023-11-24 11:11

本发明专利技术提供一种用于编译器后端生成的神经网络模型的训练方法，包括：对于不同目标架构的函数，将同组函数对应的抽象语法树进行匹配，得到各个函数中的语句所对应的语句模板，以及特定于目标架构的信息的位置；分析语句模板和特定于目标架构的信息，形成目标相关索引表，以保存特征至特征值定义位置的映射关系；根据所述每一个语句模板，查找所述目标相关索引表，在不同目标架构的目标描述文件中提取所述语句模板的特征值以生成所述不同目标架构下与所述语句模板对应的特征序列

全部详细技术资料下载

【技术实现步骤摘要】
编译器后端自动生成方法及系统

[0001]本专利技术属于计算机
，具体涉及编译器代码的自动生成，尤其涉及编译器后端代码的自动生成
。

技术介绍

[0002]编译器作为芯片配套的重要基础软件，向上封装高级语言从而提高应用软件的开发效率和兼容性，向下适应体系结构以生成高效的可执行代码，是沟通软硬件的桥梁
。
编译技术的优劣在极大程度上决定了处理器的个性化设计
、
体系结构优势是否能够充分发挥出来；编译器研发的快慢，直接影响芯片开发的速度
。
[0003]经过几十年的努力，编译器社区成功建立了强大的现代编译器基础设施，例如
GCC(GNU
编译器套件
)、MLIR(
多级别中间表示
)
以及
LLVM。
其中，
LLVM
是构建编译器的框架系统，以
C++
编写而成，提供了与编译器相关的支持，可以作为多种语言编译器的后台来使用，是一个模块化
、
可重复使用的编译器和工具技术的集合
。
现代编译器通常采用三段式架构，将编译器分为前端
、
中端和后端，为编译器移植提供了很大的灵活性
。
当需要支持新的目标架构时，只需要开发一个后端，复用前端和中端，极大提高了编译器移植效率
。
现有的编译器框架系统，例如
LLVM
，通常利用目标无关代码生成机制来支持不同的微处理器
。<...

【技术保护点】

【技术特征摘要】
1.
一种用于编译器后端生成的神经网络模型的训练方法，其特征在于，包括：
S1:
对于不同目标架构的函数，将同组函数对应的抽象语法树进行匹配，得到各个函数中的语句所对应的语句模板，以及特定于目标架构的信息的位置；
S2:
分析语句模板和特定于目标架构的信息，形成目标相关索引表，以保存特征至特征值定义位置的映射关系；
S3:
根据所述每一个语句模板，查找所述目标相关索引表，在不同目标架构的目标描述文件中提取所述语句模板的特征值以生成所述不同目标架构下与所述语句模板对应的特征序列；
S4:
利用所述特征序列训练所述神经网络模型
。2.
根据权利要求1所述的神经网络模型的训练方法，其特征在于，所述
S1
包括：
S1
‑1：将不同目标架构的函数按名称进行分组并转换为抽象语法树；
S1
‑2：将同组函数对应的抽象语法树进行匹配得到各个函数中的语句所对应的语句模板，以及特定于目标架构的信息的位置
。3.
根据权利要求1或2所述的神经网络模型的训练方法，其特征在于，利用树差分算法将同组函数对应的抽象语法树进行匹配
。4.
根据权利要求1所述的神经网络模型的训练方法，其特征在于，所述
S2
包括：
S2
‑1：分别从架构，函数，语句层级寻找语句模板以及特定于目标架构的信息的共性构建特征；
S2
‑2：记录所述特征名称，所属级别，语句模板关联信息，对应的特征值所在的文件名称，对应的特征值所在文件中的位置形成目标相关索引表
。5.
根据权利要求4所述的神经网络模型的训练方法，其特征在于，所述
S3
包括：
S3
‑
1:
针对每一个语句模板，根据目标架构名称，函数名称，语...

【专利技术属性】
技术研发人员：王莹莹，钟茗，王陆霖，邱蕾，吕方，冯晓兵，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人