【技术实现步骤摘要】
一种基于采样的多核模拟并行加速方法
本专利技术涉及计算机体系结构系统模拟领域,具体涉及一种基于采样的多核模拟并行加速方法。
技术介绍
随着片上系统的迅猛发展、多核处理器的普及和众核处理器的出现,单个芯片上集成的组件越来越多,如何从指数级增长的设计方案中快速找到最优方案,逐渐成为设计此类系统的关键。例如,如何设计拓扑结构互联成百上千个处理单元、存储单元,如何分配存储层级,如何确定各层级所需存储空间大小等,众多设计参数将构成一个巨大的设计空间,如何从浩瀚的设计空间中快速定位到最优的设计方案,成为此类系统设计面临的一个重大挑战。微体系结构模拟是新一代处理器体系结构设计初期性能评估的关键技术。该技术利用软件方式模拟硬件的各种设计,通常需要开发模拟框架,例如模拟器,在模拟器中模拟实现各硬件的功能,并通过在其上运行基准测试程序初步评估设计方案。微体系结构模拟评估技术所采用的模拟框架一般都为单线程模拟器。单线程模拟框架可以较好地应用于单核处理器的模拟评估,以及运行单线程的基准测试程序。但是,随着应用程序的日益庞杂,多线程程序的普及,多核、众核系统的出现,单线程模拟框架已经无法适 ...
【技术保护点】
一种基于采样的多核模拟并行加速方法,其特征在于,包括:S1:选定多线程应用程序作为多核基准测试程序;S2:对S1中选定的多线程应用程序采用采样策略,取得每个线程的指令流样本片段;S3:把S2中取得的每个线程的指令流样本片段运行在模拟器的动态代码分析模块中,将每个线程的指令流样本片段按照分割点的不同分割成多个离散片段;S4:将S3中多个离散片段按照分割时分割点的不同进行分组;S5:把S4中分组后的离散片段运行在对应的片段模拟模块中,得出所述离散片段运行所需花费的模拟时间;S6:将S5中所有的片段模拟模块中所输出的模拟时间相加,得出S1中多线程应用程序的模拟执行总时间。
【技术特征摘要】
1.一种基于采样的多核模拟并行加速方法,其特征在于,包括:S1:选定多线程应用程序作为多核基准测试程序;S2:将S1中选定的多线程应用程序中每个线程的指令流片段进行等分,从等分过后的指令流片段当中选取部分指令流片段作为指令流初步样本片段,对各个线程所述指令流初步样本片段采用基于康托尔集合的分形采样策略进行采样,取得每个线程的指令流样本片段;S3:把S2中取得的每个线程的指令流样本片段运行在模拟器的动态代码分析模块中,将每个线程的指令流样本片段按照分割点的不同分割成多个离散片段;S4:将S3中多个离散片段按照分割时分割点的不同进行分组;所述S3、S4中的分割点为失效事件;所述失效事件包括各级缓存缺失、指令分支预测失败、Load指令读取;S5:把S4中分组后的离散片段运行在对应的片段模拟模块中,得出所述离散片段运行所需花费的模拟时间;S6:将S5中所有的片段模拟模块中所输出的模拟时间相加,得出S1中多线程应用程序的模拟执行总时间。2.根据权利要求1所述的基于采样的多核模拟并行加速方法,其特征在于,所述S2中的采样策略还包括:将所述的指令流初步样本片段分为三份,去掉中间的一份,保留两边的两份;对保留的两份各自进一步分为三份,去掉各自中间的一份,保留各自两边的两份,以此类推,K次过后,将获得2K份指令流片段,所述2K份指令流片段即为指令流样本片段,其中,K为大于1的自然数。3.根据权利要求1所述的基于采样的多核...
【专利技术属性】
技术研发人员:喻之斌,须成忠,姜春涛,
申请(专利权)人:中国科学院深圳先进技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。