一种基于异构平台的多种并行错误检测系统技术方案

技术编号：12426074 阅读：135 留言：0更新日期：2015-12-03 11:27

本发明专利技术属于并行处理器技术领域，具体涉及一种基于异构处理平台的多种并行错误检测系统。本发明专利技术主要利用异构平台上通用图形处理器强大的并行计算能力与可编程性，来同时检测主流的多种并行错误，包括数据竞争，原子性违背和顺序违背。设计复杂度方面，本发明专利技术只需要较平滑的硬件复杂度，并且不需要改变片上关键路径（如高速缓存或者缓存一致性）的逻辑，只添加访存收集模块和访存预处理模块，分别来收集可能导致并行错误的访存指令和提供错误检测的相关信息，错误检测的算法则利用通用图形处理器来实现高度并行。本发明专利技术提供的硬件架构能够在程序运行过程中发现并行错误，并且只带来很小的运行开销。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于并行处理器
，具体涉及一种基于异构平台(通用处理器和图形处理器混合架构)处理能力的多种并行错误检测体系架构。
技术介绍
随着计算机科技的发展，多核处理器愈发普遍。日常生活中，台式机、笔记本电脑、平板电脑，甚至是手机，都已经配备了多核处理器。单一芯片上处理器核数的增多，带来了潜在的计算能力。为了充分利用多核设备上的计算资源，并行程序得到了普遍的应用。然而，受困于并行程序错误，编写正确的并行程序并非易事。一方面，程序员习惯于串行化的思考方式，导致了编写并行程序时容易产生错误；另一方面，并行程序的不确定性导致了调试过程中的并行程序空间难以重现，增加了调试的难度。难以调试的并行程序错误对软件的可靠性构成了严重的威胁，甚至造成了许多严重的事故和巨大的财产损失。例如，2003年美国东北地区的大面积停电事故，影响了超过5000万人。又如，2012年脸谱公司的IPO故障事故，造成了数亿美元的经济损失。此外，并行错误的多样性加剧了检测的复杂性。目前主流的并行错误有数据竞争、原子性违背和顺序违背等多种类型。而且，较之串行错误，由于并行程序的不确定性，往往使得错误场景难以重现，导致了并行错误更加难以定位与检测。为了检测并行错误，学术界与工业界提出了许多解决方案与工具，它们可以被分为两类:软件检测工具与硬件检测架构。软件检测工具一般通过程序插粧来获取程序运行时状态，而后对该状态进行检测分析。这类工具往往不得不承受插粧带来的巨大性能负载。为了提高性能，一些研究使用了采样技术，即仅仅检测整个程序的一部分，但这种方式通常会损失检测精度。另一方面，硬件架构通...
一种<a href="http://www.xjishu.com/zhuanli/55/CN105117369.html" title="一种基于异构平台的多种并行错误检测系统原文来自X技术">基于异构平台的多种并行错误检测系统</a>

【技术保护点】
一种基于异构平台的多种并行错误检测体系架构，其特征在于：是在当前主流的异构平台体系架构基础上添加两个简易硬件模块：访存收集模块和访存预处理模块，从而建立整个并行错误检测的体系；其中，所述访存收集模块在检测流程的上游，位于每个处理器内，负责访存收集；所述访存预处理模块接收访存收集模块收集的访存信息，经预处理后将它们记录成为历史信息，然后发送至通用图形处理器进行错误检测；通用图形处理器在检测流程下游，接收访存预处理模块发送来的访存信息并进行相应算法的检测。

【技术特征摘要】

【专利技术属性】
技术研发人员：张为华，余时强，
申请(专利权)人：复旦大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人