一种智能化计算装置及其故障排除方法制造方法及图纸

技术编号:19933904 阅读:42 留言:0更新日期:2018-12-29 04:26
本发明专利技术公开了一种智能化计算装置及其减少过热故障的方法,通过实时采集运算单元的运行温度信号,与设置的温度阈值进行比较,预判该运算单元工作状态的发展趋势,对可能发生过热故障的运算单元进行工作频率调整,使该运算单元的运算强度下降,从而有效地避免发生计算芯片的过热故障。

【技术实现步骤摘要】
一种智能化计算装置及其故障排除方法
本专利技术涉及一种用于进行海量运算的装置,尤其涉及一种使用多芯片进行海量运算的装置及其故障排除方法。
技术介绍
虚拟货币(如比特币、以太币)是一种P2P形式的数字货币,自2009年比特币系统推出以来就受到了广泛关注。该系统是基于区块链构建分布式共享总账,从而保证系统运行的安全、可靠以及去中心化。在哈希运算和工作量证明上,比特币是基于计算得到的唯一正确的哈希值,来证明工作量从而获得记账打包区块权,因此获得奖励,这就是工作量证明(Pow)。目前除了暴力计算外,还没有有效的算法进行解决。比特币挖矿开始于CPU或者GPU这种低成本的硬件,不过随着比特币的流行,挖矿的过程出现较大变化。如今,挖矿活动转移到现场可编程门阵列(FPGA)或专用芯片(ASIC)上来,通过优化可以实现哈希速度,这种模式的挖矿效率非常高。为了提高数字货币矿机的算力,目前算力板卡的设计一般是将几十、几百甚至上千个计算单元放置在同一块印刷电路板上,若该运算板卡上的某一个计算单元一旦发生故障,则需要更换整块运算板卡来排除故障,导致运算单元资源浪费严重,且使得数字货币矿机等装置的使用成本变高。本文档来自技高网...

【技术保护点】
1.一种智能化计算装置,包括:分别与一控制器和一供电调整装置连接的算力板,其特征在于,所述算力板,包括分别与所述供电调整装置连接的多个运算单元和测温单元,所述运算单元包括用于挖掘虚拟数字货币的运算模块,所述测温单元用于实时采集所述运算单元在运算过程中的温度信号并将所述温度信号输出;所述供电调整单元,用于向所述运算单元提供工作电压,通过调整所述工作电压的工作频率控制所述运算单元的工作状态,并将所述工作状态信号输出;所述控制器,包括处理单元,用于接收所述供电调整单元与所述测温单元的输出信号,通过分析任意一个所述运算单元的运行温度数据并与所述运算单元实现正常工作的温度阈值进行对比,预判所述运算单元工...

【技术特征摘要】
1.一种智能化计算装置,包括:分别与一控制器和一供电调整装置连接的算力板,其特征在于,所述算力板,包括分别与所述供电调整装置连接的多个运算单元和测温单元,所述运算单元包括用于挖掘虚拟数字货币的运算模块,所述测温单元用于实时采集所述运算单元在运算过程中的温度信号并将所述温度信号输出;所述供电调整单元,用于向所述运算单元提供工作电压,通过调整所述工作电压的工作频率控制所述运算单元的工作状态,并将所述工作状态信号输出;所述控制器,包括处理单元,用于接收所述供电调整单元与所述测温单元的输出信号,通过分析任意一个所述运算单元的运行温度数据并与所述运算单元实现正常工作的温度阈值进行对比,预判所述运算单元工作状态的发展趋势;当判断所述运行温度数据趋向为超过所述温度阈值时,则发出调整所述工作频率的指令使所述运算单元的运算强度下降。2.根据权利要求1所述的智能化计算装置,其特征在于,所述处理器进一步包括:一数据管理模块,用于记录与处理所述运算单元的初始状态和工作状态的初始温度值、运行温度值、设置初始或修正的温度阈值。3.根据权利要求2所述的一种智能化计算装置,其特征在于,所述温度阈值是通过对所述运算单元长期工作的温度数据积累统计而形成的,并通过连接所述数据管理模块的一输入装置而设置。4.根据权利要求2所述的一种智能化计算装置,其特征在于,所述设定的温度阈值是根据所述运算单元长期工作的温度数据积累统计而自动修正的。5.根据权利要求1、2或4所述的一种智能化计算装置,其特征在于,所述自动修正是通过判断所述温度数据与所述温度阈值之间对比曲线发展趋势来主动修正所述温度阈值的;如果正常工作的运行温度统计值长期处于所述温度阈值的下限左右,则自动将所述温度阈值提高3-6度,如果正常工作温度统计值长期处于所述温度阈值的上限左右,则自动将所述温度阈值降低3-6度。6.根据权利要求5所述的一种智能化计算装置,其特征在于,还包括一与所述控制器连接的显示装置,用于实时显示所述运算单元的初始状态、工作状态、温度数据曲线、温度阈值以及故障报警。7.根据权利要求5所述的一种智能化计算装置,其特征在于,所述工作状态包括供电电压、工作频率、实时温度和/或I/O状态。8.根据权利要求1、2、3、4或5所述的一种智能化计算装置,其特征在于,所述温度阈值为能避免因温度过高导致所运算单元发生故障的最高温度范围。9.根据权利要求6所述的一种智能化计算装置,其特征在于,所述显示装置提供实时运行温度曲线图及趋势报警提示。10.根据权利要求2所述的智能化计算装置,其特征在于,所述数据管理器进一步包括:一存储模块,用于存储所述运算单元的温度初始值、运算过程中的运行温度值、设定或修正后的温度阈值;一监控管理模块,用于对所述运算单元在运算过程中的温度值进行实时监控分析与处理,并根据处理结果输出故障超前预警信息,或者故障自诊断信息,或者温度阈值自修正信息。11.根据权利要求10所述的智能化计算装置,其特征在于,所述监控管理模块进一步包括:故障超前预警单元,用于通过分析每个所述运算单元的运行温度值,当所述当前运行温度值持续在预定时间内大于正常运行温度值而接近温度阈值时,则提前发出故障预警信号,其中,所述温度阈值为所述运算单元可实现最大算力时的温度极限值;故障自诊断单元,用于通过分析所述运算单元的每个历史温度数据并结合所述运算单元的历史平均温度数据,实时分析所述运算单元的运行温度值变化,当所述运算单元的运行温度值在预设时间段内与所述运算单元的历史平均温度值相比持续异常时,发出预警信息,并及时下调所述运算单元的工作频率;和/或,温度阈值自修正单元,用于通过分析所述运算单元的历史温度数据形成所述运算单元的正常工作温度范围,实时分析所述运算单元的运行温度变化,当所述运行温度长时间处于所述正常工作温度范围上限或下限边缘时,则根据所述正常工作温度范围自动修正所述温度阈值。12.根据权利要求11所述的智能化计算装置,其特征在于,所述监控管理模块还包括:温度趋势图形生成单元,用于当出现故障预报警或报警时确认发生所述故障预报警或报警的运算单元,并显示所述运算单元运算过程中的历史温度数据,并根据该历史温度数据生成所述运算单元温度趋势的历史曲线图。13.一种智能化计算装置,其特征在于,包括:一个或多个运算单元,用于挖掘虚拟数字货币的运算;一个或多个测温单元,用于实时采集所述运算单元在运算过程中的温度信号并将所述温度信号输出;一个或多个供电调整单元,用于向所述运算单元提供工作电压,通过调整所述工作电压的工作频率控制所述运算单元的工作状态,并将所述工作状态信号输出;至少一个处理器,用于接收所述供电调整单元与所述测温单元的输出信号,通过分析任意一个所述运算单元的运行温度数据并与所述运算单元实现正常工作的温度阈值进行对比,预判所述运算单元工作状态的发展趋势;当判断所述运行温度数据趋向为超过所述温度阈值时,则发出调整所述工作频率的指令使所述运算单元的运算强度下降。14.根据权利要求13所述的智能化计算装置,其特征在于,所述处理器进一步包括:一数据管理模块,用于记录与处理所述运算单初始状态、工作状态的初始温度值、运行温度值、设置初始或修正的温度阈值。15.根据权利要求13所述的智能化计算装置,其特征在于,所述温度阈值是通过对所述运算单元长期工作的温度数据积累统计而形成的,并通过连接所述数据管理模块的一输入装置而设置。16.根据权利要求13所述的智能化计算装置,其特征在于,所述设...

【专利技术属性】
技术研发人员:刘亭婷张楠赓
申请(专利权)人:杭州嘉楠耘智信息科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1