一种巡检方法及装置制造方法及图纸

技术编号:24707597 阅读:28 留言:0更新日期:2020-06-30 23:55
本发明专利技术公开了一种巡检方法及装置,其中方法包括:模型管理设备向各个移动设备发送模型训练指示,各个移动设备根据模型训练指示,按照对应的巡检路线在机房中行进时采集训练数据,基于本地模型和训练数据训练得到中间模型并上报给模型管理设备,模型管理设备基于各个中间模型的模型参数训练得到识别模型,识别模型用于确定机房的健康状态。通过将中间模型的训练过程放置在移动设备侧执行,使得移动设备可以仅上报中间模型的模型参数给模型管理设备,而无需上报全量的训练数据,从而能够节省通信开销,提高巡检效率。

【技术实现步骤摘要】
一种巡检方法及装置
本专利技术涉及图像处理
,尤其涉及一种巡检方法及装置。
技术介绍
互联网数据中心(InternetDataCenter,IDC)机房是在互联网通信线路和带宽资源的基础上建立的标准化的机房环境,IDC机房可以容纳多种类型的设备,比如服务器、监控设备、管理设备、安全设备等。在实际操作中,通常需要对IDC机房进行巡检,比如采集设备的信号灯图像以识别设备的信号灯的状态、采集设备图像以识别设备类型、采集气味数据和/或温度数据以分析机房环境。因此,在对IDC机房中的设备进行巡检时,如何有效地对巡检数据进行识别,对于维护机房安全、及时排查故障是非常重要的。在一种现有的实现方式中,各个移动设备从机房中采集训练数据并上报给服务器进行集中训练,服务器训练得到识别模型后,将识别模型下发给各个移动设备,以由各个移动设备使用识别模型对采集到的巡检数据进行识别,完成对机房的巡检。然而,该种方式存在如下问题:训练数据(比如图像、气味或温度)一般对应较大的数据量,由于该种方式需要各个移动设备将训练数据上报给服务器,因此会存在较大的通信开销,导致巡检效率较低。综上,目前亟需一种巡检方法,用以解决现有技术采用服务器集中训练识别模型所导致的通信开销大、巡检效率低的技术问题。
技术实现思路
本专利技术提供一种巡检方法及装置,用以解决现有技术采用服务器集中训练识别模型所导致的通信开销大、巡检效率低的技术问题。第一方面,本发提供的一种巡检方法,应用于模型管理设备,所述方法包括:向各个移动设备发送模型训练指示;所述模型训练指示用于所述各个移动设备按照各自的巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到中间模型;进一步地,接收所述各个移动设备上报的中间模型的模型参数,并基于所述各个移动设备上报的中间模型的模型参数训练得到识别模型,所述识别模型用于确定所述机房的健康状态。本专利技术中,中间模型的训练过程放置在移动设备侧执行,从而移动设备可以仅上报中间模型的模型参数给模型管理设备,而无需上报全量的训练数据,模型参数相对于训练数据来说具有较小的数据量,因此该种方式可以节省通信开销,提高巡检效率;且,通过在移动设备的巡检过程中使用识别模型确定机房的健康状态,实现了模型训练和模型识别的联合操作,从而还能提高巡检效率。在一种可能的实现方式中,所述识别模型为当前时间片对应的识别模型;具体实施中,所述向各个移动设备发送模型训练指示之前,还包括:从机房的全部移动设备中选取出当前时间片对应的移动设备,作为所述各个移动设备。在上述实现方式中,通过将模型训练分解为多个时间片执行,并在每个时间片中选取部分移动设备执行训练,能够有效分配并均匀利用训练数据和移动设备,避免训练模型时由于数据过大所造成的参数迭代无法收敛的问题,提高识别模型的准确性。在一种可能的实现方式中,所述模型训练指示用于所述各个移动设备循环按照各自的巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到中间模型并上报;所述接收所述各个移动设备上报的中间模型的模型参数,基于所述各个移动设备上报的中间模型的模型参数训练得到识别模型,包括:每接收到设定数量的模型参数,则至少基于所述设定数量的模型参数构建得到综合模型参数,将所述综合模型参数下发给所述各个移动设备;所述综合模型参数用于所述各个移动设备更新本地模型;当某一综合模型参数对应的模型满足当前时间片的结束条件时,向所述各个移动设备发送模型训练结束指令,所述综合模型参数对应的模型即为所述识别模型。在上述实现方式中,通过在每个时间片内执行多次模型综合操作,且每次模型综合操作使用设定数量的模型参数得到综合模型参数,而不使用全部移动设备的模型参数进行综合,能够在使用尽可能多的模型参数得到综合模型参数的同时,兼容部分移动设备故障的情况,保证模型训练的顺利进行。在一种可能的实现方式中,所述模型管理设备为服务器;所述基于所述各个移动设备上报的中间模型的模型参数训练得到识别模型之后,还判断所述识别模型是否满足所述模型训练的结束条件,若不满足,则从所述机房的全部移动设备中选取下一时间片对应的移动设备,向所述下一时间片对应的移动设备发送模型训练指示;若满足,则将所述识别模型作为目标识别模型。在上述实现方式中,通过将服务器作为模型管理设备,可以在对各个移动设备的模型训练过程进行统一管理的同时,有效降低移动设备的压力,提高移动设备训练中间模型的效率;且,通过在每个时间片启动时重新选取执行训练的移动设备,能够有效分配移动设备,充分考虑到不同移动设备的差异,提高识别模型的准确性。在一种可能的实现方式中,所述模型管理设备为移动设备;所述基于所述各个移动设备上报的中间模型的模型参数训练得到识别模型之后,还判断所述识别模型是否满足所述模型训练的结束条件,若不满足,则通过与其他移动设备的通信选取某一移动设备作为下一时间片对应的模型管理设备,向所述下一时间片对应的模型管理设备发送模型启动指示;所述模型启动指示用于所述下一时间片对应的模型管理设备从其它移动设备中选取下一时间片对应的其它移动设备,向所述下一时间片对应的其它移动设备发送模型训练指示;若满足,则将所述识别模型作为目标识别模型。在上述实现方式中,通过将移动设备作为模型管理设备,可以无需再额外设置服务器,从而可以降低模型训练的成本;且,通过在每个时间片启动时重新选取执行训练的移动设备,能够有效分配移动设备,充分考虑到不同移动设备的差异,提高识别模型的准确性。第二方面,本专利技术提供的一种巡检方法,应用于移动设备,所述方法包括:接收模型管理设备发送的模型训练指示,根据所述模型训练指示,按照对应的巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到所述移动设备对应的中间模型,将所述中间模型的模型参数上报给所述模型管理设备;所述各个移动设备上报的中间模型的模型参数用于所述模型管理设备训练得到识别模型,所述识别模型用于确定所述机房的健康状态。在一种可能的实现方式中,所述根据所述模型训练指示,按照巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到所述移动设备对应的中间模型,将所述中间模型的模型参数上报给所述模型管理设备,包括:根据所述模型训练指示,循环执行:按照巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到所述移动设备对应的中间模型,将所述中间模型的模型参数上报给所述模型管理设备;其中,在每次循环中,所述将所述中间模型的模型参数上报给所述模型管理设备之后,还接收所述模型管理设备发送的综合模型参数,使用所述综合模型参数更新所述本地模型。在一种可能的实现方式中,所述使用所述综合模型参数更新所述本地模型之后,还按照所述巡检路线在所述机房中行进时采集待识别数据,使用更新后的本地模型对所述待识别数据进行识别,以确定所述机房的健康状态。在上述实现方式中,通过在巡检过程中联合执行训练、优化和识别操作,能够实现边训练模型、边优化模型、边识别模型的本文档来自技高网...

【技术保护点】
1.一种巡检方法,其特征在于,应用于模型管理设备,所述方法包括:/n向各个移动设备发送模型训练指示;所述模型训练指示用于所述各个移动设备按照各自的巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到中间模型;/n接收所述各个移动设备上报的中间模型的模型参数;/n基于所述各个移动设备上报的中间模型的模型参数训练得到识别模型,所述识别模型用于确定所述机房的健康状态。/n

【技术特征摘要】
1.一种巡检方法,其特征在于,应用于模型管理设备,所述方法包括:
向各个移动设备发送模型训练指示;所述模型训练指示用于所述各个移动设备按照各自的巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到中间模型;
接收所述各个移动设备上报的中间模型的模型参数;
基于所述各个移动设备上报的中间模型的模型参数训练得到识别模型,所述识别模型用于确定所述机房的健康状态。


2.根据权利要求1所述的方法,其特征在于,所述识别模型为当前时间片对应的识别模型;
所述向各个移动设备发送模型训练指示之前,还包括:
从机房的全部移动设备中选取出当前时间片对应的移动设备,作为所述各个移动设备。


3.根据权利要求2所述的方法,其特征在于,所述模型训练指示用于所述各个移动设备循环按照各自的巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到中间模型并上报;
所述接收所述各个移动设备上报的中间模型的模型参数,基于所述各个移动设备上报的中间模型的模型参数训练得到识别模型,包括:
每接收到设定数量的模型参数,则至少基于所述设定数量的模型参数构建得到综合模型参数,将所述综合模型参数下发给所述各个移动设备;所述综合模型参数用于所述各个移动设备更新本地模型;
当某一综合模型参数对应的模型满足当前时间片的结束条件时,向所述各个移动设备发送模型训练结束指令,所述综合模型参数对应的模型即为所述识别模型。


4.根据权利要求2或3所述的方法,其特征在于,所述模型管理设备为服务器;
所述基于所述各个移动设备上报的中间模型的模型参数训练得到识别模型之后,还包括:
判断所述识别模型是否满足所述模型训练的结束条件,若不满足,则从所述机房的全部移动设备中选取下一时间片对应的移动设备,向所述下一时间片对应的移动设备发送模型训练指示;若满足,则将所述识别模型作为目标识别模型。


5.根据权利要求2或3所述的方法,其特征在于,所述模型管理设备为移动设备;
所述基于所述各个移动设备上报的中间模型的模型参数训练得到识别模型之后,还包括:
判断所述识别模型是否满足所述模型训练的结束条件,若不满足,则通过与其他移动设备的通信选取某一移动设备作为下一时间片对应的模型管理设备,向所述下一时间片对应的模型管理设备发送模型启动指示;所述模型启动指示用于所述下一时间片对应的模型管理设备从其它移动设备中选取下一时间片对应的其它移动设备,向所述下一时间片对应的其它移动设备发送模型训练指示;若满足,则将所述识别模型作为目标识别模型。


6.一种巡检方法,其特征在于,应用于移动设备,所述方法包括:
接收模型管理设备发送的模型训练指示;
根据所述模型训练指示,按照对应的巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到所述移动设备对应的中间模型;
将所述中间模型的模型参数上报给所述模型管理设备;所述各个移动设备上报的中间模型的模型参数用于所述模型管理设备训练得到识别模型,所述识别模型用于确定所述机房的健康状态。


7.根据权利要求6所述的方法,其特征在于,所述根据所述模型训练指示,按照巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到所述移动设备对应的中间模型,将所述中间模型的模型参数上报给所述模型管理设备,包括:
根据所述模型训练指示,循环执行:按照巡检路线在机房中行进时采集训练数据,基于本地模型和所述训练数据训练得到所述移动设备对应的中间模型,将所述中间模型的模型参数上报给所述模型管理设备;
其中,在每次循环中,所述将所述中间模型的模型参数上报给所述模型管理设备之后,还包括:
接收所述模型管理设备发送的综合模型参数;
使用所述综合模型参数更新所述本地模型。


8.根据权利要求7所述的方法,其特征在于,所述使用所述综合模型参数更新所述本地模型之后,还包括:
按照所述巡检路线在所述机房中行进时采集待识别数据,使用更新后的本地模型对所述待识别数据进行识别,以确定所述机房的健康状态。


9.一种巡检装置,其特征在于,所述装置包括:
收发模块,用于向各个移动设备发送模型训练指示;所述模型训练指示用于所述各个移动设备按照各自的巡检路线在机房中行进时采集训练数据,...

【专利技术属性】
技术研发人员:杨洁何东杰
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1