【技术实现步骤摘要】
动作确定方法、装置及其存储介质
[0001]本申请涉及通信
,尤其涉及一种动作确定方法、装置及其存储介质。
技术介绍
[0002]相关技术中,为保证铁路车辆运行的安全性,大都是通过运维人员每天进行长时间的排查和人工检修,或者是通过语音识别对轨道故障进行监测,但是无法对未来轨道故障进行提前预判,因此,如何预判轨道的后继状态并根据后继状态确定当前状态的执行动作成为当前亟待解决的技术问题。
技术实现思路
[0003]本申请提供一种动作确定方法、装置及其存储介质,能够预判轨道的后继状态并根据后继状态确定当前状态的执行动作。
[0004]为达到上述目的,本申请采用如下技术方案:
[0005]第一方面,本申请提供一种动作确定方法,该方法包括:获取待检测目标在第一预设时间段的第一故障状态;所述待检测目标包括多种故障状态;将所述第一故障状态输入至故障状态预测模型中,预测所述待检测目标在第二预设时间段的第二故障状态;基于强化学习方法确定从所述第一故障状态到每一所述故障状态时的每一执行动作的第一概率值;所述 ...
【技术保护点】
【技术特征摘要】
1.一种动作确定方法,其特征在于,包括:获取待检测目标在第一预设时间段的第一故障状态;所述待检测目标包括多种故障状态;将所述第一故障状态输入至故障状态预测模型中,预测所述待检测目标在第二预设时间段的第二故障状态;基于强化学习方法确定从所述第一故障状态到每一所述故障状态时的每一执行动作的第一概率值;所述第一概率值基于所述执行动作的收益值确定;基于所述第二故障状态,调整目标动作的第一概率值得到所述目标动作的第二概率值;所述目标动作为多个所述执行动作中收益值最大的执行动作;基于所述目标动作的第二概率值,确定在第一预设时间段的所述待检测目标执行的执行动作。2.根据权利要求1所述的方法,其特征在于,获取待检测目标在第一预设时间段的第一故障状态,包括:获取所述待检测目标在所述第一预设时间段的声音序列;基于所述声音序列,确定所述待检测目标在第一预设时间段的第一故障状态。3.根据权利要求2所述的方法,其特征在于,所述将所述第一故障状态输入至故障状态预测模型中,预测所述待检测目标在第二预设时间段的第二故障状态之前,还包括:步骤1、确定训练参数和测试参数;所述训练参数和所述测试参数为所述待检测目标在不同声音序列下的故障状态;步骤2、将所述训练参数输入当前训练模型中进行训练,得到第一训练模型;所述当前训练模型为初始训练模型,或者为前一次训练过程中的第一训练模型;步骤3、基于所述测试参数,测试所述第一训练模型的输出结果的准确度;步骤4、在所述第一训练模型的输出结果的准确度满足预设条件的情况下,确定所述第一训练模型为所述故障状态预测模型;步骤5、在所述第一训练模型的输出结果的准确度不满足所述预设条件的情况下,更新所述训练参数和所述测试参数,并重复执行所述步骤1、所述步骤2、所述步骤3、所述步骤4、以及步骤5,直至所述第一训练模型的输出结果的准确度满足预设条件。4.根据权利要求3所述的方法,其特征在于,所述测试参数包括输入测试参数和对比测试参数;所述基于所述测试参数,测试所述第一训练模型的输出结果的准确度,包括:将所述输入测试参数输入所述第一训练模型,获取所述第一训练模型的输出结果;对比所述输出结果与所述对比测试参数,确定所述第一训练模型的输出结果的准确度。5.根据权利要求1所述的方法,其特征在于,基于强化学习方法确定从所述第一故障状态到每一所述故障状态时的每一执行动作的第一概率值,包括:将所述第一故障状态、多个所述执行动作、以及所述多个故障状态进行任意组合,确定多个组合序列;每一个组合序列包括一个所述第一故障状态、一个所述执行动作、以及一个所述故障状态;基于强化学习方法对所述多个组合序列进行计算,确定每个组合序列中的执行动作的
收益值;根据所述每个组合序列中的执行动作的收益值,确定所述每一执行动作的第一概率值。6.根据权利要求5所述的方法,其特征在于,所述第二故障状态包括普通音频、故障音频、以及故障前音频;其中,所述普通音频对应工作操作、所述故障音频对应检修操作、以及所述故障前音频对应检修操作;基于所述第二故障状态,调整目标动作的第一概率值得到所述目标动作的第二概率值,包括:若所述第二故障状态为所述普通音频时,则增加所述目标动作为工作操作的概率值;若所述第二故障状态为所述故障前音频或所述故障音频时,则增加所述目标动作为检修操作的概率值。7.一种动作确定装置,其特征在于,包括:处理单元和获取单元;所述获取单元,用于获取待检测目标在第一预设时间段的第一故障状态;所述待检测目...
【专利技术属性】
技术研发人员:范凤霞,韩赛,王泽林,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。