一种处置方案生成方法、装置、设备及介质制造方法及图纸

技术编号:46125501 阅读:11 留言:0更新日期:2025-08-15 19:58
本发明专利技术公开了一种处置方案生成方法、装置、设备及介质,涉及方案生成技术领域,该方法结合使用随机森林和PPO算法的主要优势在于两者各自的特点和互补性。系统既能处理规则明确的简单情况,又能应对动态复杂的环境,提高系统的鲁棒性和可靠性,在简单规则无法涵盖的情况下,PPO算法可以综合考虑多种因素,提供更加精细和个性化的撤离方案。通过结合随机森林和PPO算法,系统能够更好地应对复杂的决策场景,提高决策的准确性和可靠性,为应对各种复杂情况提供了更加稳健的解决方案。后期随着使用,强化学习可以往认为好的方向不停的生成方案,用的越多,更容易生成符合用户偏好的方案。省去了生成之后用户再调整的过程。

【技术实现步骤摘要】

本专利技术涉及方案生成,特别是涉及一种基于随机森林与强化学习的处置方案生成方法、装置、设备及介质


技术介绍

1、随着社会的发展、科技的进步,用户对新技术应用要求也越来越高。核、生、化相关技术的应用在人类解决能源危机等领域发挥着越来越重的作用。然而,核、生、化危害事故给人类带来的灾害已在全球突发灾害中占有相当比重,有毒、有害气体、放射性沾染等,给人类生存环境带来严重威胁,同时也威胁到人类自身的生命安全。

2、可见,在核、生、化相关技术应用场景下,为了可以在发生突发安全事故后,保障人类以及财产安全,需要相关部门的决策者可以随时制定相关的应急处置方案。

3、传统的应急处置方案的设置,往往采用专家根据先验知识进行制定,这种方式虽然可以获得应急处置方案,但是这种方式存在诸多缺点。例如,完全依靠专家根据先验知识建立应急处置方案的过程中,需要进行大量的数据计算,为决策者带来了非常大的劳动强度。同时,采用人工规划应急方案的方式,需要耗费大量的时间,当发生紧急情况时,不能够快速生成最优的处置方案。

4、因此,如何提供一种处置方案生成方法本文档来自技高网...

【技术保护点】

1.一种处置方案生成方法,其特征在于,包括:

2.根据权利要求1所述的处置方案生成方法,其特征在于,所述强化学习算法的数据处理流程包括:

3.根据权利要求1所述的处置方案生成方法,其特征在于,所述强化学习算法的目标包括最大化以下目标函数LCLIP(θ):

4.根据权利要求1所述的处置方案生成方法,其特征在于,采用任务理解与生成模型获取预设的当前事件的特征向量。

5.根据权利要求4所述的处置方案生成方法,其特征在于,所述任务理解与生成模型用于收集、整理和分析与处置相关的信息和数据,并收集来自各种传感器、监测设备、人员报告数据,进行数据清洗、整...

【技术特征摘要】

1.一种处置方案生成方法,其特征在于,包括:

2.根据权利要求1所述的处置方案生成方法,其特征在于,所述强化学习算法的数据处理流程包括:

3.根据权利要求1所述的处置方案生成方法,其特征在于,所述强化学习算法的目标包括最大化以下目标函数lclip(θ):

4.根据权利要求1所述的处置方案生成方法,其特征在于,采用任务理解与生成模型获取预设的当前事件的特征向量。

5.根据权利要求4所述的处置方案生成方法,其特征在于,所述任务理解与生成模型用于收集、整理和分析与处置相关的信息和数据,并收集来自各种传感器、监测设备、人员报告数据,进行数据清洗、整合和分析形成态势分析结果。

...

【专利技术属性】
技术研发人员:谢勇梁杰韩强侯鑫叶镕溪周文牛德青雷珂
申请(专利权)人:中国兵器装备集团自动化研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1