一种多量子业务转化及仿真调度方法、装置、设备及介质制造方法及图纸

技术编号：37153301 阅读：21 留言：0更新日期：2023-04-06 22:11

本发明专利技术提供了一种多量子业务转化及仿真调度的方法、装置、设备及可读介质，方法包括：通过云数据中心采集各个量子系统单元的数据，并基于采集到的数据构建量子业务系统模拟仿真环境；设计量子业务系统调度员决策模型；获取量子业务系统调度员执行决策的数据，并基于获取到的执行决策的数据在模拟仿真环境中训练量子业务系统调度员决策模型；使用训练后的量子业务系统调度员决策模型辅助量子业务系统调度员执行决策。通过使用本发明专利技术的方案，能够减少人为操作失误带来的影响，提升调度效率及准确度，能够降低微服务应用部署及管理的难度，能够实现对不同类型的量子业务的适配管理。本发明专利技术涉及计算机领域。本发明专利技术涉及计算机领域。本发明专利技术涉及计算机领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种多量子业务转化及仿真调度方法、装置、设备及介质

[0001]本专利技术涉及计算机领域，并且更具体地涉及一种多量子业务转化及仿真调度的方法、装置、设备及可读介质。

技术介绍

[0002]近年来，强化学习技术受到了大家的广泛关注，特别是与深度学习结合，给人工智能领域带来了很大的进展。强化学习不同于传统的监督学习，主要表现在强化信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价（通常为标量信号），而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。强化学习通过智能体与环境之间交互的任务，不断地学习在不同的环境下做出最优的动作，利用这些感知生成策略，因而可以创造更高的机器智能。强化学习在机器人控制、自动驾驶、推荐系统领域等都得到了应用，在很多领域都超越了人类表现。
[0003]大型量子业务系统集群调度是由许多量子计算参与节点提供算力和经典计算的结合，是一个复杂的大型集群系统。随着量子计算的发展，对量子系统集群会有更高要求，通过各类传感器收集来自各计算节点的数据，通过数据分析来更好的了解参与大型量子系统的参与者的状态，能够提前发现问题并能及时响应处理量子系统出现的异常故障以及减少调度人员人为操作失误，如何有效的利用强化学习技术通过对大型量子业务系统集群的模拟仿真来模拟真实环境，形成大型量子业务系统集群调度员的准确高效的调度策略，避免调度失误造成不良后果成为待解决的问题。

技术实现思路

[0004]有鉴于此，本专利技术实施例的...

【技术保护点】

【技术特征摘要】
1.一种多量子业务转化及仿真调度的方法，其特征在于，包括以下步骤：通过云数据中心采集各个量子系统单元的数据，并基于采集到的数据构建量子业务系统模拟仿真环境；设计量子业务系统调度员决策模型；获取量子业务系统调度员执行决策的数据，并基于获取到的执行决策的数据在模拟仿真环境中训练量子业务系统调度员决策模型；使用训练后的量子业务系统调度员决策模型辅助量子业务系统调度员执行决策。2.根据权利要求1所述的方法，其特征在于，通过云数据中心采集各个量子系统单元的数据，并基于采集到的数据构建量子业务系统模拟仿真环境包括：采集各个量子系统单元运行的数据，其中，运行的数据包括各个量子系统单元的实时状态数据、运行日志、调度计划、故障数据以及调度员调度执行的数据；基于采集的数据并利用数字孪生技术构建量子业务系统模拟仿真环境。3.根据权利要求1所述的方法，其特征在于，获取量子业务系统调度员执行决策的数据，并基于获取到的执行决策的数据在模拟仿真环境中训练量子业务系统调度员决策模型包括：获取量子业务系统调度员执行决策的数据；根据量子业务系统调度员的实际操作，并结合量子业务系统的状态环境构建量子业务系统调度员调度操作指令执行序列；根据当前量子业务系统计划、各个量子系统单元运行状态以及事故异常实践情况在模拟仿真环境中确定下一步执行调度操作；根据量子业务系统调度员的调度操作以及实际执行效果，结合在模拟仿真环境中确定的调度操作设定量子业务系统模拟仿真环境的奖励函数；基于奖励函数并采用A3C算法训练量子业务系统调度员决策模型。4.根据权利要求3所述的方法，其特征在于，基于奖励函数并采用A3C算法训练量子业务系统调度员决策模型包括：设定worker线程数量、全局共享迭代次数、全局最大迭代次数、状态特征维度及操作指令集的全局参数，设定全局模型公共神经网络，设置模拟仿真环境初始化状态；初始化量子业务系统调度员决策模型；使每个worker线程采用全局模型公共神经网络独立与模拟仿真环境进行交互，执行调度操作获得反馈后更新本地全局模型公共神经网络的梯度，更新全局模型公共神经网络的模型参数；循环执行上一个步骤直至量子业务系统调度员决策模型收敛。5.根据权利要求4所述的方法，其特征在于，全局模型公共神经网络包括Actor网络和Critic 网络。6.根据权利要求1所述的方法，其特征在于，使用训练后的量子业务系统调度员决策模型辅助量子业务系统调度员执行决策包括：实时采集当前量子业务系统的实际运行数据，并实时更新到模拟仿真环境中；使用训练后的量子业务系统调度员决策模型根据当前实际状况输出下一步调度操作；记录当前模拟仿真环境状态和量子业务系统调度员决策模型输出的下一步调度操作，
并反馈更新模拟仿真环境；设定时间段，重复执行上述步骤以形成量子业务系统调度员推荐操作序列，使用推荐操作序列辅助量子业务系统调度员执行决策。7.根据权利要求6所述的方法，其特征在于，使用推荐操作序列辅助量子业务系统调度员执行决策包括：量子业务系统调度员参考推荐操作序列并结合实际状况进行调度操作；调度操作后获取实际操作结果，并更新当前量子业务系统的实际运行数据，并实时更新到模拟仿真环境中。8.根据权利要求1所述的方法，其特征在于，还包括：根据每一位量子业务系统调度员的实际操作优化量子业务系统调度员决策模型。9.根据权利要求8所述的方法，其特征在于，根据每一位量子业务系统调度员的实际操作优化量子业务系统调度员决...

【专利技术属性】
技术研发人员：薛长青，刘强，刘幼航，于洪真，李彦祯，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人