一种多量子业务转化及仿真调度方法、装置、设备及介质制造方法及图纸

技术编号:37153301 阅读:21 留言:0更新日期:2023-04-06 22:11
本发明专利技术提供了一种多量子业务转化及仿真调度的方法、装置、设备及可读介质,方法包括:通过云数据中心采集各个量子系统单元的数据,并基于采集到的数据构建量子业务系统模拟仿真环境;设计量子业务系统调度员决策模型;获取量子业务系统调度员执行决策的数据,并基于获取到的执行决策的数据在模拟仿真环境中训练量子业务系统调度员决策模型;使用训练后的量子业务系统调度员决策模型辅助量子业务系统调度员执行决策。通过使用本发明专利技术的方案,能够减少人为操作失误带来的影响,提升调度效率及准确度,能够降低微服务应用部署及管理的难度,能够实现对不同类型的量子业务的适配管理。本发明专利技术涉及计算机领域。本发明专利技术涉及计算机领域。本发明专利技术涉及计算机领域。

【技术实现步骤摘要】
一种多量子业务转化及仿真调度方法、装置、设备及介质


[0001]本专利技术涉及计算机领域,并且更具体地涉及一种多量子业务转化及仿真调度的方法、装置、设备及可读介质。

技术介绍

[0002]近年来,强化学习技术受到了大家的广泛关注,特别是与深度学习结合,给人工智能领域带来了很大的进展。强化学习不同于传统的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。强化学习通过智能体与环境之间交互的任务,不断地学习在不同的环境下做出最优的动作,利用这些感知生成策略,因而可以创造更高的机器智能。强化学习在机器人控制、自动驾驶、推荐系统领域等都得到了应用,在很多领域都超越了人类表现。
[0003]大型量子业务系统集群调度是由许多量子计算参与节点提供算力和经典计算的结合,是一个复杂的大型集群系统。随着量子计算的发展,对量子系统集群会有更高要求,通过各类传感器收集来自各计算节点的数据,通过数据分析来更好的了解参与大型量子系统的参与者的状态,能够提前发现问题并能及时响应处理量子系统出现的异常故障以及减少调度人员人为操作失误,如何有效的利用强化学习技术通过对大型量子业务系统集群的模拟仿真来模拟真实环境,形成大型量子业务系统集群调度员的准确高效的调度策略,避免调度失误造成不良后果成为待解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术实施例的目的在于提出一种多量子业务转化及仿真调度的方法、装置、设备及可读介质,通过使用本专利技术的技术方案,能够减少人为操作失误带来的影响,提升调度效率及准确度,能够降低微服务应用部署及管理的难度,能够实现对不同类型的量子业务的适配管理。
[0005]基于上述目的,本专利技术的实施例的一个方面提供了一种多量子业务转化及仿真调度的方法,包括以下步骤:通过云数据中心采集各个量子系统单元的数据,并基于采集到的数据构建量子业务系统模拟仿真环境;设计量子业务系统调度员决策模型;获取量子业务系统调度员执行决策的数据,并基于获取到的执行决策的数据在模拟仿真环境中训练量子业务系统调度员决策模型;使用训练后的量子业务系统调度员决策模型辅助量子业务系统调度员执行决策。
[0006]根据本专利技术的一个实施例,通过云数据中心采集各个量子系统单元的数据,并基于采集到的数据构建量子业务系统模拟仿真环境包括:采集各个量子系统单元运行的数据,其中,运行的数据包括各个量子系统单元的
实时状态数据、运行日志、调度计划、故障数据以及调度员调度执行的数据;基于采集的数据并利用数字孪生技术构建量子业务系统模拟仿真环境。
[0007]根据本专利技术的一个实施例,获取量子业务系统调度员执行决策的数据,并基于获取到的执行决策的数据在模拟仿真环境中训练量子业务系统调度员决策模型包括:获取量子业务系统调度员执行决策的数据;根据量子业务系统调度员的实际操作,并结合量子业务系统的状态环境构建量子业务系统调度员调度操作指令执行序列;根据当前量子业务系统计划、各个量子系统单元运行状态以及事故异常实践情况在模拟仿真环境中确定下一步执行调度操作;根据量子业务系统调度员的调度操作以及实际执行效果,结合在模拟仿真环境中确定的调度操作设定量子业务系统模拟仿真环境的奖励函数;基于奖励函数并采用A3C算法训练量子业务系统调度员决策模型。
[0008]根据本专利技术的一个实施例,基于奖励函数并采用A3C算法训练量子业务系统调度员决策模型包括:设定worker线程数量、全局共享迭代次数、全局最大迭代次数、状态特征维度及操作指令集的全局参数,设定全局模型公共神经网络,设置模拟仿真环境初始化状态;初始化量子业务系统调度员决策模型;使每个worker线程采用全局模型公共神经网络独立与模拟仿真环境进行交互,执行调度操作获得反馈后更新本地全局模型公共神经网络的梯度,更新全局模型公共神经网络的模型参数;循环执行上一个步骤直至量子业务系统调度员决策模型收敛。
[0009]根据本专利技术的一个实施例,全局模型公共神经网络包括Actor网络和Critic 网络。
[0010]根据本专利技术的一个实施例,使用训练后的量子业务系统调度员决策模型辅助量子业务系统调度员执行决策包括:实时采集当前量子业务系统的实际运行数据,并实时更新到模拟仿真环境中;使用训练后的量子业务系统调度员决策模型根据当前实际状况输出下一步调度操作;记录当前模拟仿真环境状态和量子业务系统调度员决策模型输出的下一步调度操作,并反馈更新模拟仿真环境;设定时间段,重复执行上述步骤以形成量子业务系统调度员推荐操作序列,使用推荐操作序列辅助量子业务系统调度员执行决策。
[0011]根据本专利技术的一个实施例,使用推荐操作序列辅助量子业务系统调度员执行决策包括:量子业务系统调度员参考推荐操作序列并结合实际状况进行调度操作;调度操作后获取实际操作结果,并更新当前量子业务系统的实际运行数据,并实时更新到模拟仿真环境中。
[0012]根据本专利技术的一个实施例,还包括:根据每一位量子业务系统调度员的实际操作优化量子业务系统调度员决策模型。
[0013]根据本专利技术的一个实施例,根据每一位量子业务系统调度员的实际操作优化量子业务系统调度员决策模型包括:获取每一位量子业务系统调度员的实际操作的数据;在模拟仿真环境中使用实际操作的数据训练量子业务系统调度员决策模型;使用量子业务系统调度员决策模型在模拟仿真环境中模拟量子业务系统运行和调度;将量子业务系统调度员决策模型的调度结果与最佳调度指令进行对比;根据对比结果优化量子业务系统调度员决策模型的调度策略。
[0014]根据本专利技术的一个实施例,还包括:将量子业务系统调度员决策模型的调度操作与最佳调度指令进行对比;根据对比结果优化量子业务系统调度员决策模型的调度策略。
[0015]根据本专利技术的一个实施例,通过云数据中心采集各个量子系统单元的数据包括:通过云数据中心采集超导量子系统、核自旋量子系统、光学腔量子系统和离子井量子系统的数据。
[0016]根据本专利技术的一个实施例,云数据中心是由各个量子系统单元的实际量子业务系统通过量子业务适配器转换为云中心能处理的业务。
[0017]根据本专利技术的一个实施例,还包括:在云数据中心中创建微服务,以将不同的量子业务处理类封装在云数据中心适配接口中。
[0018]根据本专利技术的一个实施例,在云数据中心中创建微服务包括:获取微服务创建请求,其中微服务创建请求中包括创建信息和目标量子业务;根据处理类和量子业务的对应关系查找目标量子业务对应的目标处理类;利用目标处理类对创建信息进行部署以在目标量子业务上建立微服务的实例。
[0019]根据本专利技术的一个实施例,还包括:响应于接收到用户在云数据中心中输入的微服务创建请求,获取创建请求的创建信息和目标量子业务;基于目标量子业务在云数据中心中调用相应的处理类建立微服务的实例。
[0020]根据本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多量子业务转化及仿真调度的方法,其特征在于,包括以下步骤:通过云数据中心采集各个量子系统单元的数据,并基于采集到的数据构建量子业务系统模拟仿真环境;设计量子业务系统调度员决策模型;获取量子业务系统调度员执行决策的数据,并基于获取到的执行决策的数据在模拟仿真环境中训练量子业务系统调度员决策模型;使用训练后的量子业务系统调度员决策模型辅助量子业务系统调度员执行决策。2.根据权利要求1所述的方法,其特征在于,通过云数据中心采集各个量子系统单元的数据,并基于采集到的数据构建量子业务系统模拟仿真环境包括:采集各个量子系统单元运行的数据,其中,运行的数据包括各个量子系统单元的实时状态数据、运行日志、调度计划、故障数据以及调度员调度执行的数据;基于采集的数据并利用数字孪生技术构建量子业务系统模拟仿真环境。3.根据权利要求1所述的方法,其特征在于,获取量子业务系统调度员执行决策的数据,并基于获取到的执行决策的数据在模拟仿真环境中训练量子业务系统调度员决策模型包括:获取量子业务系统调度员执行决策的数据;根据量子业务系统调度员的实际操作,并结合量子业务系统的状态环境构建量子业务系统调度员调度操作指令执行序列;根据当前量子业务系统计划、各个量子系统单元运行状态以及事故异常实践情况在模拟仿真环境中确定下一步执行调度操作;根据量子业务系统调度员的调度操作以及实际执行效果,结合在模拟仿真环境中确定的调度操作设定量子业务系统模拟仿真环境的奖励函数;基于奖励函数并采用A3C算法训练量子业务系统调度员决策模型。4.根据权利要求3所述的方法,其特征在于,基于奖励函数并采用A3C算法训练量子业务系统调度员决策模型包括:设定worker线程数量、全局共享迭代次数、全局最大迭代次数、状态特征维度及操作指令集的全局参数,设定全局模型公共神经网络,设置模拟仿真环境初始化状态;初始化量子业务系统调度员决策模型;使每个worker线程采用全局模型公共神经网络独立与模拟仿真环境进行交互,执行调度操作获得反馈后更新本地全局模型公共神经网络的梯度,更新全局模型公共神经网络的模型参数;循环执行上一个步骤直至量子业务系统调度员决策模型收敛。5.根据权利要求4所述的方法,其特征在于,全局模型公共神经网络包括Actor网络和Critic 网络。6.根据权利要求1所述的方法,其特征在于,使用训练后的量子业务系统调度员决策模型辅助量子业务系统调度员执行决策包括:实时采集当前量子业务系统的实际运行数据,并实时更新到模拟仿真环境中;使用训练后的量子业务系统调度员决策模型根据当前实际状况输出下一步调度操作;记录当前模拟仿真环境状态和量子业务系统调度员决策模型输出的下一步调度操作,
并反馈更新模拟仿真环境;设定时间段,重复执行上述步骤以形成量子业务系统调度员推荐操作序列,使用推荐操作序列辅助量子业务系统调度员执行决策。7.根据权利要求6所述的方法,其特征在于,使用推荐操作序列辅助量子业务系统调度员执行决策包括:量子业务系统调度员参考推荐操作序列并结合实际状况进行调度操作;调度操作后获取实际操作结果,并更新当前量子业务系统的实际运行数据,并实时更新到模拟仿真环境中。8.根据权利要求1所述的方法,其特征在于,还包括:根据每一位量子业务系统调度员的实际操作优化量子业务系统调度员决策模型。9.根据权利要求8所述的方法,其特征在于,根据每一位量子业务系统调度员的实际操作优化量子业务系统调度员决...

【专利技术属性】
技术研发人员:薛长青刘强刘幼航于洪真李彦祯
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1