绝热演化路径的预测方法、装置、设备及存储介质制造方法及图纸

技术编号:28051407 阅读:38 留言:0更新日期:2021-04-14 13:13
本申请提供了一种绝热演化路径的预测方法、装置、设备及存储介质,涉及人工智能领域。所述方法包括:获取量子计算问题的目标哈密顿量H1;根据所述目标哈密顿量H1,确定初始哈密顿量H0和目标基态能量E1;将搜索所述初始哈密顿量H0至所述目标基态能量E1的绝热演化路径转化为棋盘博弈;采用结合神经网络的蒙特卡洛树搜索,求解出所述棋盘博弈的最优棋盘路径;根据所述最优棋盘路径输出所述绝热演化路径。针对移动端的三维人脸网格的重建,本申请在绝热演化路径中的每个状态的候选行为较多时,仍然能够快速和高效地求解出稳定收敛的绝热演化路径。化路径。化路径。

【技术实现步骤摘要】
绝热演化路径的预测方法、装置、设备及存储介质


[0001]本申请实施例涉及人工智能的机器学习领域,特别涉及一种绝热演化路径的预测方法、装置、设备及存储介质。

技术介绍

[0002]绝热量子计算是实现量子计算机的一种理论模型。绝热量子计算是把一个计算问题转换成一个物理过程,其原本问题的答案会映射到一个目标哈密顿量的基态。
[0003]绝热量子计算的计算过程是从易制备基态的初始哈密顿量(H0)出发,绝热演化到目标哈密顿量(H1),该演化过程也称为绝热演化路径。如果整个绝热演化过程的时间T足够长(演化足够缓慢),则量子计算机所制备的量子态会一直保持在瞬时哈密顿量的基态。相关技术中,采用增强学习中的Q-learning寻找最优的绝热演化路径。
[0004]当绝热演化路径中的一个系统状态演化到下一个系统状态的可选行为(action)变多时,Q-learning的效率会很差,收敛性也容易不稳定。

技术实现思路

[0005]本申请实施例提供了一种绝热演化路径的预测方法、装置、设备及存储介质,能够提升预测最优的绝热演化路径时的效本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种绝热演化路径的预测方法,其特征在于,所述方法包括:获取量子计算问题的目标哈密顿量H1;根据所述目标哈密顿量H1,确定初始哈密顿量H0和目标基态能量E1;将搜索所述初始哈密顿量H0至所述目标基态能量E1的绝热演化路径转化为棋盘博弈;采用结合神经网络的蒙特卡洛树搜索,求解出所述棋盘博弈的最优棋盘路径;根据所述最优棋盘路径输出所述绝热演化路径。2.根据权利要求1所述的方法,其特征在于,所述采用结合有神经网络的蒙特卡洛树搜索,求解出所述棋盘博弈的最优棋盘路径,包括:采用结合所述神经网络的所述蒙特卡洛树搜索,搜索出所述棋盘博弈的预测棋盘路径;根据所述预测棋盘路径得到预测绝热演化路径;根据量子计算环境计算得到所述预测绝热演化路径在演化至末态时的能量本征值E;响应于所述能量本征值E未达到胜利条件,根据本次预测过程对所述神经网络中的参数进行更新,并在更新后再次执行所述采用结合所述神经网络的所述蒙特卡洛树搜索,预测出所述棋盘博弈的预测棋盘路径的步骤;响应于所述能量本征值E达到所述胜利条件,将所述预测棋盘路径确定为所述棋盘博弈的最优棋盘路径;其中,所述胜利条件是所述能量本征值E与所述目标基态能量E1之间的差值小于阈值。3.根据权利要求2所述的方法,其特征在于,所述神经网络包括:策略网络和价值网络;所述采用结合所述神经网络的所述蒙特卡洛树搜索,搜索出所述棋盘博弈的预测棋盘路径,包括:在所述棋盘博弈对应的博弈树中,采用所述蒙特卡洛树搜索进行搜索,输出每层节点的行为概率分布π;所述每层节点的行为概率分布π代表下一手棋子的候选落子位置以及概率分布;根据每层节点下的所述行为概率分布π最高的目标落子位置,得到所述棋盘博弈的预测棋盘路径;所述响应于所述能量本征值E未达到胜利条件,根据本次预测过程对所述神经网络中的参数进行更新,包括:响应于所述能量本征值E未达到所述胜利条件,将所述预测棋盘路径中作为所述神经网络的输入,获取所述策略网络输出的策略向量p和所述价值网络输出的价值收益v;以最大化所述策略向量p和所述行为概率分布π之间的相似性,且最小化所述价值收益v和未取得胜利的奖励值z之间的误差为目标,对所述神经网络中的参数进行更新。4.根据权利要求3所述的方法,其特征在于,所述在所述棋盘博弈对应的博弈树中,采用所述蒙特卡洛树搜索进行搜索,输出每层节点的行为概率分布π,包括:在所述棋盘博弈的第i层目标节点b
i
下,使用所述策略网络输出第i+1层节点b
i+1
的候选落子位置a
i+1
以及落子概率p
i+1
,所述第i层目标节点bi对应第i层节点的目标落子位置,i为不大于m-1的整数;根据所述候选落子位置a
i+1
扩展所述第i+1层节点b
i+1
,采用所述价值网络对所述第i+1层节点b
i+1
进行评估,得到每个所述候选落子位置a
i+1
的价值收益v
i+1

根据所述落子概率p
i+1
、所述价值收益v
i+1
,结合置信上限U来确定出所述第i+1层节点b
i+1
中的目标节点;当所述第i+1层节点不是第m层节点时,以所述第i+1层目标节点作为新的第i层目标节点,再次执行上述三个步骤;当所述第i+1层节点是第m层节点时,输出所述每层节点的行为概率分布π。5.根据权利要求4所述的方法,其特征在于,所述置信上限与所述候选落子位置的历史搜索次数有关。6.根据权利要求1至5任一所述的方法,其特征在于,所述将搜索所述初始哈密顿量H0至所述目标基态能量E1的绝热演化路径转化为棋盘博弈,包括:将所述初始哈密顿量H0至所述目标基态能量E1的绝热演化路径表达为绝热演化函数s(t);采用傅里叶变换将所述绝热演化函数s(t)变换为频域的状态向量序列b,所述状态向量序列b包括m个向量维度,每个向量维度的取值范围为2L;根据所述向量维度的维数m和所述每个向量维度的取值范围2L,转换得到棋盘博弈;所述棋盘博弈包括2L/

行和m列,每一列对应一个棋子的落子位置,

为离散化步长。7.一种绝热演化路径的预测装置,其特征在于,所述装置包括:获取模块,用于获取量子计算问题的目标哈密顿量H1;确定模块,用于根据所述目标哈密顿量H1,确定初始哈密顿量...

【专利技术属性】
技术研发人员:陈玉琴谢昌谕陈宇张胜誉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1