优化装置及优化装置的控制方法制造方法及图纸

技术编号:24331941 阅读:82 留言:0更新日期:2020-05-29 20:02
涉及优化装置及优化装置的控制方法。优化装置包括:多搜索单元,每个包括:状态保持单元,保持包括在表示能量值的评估函数中的多个状态变量的值;能量计算单元,对响应多个状态变量的值之一的变化发生的每个状态转变计算能量值改变值来执行基态搜索;转换控制器,基于设定温度值、改变值和随机数值根据能量值改变值与热激发能量之间的相对关系随机确定是否接受多个状态转变之一;控制器,包括:温度调节单元,获取每搜索单元中温度值转变的温度统计信息;基于温度统计信息确定搜索单元设置的温度值;温度控制器,为搜索单元设置确定的温度值;交换控制器,在达预定次数能量值基态搜索或经预定时间后在搜索单元之间交换温度值或多个状态变量值。

Optimization device and control method of optimization device

【技术实现步骤摘要】
优化装置及优化装置的控制方法
本文讨论的实施方式涉及优化装置和优化装置的控制方法。
技术介绍
在当前社会中,在每个领域中都执行信息处理。使用算术设备例如计算机来执行信息处理,并且通过计算和处理各种数据以获得有意义的结果来执行预测、确定、控制等。信息处理的领域之一是被认为是重要领域的优化。例如,可能存在使执行某个处理所需的资源和成本最小化的优化问题,或者寻找使处理的效果最大化的解的优化问题。显然,这些问题非常重要。在优化问题中,已知的是被称作离散优化问题、组合优化问题等的大多数问题很难求解,因为变量采用离散值而不是连续值。使得难以求解离散优化问题的最大原因是,存在大量称为局部解的状态,每个局部解都不是最优解,而是在局部邻域中取最小值。由于没有有效求解离散优化问题的通解,因此有必要使用采用特定于该问题的属性的近似解方法或者不十分依赖该问题的属性的称作元启发式方法的方法。下文描述的内容涉及使用马尔可夫链蒙特卡洛方法(MarkovchainMonteCarlomethod)的解——该方法是元启发式方法,并且特别涉及称作交换蒙特卡洛方法(exchangeMonteCarlomethod)或者副本交换方法(replicaexchangemethod)的解——该方法从广义上讲是伪退火方法(pseudoannealingmethod)。伪退火方法是通过使用随机数随机地改变状态(可变矢量的值)来获得最优解的方法。使要优化的评估函数的值最小化的问题将作为示例在下面进行描述,并且将评估函数的值称为能量。对于最大化,可以更改评估函数的符号。在伪退火方法中,当使用与转变有关的温度和能量变化来如下确定状态转变的接受(许可)概率时,证明了状态在时间(迭代次数)无穷大的极限处达到最优解。[式1][式2]fmetro(x)=min(1,ex)(2)[式3]式(2)是Metropolis方法。式(3)是Gibbs方法。可以使用式(2)和式(3)中任何之一。此处,符号“T”是表示温度的参数,并且根据问题,该参数的初始值需要足够大,使得温度充分缓慢地降低。如上所述,在伪退火方法中,当迭代次数为无穷大时,可以获得最优解。然而,实际上,由于必须以有限次数的迭代获得解,因此可能无法可靠地获得最优解。另外,如上所述,由于温度降低非常缓慢,因此在有限时间内温度不能充分下降。因此,在实际的伪退火方法中,温度通常比理论上保证收敛的温度变化更快地降低。在实际的伪退火方法中,当满足结束确定条件时,例如当在从初始状态开始降低温度的同时重复上述迭代以达到一定迭代次数时,或者当能量变得低于预定值时,运算结束。输出响应是结束时的状态。然而,实际上,由于在有限次数的迭代中温度不会变为零,因此即使在结束时,状态占用概率(stateoccupationprobability)也具有由Boltzmann分布等表示的分布,并且因此,不能说获得了最优值或者好的解。因此,现实的解将保持到目前为止在迭代的中间获得的最低能量,并且在结束时输出该最低能量。根据以上说明可以在一定程度上想象,尽管伪退火方法是通用且吸引人的,但是必须缓慢地降低温度,并且伪退火方法中存在计算时间变得相对较长的问题。此外,还存在难以根据该问题适当地调整降低温度的方法的问题。当降低温度的方法太慢时,在有限时间内温度不会下降太多,并且最终热分布的能量范围变得较宽。结果,占用好的解的概率没有增加。相反,当温度下降太快时,由于在从局部解逃离之前温度降低并且变成陷入不良解中的状态,因此获得好的解的概率降低。副本交换方法是使用多个温度同时执行蒙特卡洛搜索(以下称为“随机搜索”)、以一定迭代次数比较状态能量,并以适当的概率对两个温度执行交换状态的操作的方法。图25是示出使用普通副本交换方法的优化装置的配置示例的图。与使用普通伪退火方法的优化装置不同,优化装置50包括多个副本(图25中的搜索单元51a1、51a2、…、51ai、…、51an)与交换控制器52。交换控制器52将温度信息(以下称作逆温度βi(T的倒数)(1≤i≤n))提供给搜索单元51a1至51an。图25示出了搜索单元51ai的示例。其他搜索单元具有相同的配置。搜索单元51ai包括:状态保持单元60、能量计算单元61以及转变控制器62。状态保持单元60保持评估函数中包括的多个状态变量的值。此外,状态保持单元60基于指示是否可以状态转变的标志f和由标志f指示的状态变量编号(索引)N来更新作为多个状态变量的值(可变矢量的值)的状态si。能量计算单元61对伴随状态变量的变化(状态转变)的能量变化进行计算。例如,当评估函数由两个状态变量之间的耦合表示的Ising模型表示并且一次仅允许一个状态变量转变时,能量计算单元61基于每个状态变量的值、指示状态变量之间的耦合强度的耦合系数、编号N和标志f来计算伴随多个状态变量的每个状态变量的变化(状态转变)的能量变化。能量变化ΔEij指示伴随第j个状态变量的变化的能量变化。此外,将根据要计算的优化问题的耦合系数的值预先存储在存储器、寄存器等中。当评估函数不是Ising模型并且当同时允许多个状态变量转变时,状态转变编号与变化的状态变量编号不必彼此匹配,但是需要对关于状态转变编号的能量变化进行适当地计算。可以使用逻辑电路例如乘积-求和运算电路来实现能量计算单元61。与普通伪退火方法类似,转变控制器62通过使用由交换控制器52分配的能量变化ΔEij和逆温度βi根据下式(4)确定第j个状态变量的状态转变的接受概率来执行随机搜索。[式4]p(ΔEij,βi)=f(-βiΔEij)(4)在式(4)中,函数f与式(1)中的函数相同,并且例如,将式(2)的Metropolis方法用作函数f。基于状态转变接受概率,转变控制器62输出指示状态是否可以转变的标志f和由标志f指示的状态转变编号。此外,转变控制器62基于能量变化ΔEij更新并输出能量Ei。交换控制器52在每个固定的迭代次数处观察每个搜索单元中的能量E,并且使用搜索单元51a1至51an中的两个搜索单元中的能量E和逆温度β来基于由下式(5)表示的交换概率交换两个搜索单元中的状态变量的值。代替状态变量的值,可以交换提供给两个搜索单元的逆温度。[式5]pij=f((βi-βj)(Ei-Ej))(5)在式(5)中,βi是赋予搜索单元51ai的逆温度,βj是赋予第j个搜索单元(未示出)的逆温度,Ei是搜索单元51ai中的能量,Ej是第j个搜索单元中的能量。在式(5)中,函数f与式(1)中的函数相同。例如,将式(2)的Metropolis方法用作函数f。即使当执行这样的交换时,每个温度状态的概率分布也收敛于该温度的Boltzmann(玻尔兹曼)分布。然后,与不执行交换的情况相比,收敛到该分布所需的弛豫时间可以明显缩短。选择要交换的两个搜索单元,使得所提供的温度接近(例如,选择那些提供邻近温度的两个搜索单本文档来自技高网...

【技术保护点】
1.一种优化装置,包括:/n多个搜索单元,每个搜索单元包括;/n状态保持单元,其用于保持包括在表示能量值的评估函数中的多个状态变量的值;/n能量计算单元,其用于通过针对响应于所述多个状态变量的值之一的变化而发生的多个状态转变中的每个状态转变计算所述能量值的改变值来执行基态搜索;以及/n转变控制器,其用于基于设定的温度值、所述改变值和随机数值,根据所述能量值的改变值与热激发能量之间的相对关系,随机地确定是否接受所述多个状态转变之一;以及/n控制器,其包括:/n温度调节单元,其用于:/n获取温度统计信息,所述温度统计信息是关于所述多个搜索单元中的每个搜索单元中的温度值的转变的统计信息;以及/n基于所获取的温度统计信息,确定要在所述多个搜索单元中的每个搜索单元中设置的温度值;/n温度控制器,其用于:/n为所述多个搜索单元中的每个搜索单元设置所确定的温度值;以及/n交换控制器,其用于:/n在达到预定重复次数的针对所述能量值的所述基态搜索之后或者经过预定时间之后,在所述多个搜索单元之间交换所述温度值或所述多个状态变量的值。/n

【技术特征摘要】
20181122 JP 2018-2190791.一种优化装置,包括:
多个搜索单元,每个搜索单元包括;
状态保持单元,其用于保持包括在表示能量值的评估函数中的多个状态变量的值;
能量计算单元,其用于通过针对响应于所述多个状态变量的值之一的变化而发生的多个状态转变中的每个状态转变计算所述能量值的改变值来执行基态搜索;以及
转变控制器,其用于基于设定的温度值、所述改变值和随机数值,根据所述能量值的改变值与热激发能量之间的相对关系,随机地确定是否接受所述多个状态转变之一;以及
控制器,其包括:
温度调节单元,其用于:
获取温度统计信息,所述温度统计信息是关于所述多个搜索单元中的每个搜索单元中的温度值的转变的统计信息;以及
基于所获取的温度统计信息,确定要在所述多个搜索单元中的每个搜索单元中设置的温度值;
温度控制器,其用于:
为所述多个搜索单元中的每个搜索单元设置所确定的温度值;以及
交换控制器,其用于:
在达到预定重复次数的针对所述能量值的所述基态搜索之后或者经过预定时间之后,在所述多个搜索单元之间交换所述温度值或所述多个状态变量的值。


2.根据权利要求1所述的优化装置,其中,
所述温度调节单元用于:
在所述多个搜索单元中的每个搜索单元中设置温度值,所述温度值与通过对在所获取的温度统计信息中每个温度值关于温度值转变而言的出现频率进行计数而获得的温度频率信息中出现频率的最大值相对应。


3.根据权利要求1所述的优化装置,其中,
所述温度调节单元用于:
在所述多个搜索单元中的每个搜索单元中设置温度值,所述温度值与通过将累积频率的最大值乘以温度累积频率信息中的预定系数获得的频率相对应,所述温度累积频率信息指示通过对所获取的温度统计信息中每个温度值关于温度值转变而言的出现频率进行累计而获得的累积频率。


4.根据权利要求3所述的优化装置,其中,所述预定系数是从外部输入的。


5.根据权利要求1至4中任一项所述的优化装置,其中,
所述转变控制器用于:
当随机地确定是否接受所述多个状态转变之一时,将预定的偏移值添加至所述能量值的改变值。


6.根据权利要求1至5中任一项所述的优化装置,其中,
所述温度调节单元用于:
根据所获取的温度统计信息,确定要在所述多个搜索单元中的每个搜索单元中设置的温度值的最高值;以及
基于所述最高值,确定...

【专利技术属性】
技术研发人员:小山纯平米冈昇渡部康弘高津求
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1