当前位置: 首页 > 专利查询>深圳大学专利>正文

温度系数的确定方法及装置制造方法及图纸

技术编号:18204861 阅读:79 留言:0更新日期:2018-06-13 06:35
一种温度系数的确定方法及装置,涉及数据处理领域,其中方法包括:建立温度系数的性能评价指标。确定使温度系数的性能评价指标满足预设的目标时,温度系数需要满足的条件关系,根据条件关系得到计算目标温度系数的计算公式。根据预设的初始温度系数和计算公式,得到目标温度系数。利用上述确定方法或装置确定的温度系数,可以使Softmax函数的数据转化效果达到预期目标。

【技术实现步骤摘要】
温度系数的确定方法及装置
本专利技术涉及数据处理领域,尤其涉及一种温度系数的确定方法及装置。
技术介绍
Softmax函数常被用于多分类模型的输出的计算。在增强学习中,可以利用Softmax函数将行动的奖赏转换为选取的概率。Softmax函数可以将任意的实数向量转化为相同维度的概率向量。温度系数是Softmax函数的重要参数,当温度系数过大时,概率向量中各元素的差异性被过分缩小,Softmax函数退化为均值函数;当温度系数过小时,概率向量中各元素的差异性被过分放大,Softmax函数退化最值函数,为因此选取合适的温度系数对于Softmax函数的数据转化效果至关重要。现有的确定温度系数的方法主要是试错法和经验法,这种方法普遍存在确定的温度系数不能使Softmax函数的数据转化效果达到预期目标的缺点。
技术实现思路
本专利技术提供了一种温度系数的确定方法及种装置,可以使确定的温度系数使Softmax函数的数据转化效果达到预期目标。本专利技术实施例提供了一种温度系数的确定方法,用于确定Softmax函数的温度系数,包括:建立所述温度系数的性能评价指标;确定使所述温度系数的性能评价指标满足预设的目标时,所述温度系数需要满足的条件关系,根据所述条件关系,得到计算目标温度系数的计算公式;根据初始温度系数和所述计算公式,得到所述目标温度系数。在本实施例中由于建立了温度系数的性能评价指标,并根据该性能评价指标得到了目标温度系数的计算公式,然后由预设的初始温度系数和该计算公式得到了可以达到预期目标的目标温度系数,故利用该确定方法确定的温度系数,可以使Softmax函数的数据转化效果达到预期目标。本专利技术实施例还提供了一种装置,用于确定Softmax函数的温度系数,包括:建立模块,用于建立所述温度系数的性能评价指标;处理模块,用于确定使所述温度系数的性能评价指标满足预设的目标时,所述温度系数需要满足的条件关系,根据所述条件关系,得到计算目标温度系数的计算公式;计算模块,用于初始温度系数和所述计算公式,得到所述目标温度系数。在本实施例中,由于建立模块建立了温度系数的性能评价指标,处理模块根据该性能评价指标得到了计算公式,然后计算模块由预设的初始温度系数和该计算公式得到了可以达到预期目标的目标温度系数,故利用该装置确定的温度系数,可以使Softmax函数的数据转化效果达到预期目标。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术第一实施例提供的温度系数的确定方法的流程示意图;图2为本专利技术第二实施例提供的温度系数的确定方法的流程示意图;图3为以1为初始温度系数时温度系数与迭代次数的关系图;图4为以1为初始温度系数时信息量变化指标的平方及信息量评价指标的平方与迭代次数的关系图;图5为以0.01为初始温度系数时温度系数与迭代次数的关系图;图6为以0.01为初始温度系数时信息量变化指标的平方及信息量评价指标的平方与迭代次数的关系图;图7为温度系数的性能评价指标与温度系数的关系图;图8为本专利技术第三实施例提供的装置的结构示意图;图9为本专利技术第四实施例提供的装置的结构示意图。具体实施方法为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例提供的附图,对本专利技术实施例提供的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而非全部实施例。基于本专利技术提供的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,图1为本专利技术第一实施例提供的温度系数的确定方法的流程示意图,如图1所示,该确定方法包括:S101、建立温度系数的性能评价指标。具体的,对于任意的K维原始向量其中,x1,x2,…,xK均为原始向量中的元素,且每个元素均为实数。利用Softmax函数将原始向量转化为概率向量p1,p2,…,pK均为概率向量的元素,其中:式(1)中k为原始向量和概率向量中元素的序号,每个概率向量中的元素与原始向量中的元素一一对应,T为Softmax函数的温度系数,温度系数T大于零,且由式(1)可以简单地推导出:温度系数T对利用Softmax函数将原始向量转化为概率向量的转化效果有重要影响,为了确定合适的温度系数T,根据将原始向量转化为概率向量的转化效果,建立温度系数T的性能评价指标。S102、确定使温度系数的性能评价指标满足预设的目标时,温度系数需要满足的条件关系,根据条件关系得到计算目标温度系数的计算公式。S103、根据初始温度系数和该计算公式,得到目标温度系数。具体的,将预设的初始温度系数带入该计算公式,求解出该目标温度系数。在本实施例中,由于建立了温度系数的性能评价指标,根据该性能评价指标得到了目标温度系数的计算公式,然后由预设的初始温度系数和该计算公式得到了可以达到预期目标的目标温度系数,故利用该确定方法确定的温度系数,可以使Softmax函数的数据转化效果达到预期目标。请参阅图2,图2为本专利技术第二实施例提供的温度系数的确定方法的流程示意图,如图2所示,该确定方法包括:S201、将原始向量进行标准化处理,得到等效向量。需要说明的是,为了避免原始向量中,各元素的数值大小对温度系数T的性能评价指标的影响,需要将原始向量进行标准化处理,得到等效向量其中z1,z2,…,zK均为等效向量中的元素,且:式(2)中zk为等效向量中的第k个元素,x1,x2,…,xK均为原始向量中的元素,xmin为原始向量的各元素中的最小值。由式(2)可以简单的推导出:S202、建立等效向量与概率向量的信息量变化评价指标。具体的,利用信息熵作为衡量信息量的指标,等效向量的信息熵为:利用Softmax函数将等效向量转化为概率向量p1,p2,…,pK均为概率向量的元素,其中:式(4)中k为等效向量和概率向量中元素的序号,每个概率向量中的元素与等效向量中的元素一一对应,T为Softmax函数的温度系数,温度系数T大于零,且由式(4)可以简单地推导出:概率向量的信息熵为:将式(4)带入式(5)中可得:为了便于计算,令:式(7)中,E为第一形式变量,F为第二形式变量,第一形式变量E和第二形式变量F均为关于温度系数T的函数,由于等效向量中元素zk均大于零,且温度系数T大于零,故第一形式变量E和第二形式变量F均大于零。将式(7)带入式(6)中,有:等效向量与概率向量的信息量变化评价指标为:该信息量变化评价指标体现了利用Softmax函数将等效向量转化为概率向量后,信息量的变化情况,信息量的变化量越小,说明将等效向量转化为概率向量后信息的丢失越少。S203、建立概率向量的信息量评价指标。具体的,利用信息熵作为衡量信息量的指标,概率向量的信息熵如式(8)所示。该信息量评价指标体现了概率向量中的信息量的多少,概率向量中的信息量越多,说明概率向量中的各元素之间的差异越大,但各元素之间的差异过大则表明Softmax函数退化为最值函数。S204、根据信息量变化评价指标和信息量评价指标建立温度系本文档来自技高网...
温度系数的确定方法及装置

【技术保护点】
一种温度系数的确定方法,用于确定Softmax函数的温度系数,其特征在于,包括:建立所述温度系数的性能评价指标;确定使所述温度系数的性能评价指标满足预设的目标时,所述温度系数需要满足的条件关系,根据所述条件关系,得到计算目标温度系数的计算公式;根据预设的初始温度系数和所述计算公式,得到所述目标温度系数。

【技术特征摘要】
1.一种温度系数的确定方法,用于确定Softmax函数的温度系数,其特征在于,包括:建立所述温度系数的性能评价指标;确定使所述温度系数的性能评价指标满足预设的目标时,所述温度系数需要满足的条件关系,根据所述条件关系,得到计算目标温度系数的计算公式;根据预设的初始温度系数和所述计算公式,得到所述目标温度系数。2.如权利要求1所述的确定方法,其特征在于,所述建立所述温度系数的性能评价指标包括:建立等效向量与概率向量的信息量变化评价指标;建立所述概率向量的信息量评价指标;根据所述信息量变化评价指标和所述信息量评价指标,建立所述温度系数的性能评价指标,所述信息量变化评价指标和所述信息量评价指标均为所述温度系数的性能评价指标的分量。3.如权利要求2所述的确定方法,其特征在于,所述信息量变化评价指标为:为所述等效向量的信息熵,为所述概率向量的信息熵;所述信息量评价指标为:所述温度系数的性能评价指标为:其中L(T)为所述温度系数的性能评价指标,λ为增强因子。4.如权利要求2所述的确定方法,其特征在于,在所述建立等效向量与概率向量的信息量变化评价指标之前,还包括:将原始向量进行标准化处理,得到所述等效向量。5.如权利要求3所述的确定方法,其特征在于,所述温度系数需要满足的条件关系为:其中T为所述温度系数,zk为所述等效向量中的元素;所述条件关系,经过进一步转化即可得到所述目标温度系数的计算公式:6.如权利要求5所述的确定方法,其特征在于,所述根据预设的初始温度系数和所述计算公式,得到所述目标温度系数包括:将所述计算公式转化为迭代公式;将预设的初始温度系数带入所述迭代公式中,得到下一代温度系数;将所述下一代温度系数带入所述迭代公式中,得到所述下一代温度系数的下一代温度系数;循环执行所述将所述下一代温度系数带入所述迭代公式中,得到所述下一代温度系数的下一代温度系数的步骤,直至第N+1代温度系数与第N代温度系数的差值的绝对值小于预设的停机阈值,所述第N代温度系数即为所述目标温度系...

【专利技术属性】
技术研发人员:何玉林
申请(专利权)人:深圳大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1