System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 自适应调参的方法、装置、计算机设备及存储介质制造方法及图纸_技高网

自适应调参的方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40473407 阅读:6 留言:0更新日期:2024-02-26 19:10
本发明专利技术涉及参数配置技术领域,公开了自适应调参的方法、装置、计算机设备及存储介质,该方法包括:确定需要配置的至少一个待定参数;为待定参数进行赋值,形成相应的配置状态;不同配置状态的至少一个待定参数的数值不同;基于强化学习逐步更新得到奖励值符合要求的配置状态,直至确定符合功能需求和安全需求的目标配置状态;奖励值为结合功能需求影响程度和安全需求影响程度所确定的值;将目标配置状态作为待定参数的推荐配置。本发明专利技术将不同数值的待定参数作为相应的配置状态,可以基于强化学习逐步更新配置状态,最终确定符合功能需求和安全需求的目标配置状态。这种配置方式能够降低设计者个人经验的影响,配置参数具有较高的可靠性。

【技术实现步骤摘要】

本专利技术涉及参数配置,具体涉及自适应调参的方法、装置、计算机设备及存储介质


技术介绍

1、在设计系统或产品时,往往需要选择或配置各种各样的参变量,而在这个过程中,出现了两个存在矛盾但是需要兼顾的点:功能需求和安全性。其中,安全性的提高往往伴随着用户体验降低,即功能需求降低;而功能需求的提升也会不可避免地导致部分安全性的损失。如何平衡二者,是困扰各个产品设计和研发工程师的长期问题。

2、目前,主要依赖于设计师的个人经验,预估并配置相应的参数。这种设计方式一般只能把控系统设计的大方向,而对于参数的选择可能已经严重的偏离了实际情况,故传统的纯靠预估和经验的设计存在很高的偏差可能性。


技术实现思路

1、有鉴于此,本专利技术提供了一种自适应调参的方法、装置、计算机设备及存储介质,以解决现有配置参数偏差较大的问题。

2、第一方面,本专利技术提供了一种自适应调参的方法,包括:确定需要配置的至少一个待定参数;为所述待定参数进行赋值,形成相应的配置状态;不同配置状态的至少一个所述待定参数的数值不同;基于强化学习逐步更新得到奖励值符合要求的配置状态,直至确定符合功能需求和安全需求的目标配置状态;所述奖励值为结合功能需求影响程度和安全需求影响程度所确定的值;将所述目标配置状态作为所述待定参数的推荐配置。

3、本专利技术将不同数值的待定参数作为相应的配置状态,并确定配置状态下的功能需求影响程度和安全需求影响程度,基于此确定每个配置状态对应的奖励值,从而可以基于强化学习逐步更新配置状态,最终确定符合功能需求和安全需求的目标配置状态,实现对待定参数的自适应配置。这种配置方式不依赖于设计者的主观判断,能够降低设计者个人经验的影响,所确定的参数可以兼顾产品本身的安全需求和用户使用的功能需求,配置参数具有较高的可靠性。

4、在一些可选的实施方式中,所述基于强化学习逐步更新得到奖励值符合要求的配置状态,直至确定符合功能需求和安全需求的目标配置状态,包括:循环执行更新配置状态的操作,直至更新后的配置状态符合功能需求和安全需求;所述更新配置状态的操作包括:调整当前配置状态中至少一个待定参数的数值,形成多个不同的待定配置状态;确定每个所述待定配置状态的奖励值;根据所述待定配置状态的奖励值,选取其中一个待定配置状态更新为下一配置状态。

5、本专利技术在当前配置状态的基础上确定多个待定配置状态,并从中选取出合适的下一配置状态,实现更新配置状态,且可以使得更新后的配置状态更容易符合功能需求和安全需求。

6、在一些可选的实施方式中,所述调整当前配置状态中至少一个待定参数的数值,形成多个不同的待定配置状态,包括:对于每一个待定参数,分别对当前配置状态中一个待定参数的数值进行调整,形成多个不同的待定配置状态。

7、在一些可选的实施方式中,所述分别对当前配置状态中一个待定参数的数值进行调整,形成多个不同的待定配置状态,包括:在当前配置状态中待定参数数值的基础上,按照预设步长增大或减小所述当前配置状态中一个待定参数的数值,形成多个不同的待定配置状态。

8、在一些可选的实施方式中,该方法还包括:预先生成行为模拟脚本;所述确定每个所述待定配置状态的奖励值,包括:根据所述行为模拟脚本模拟在所述待定配置状态下的行为,确定与功能需求相关的用户成本以及与安全需求相关的攻击成本;根据所述待定配置状态的用户成本确定功能需求影响程度,根据所述待定配置状态的攻击成本确定安全需求影响程度;结合所述待定配置状态的功能需求影响程度和安全需求影响程度,确定相应的奖励值。

9、在一些可选的实施方式中,所述根据所述待定配置状态的用户成本确定功能需求影响程度,根据所述待定配置状态的攻击成本确定安全需求影响程度,包括:确定所述待定配置状态的用户成本与所述当前配置状态的用户成本之间的第一变化量;确定所述待定配置状态的攻击成本与所述当前配置状态的攻击成本之间的第二变化量;根据所述第一变化量确定所述待定配置状态的功能需求影响程度,根据所述第二变化量确定所述待定配置状态的安全需求影响程度。

10、在一些可选的实施方式中,所述确定所述待定配置状态的用户成本与所述当前配置状态的用户成本之间的第一变化量,包括:确定所述待定配置状态的用户成本与所述当前配置状态的用户成本之间的第一差值;对所述第一差值进行归一化处理,生成第一变化量;所述确定所述待定配置状态的攻击成本与所述当前配置状态的攻击成本之间的第二变化量,包括:确定所述待定配置状态的攻击成本与所述当前配置状态的攻击成本之间的第二差值;对所述第二差值进行归一化处理,生成第二变化量。

11、在一些可选的实施方式中,所述对所述第一差值进行归一化处理,生成第一变化量,包括:将所述第一差值与所述当前配置状态的用户成本之间的比值,作为第一变化量;所述对所述第二差值进行归一化处理,生成第二变化量,包括:将所述第二差值与所述当前配置状态的攻击成本之间的比值,作为第二变化量。

12、在一些可选的实施方式中,所述根据所述第一变化量确定所述待定配置状态的功能需求影响程度,根据所述第二变化量确定所述待定配置状态的安全需求影响程度,包括:确定产生所述用户成本的第一模拟行为,以及产生所述攻击成本的第二模拟行为;所述第一模拟行为和所述第二模拟行为是所述行为模拟脚本所模拟的行为;确定所述第一模拟行为对系统造成的第一行为影响,并确定所述第一行为影响所对应的第一影响系数;确定所述第二模拟行为对系统造成的第二行为影响,并确定所述第二行为影响所对应的第二影响系数;根据所述第一变化量和所述第一影响系数确定所述待定配置状态的功能需求影响程度,根据所述第二变化量和所述第二影响系数确定所述待定配置状态的安全需求影响程度。

13、在一些可选的实施方式中,所述确定所述第一行为影响所对应的第一影响系数,包括:确定所述第一行为影响所对应的第一基本影响系数,并根据所述第一模拟行为的执行频率确定相应的第一状态因子;根据所述第一基本影响系数和所述第一状态因子确定第一影响系数;所述确定所述第二行为影响所对应的第二影响系数,包括:确定所述第二行为影响所对应的第二基本影响系数,并根据所述第二模拟行为的执行频率确定相应的第二状态因子;根据所述第二基本影响系数和所述第二状态因子确定第二影响系数。

14、在一些可选的实施方式中,所述根据所述第一基本影响系数和所述第一状态因子确定第一影响系数,包括:将所述第一基本影响系数与所述第一状态因子之和作为第一影响系数;或者,所述第一状态因子不小于1,且将所述第一基本影响系数与所述第一状态因子的乘积作为第一影响系数;所述根据所述第二基本影响系数和所述第二状态因子确定第二影响系数,包括:将所述第二基本影响系数与所述第二状态因子之和作为第二影响系数;或者,所述第二状态因子不小于1,且将所述第二基本影响系数与所述第二状态因子的乘积作为第二影响系数。

15、在一些可选的实施方式中,所述行为模拟脚本包括:正常行为模拟脚本和攻击行为模拟脚本;所述第一本文档来自技高网...

【技术保护点】

1.一种自适应调参的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于强化学习逐步更新得到奖励值符合要求的配置状态,直至确定符合功能需求和安全需求的目标配置状态,包括:

3.根据权利要求2所述的方法,其特征在于,所述调整当前配置状态中至少一个待定参数的数值,形成多个不同的待定配置状态,包括:

4.根据权利要求3所述的方法,其特征在于,所述分别对当前配置状态中一个待定参数的数值进行调整,形成多个不同的待定配置状态,包括:

5.根据权利要求2所述的方法,其特征在于,还包括:预先生成行为模拟脚本;

6.根据权利要求5所述的方法,其特征在于,所述根据所述待定配置状态的用户成本确定功能需求影响程度,根据所述待定配置状态的攻击成本确定安全需求影响程度,包括:

7.根据权利要求6所述的方法,其特征在于,所述确定所述待定配置状态的用户成本与所述当前配置状态的用户成本之间的第一变化量,包括:

8.根据权利要求7所述的方法,其特征在于,所述对所述第一差值进行归一化处理,生成第一变化量,包括:

9.根据权利要求6所述的方法,其特征在于,所述根据所述第一变化量确定所述待定配置状态的功能需求影响程度,根据所述第二变化量确定所述待定配置状态的安全需求影响程度,包括:

10.根据权利要求9所述的方法,其特征在于,所述确定所述第一行为影响所对应的第一影响系数,包括:

11.根据权利要求10所述的方法,其特征在于,所述根据所述第一基本影响系数和所述第一状态因子确定第一影响系数,包括:

12.根据权利要求9所述的方法,其特征在于,所述行为模拟脚本包括:正常行为模拟脚本和攻击行为模拟脚本;

13.根据权利要求12所述的方法,其特征在于,所述预先生成行为模拟脚本,包括:

14.根据权利要求6所述的方法,其特征在于,还包括:

15.根据权利要求5所述的方法,其特征在于,所述结合所述待定配置状态的功能需求影响程度和安全需求影响程度,确定相应的奖励值,包括:

16.根据权利要求15所述的方法,其特征在于,

17.根据权利要求2所述的方法,其特征在于,所述根据所述待定配置状态的奖励值,选取其中一个待定配置状态更新为下一配置状态,包括:

18.根据权利要求1所述的方法,其特征在于,所述为所述待定参数进行赋值,形成相应的配置状态,包括:

19.一种自适应调参的装置,其特征在于,所述装置包括:

20.一种计算机设备,其特征在于,包括:

21.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至18中任一项所述的自适应调参的方法。

...

【技术特征摘要】

1.一种自适应调参的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于强化学习逐步更新得到奖励值符合要求的配置状态,直至确定符合功能需求和安全需求的目标配置状态,包括:

3.根据权利要求2所述的方法,其特征在于,所述调整当前配置状态中至少一个待定参数的数值,形成多个不同的待定配置状态,包括:

4.根据权利要求3所述的方法,其特征在于,所述分别对当前配置状态中一个待定参数的数值进行调整,形成多个不同的待定配置状态,包括:

5.根据权利要求2所述的方法,其特征在于,还包括:预先生成行为模拟脚本;

6.根据权利要求5所述的方法,其特征在于,所述根据所述待定配置状态的用户成本确定功能需求影响程度,根据所述待定配置状态的攻击成本确定安全需求影响程度,包括:

7.根据权利要求6所述的方法,其特征在于,所述确定所述待定配置状态的用户成本与所述当前配置状态的用户成本之间的第一变化量,包括:

8.根据权利要求7所述的方法,其特征在于,所述对所述第一差值进行归一化处理,生成第一变化量,包括:

9.根据权利要求6所述的方法,其特征在于,所述根据所述第一变化量确定所述待定配置状态的功能需求影响程度,根据所述第二变化量确定所述待定配置状态的安全需求影响程度,包括:

10.根据权利要求9所述的方法...

【专利技术属性】
技术研发人员:徐潇
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1