System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 仿真方法及装置、训练方法及装置制造方法及图纸_技高网

仿真方法及装置、训练方法及装置制造方法及图纸

技术编号:41072361 阅读:7 留言:0更新日期:2024-04-24 11:28
本申请涉及数据仿真技术领域,公开一种仿真方法及装置、训练方法及装置。该方法包括:获取预设网站在预设时长内的多个访问流量数据;对各访问流量数据进行变异,对应获得若干变异数值,若干变异数值组合形成第一变异数据;确定若干变异数值和对应的访问流量数据之间的数据差异性;在数据差异性满足预设差异条件的情况下,将第一变异数据确定为流量仿真数据。这样,通过对每一个访问流量数据均进行变异以获得变异数值,再筛选满足预设差异条件的由变异数值组合形成的第一变异数据作为流量仿真数据,能够使得流量仿真数据更全面的体现真实环境下的异常情况,同时与真实的访问流量数据更相似。

【技术实现步骤摘要】

本申请涉及数据仿真,尤其是涉及一种仿真方法及装置、训练方法及装置


技术介绍

1、目前,通常会通过时序分析任务检测网站的访问流量是否异常,以及网站是否被攻击等。为了能够利用时序分析任务得到更准确的检测结果,在利用时序分析任务进行检测前,准确评估时序分析任务的检测性能至关重要。

2、相关技术中,通过获取正常业务产生的访问流量数据,在预设的时间点基于规则随机插入预设的异常数据,利用掺杂有异常数据的访问流量数据对时序分析任务进行评估。但是,正常业务产生的访问流量大部分都是正常的访问流量,访问流量较为单一,即便在预设的时间点基于规则随机插入预设的异常数据,也只能改变部分时刻的访问流量数据,由此掺杂有异常数据的访问流量数据仅能体现真实环境下部分时刻的异常情况,即掺杂有异常数据的访问流量数据只能覆盖较少的异常情况。因此即便使用掺杂有异常数据的访问流量数据对时序分析任务进行评估,仍不利于正确评估时序分析任务的检测性能。

3、需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。

2、本申请实施例提供了一种仿真方法及装置、训练方法及装置,以获取能够更全面的体现真实环境下异常情况的流量仿真数据。

3、本申请实施例提供了一种访问流量数据的仿真方法,包括:获取预设网站在预设时长内的多个访问流量数据;对各所述访问流量数据进行变异,对应获得若干变异数值,若干所述变异数值组合形成第一变异数据;确定若干所述变异数值和对应的所述访问流量数据之间的数据差异性;在所述数据差异性满足预设差异条件的情况下,将所述第一变异数据确定为流量仿真数据。

4、在上述实现过程中,通过在真实获取的访问流量数据上进行变异,能够使得产生的第一变异数据能够与真实情况较为相符。同时,由于是对每一个访问流量数据均进行变异以获得对应的变异数值,因此能够改变每一个时刻的访问流量数据,从而使得由若干变异数值组合形成的第一变异数据能够尽可能多的覆盖真实环境下可能出现的异常情况,即第一变异数据能够更全面的体现真实环境下的异常情况。再筛选满足预设差异条件的第一变异数据作为流量仿真数据,能够使得流量仿真数据更全面的体现真实环境下的异常情况,且流量仿真数据与真实的访问流量数据更相似。由于流量仿真数据能够更全面的体现真实环境下的异常情况,且与真实的访问流量数据更相似,在分析模型利用该流量仿真数据进行分析的情况下,能够更准确的评估分析模型的检测性能,进而便于根据检测结果优化分析模型,从而获得更优化的分析模型。

5、进一步地,对各所述访问流量数据进行变异,对应获得若干变异数值,包括:从均值为零且方差为常数的正态分布中获取变异参数;根据es算法利用所述变异参数对各所述访问流量数据进行变异,获得对应的变异数值。

6、在上述实现过程中,由于均值为零且方差为常数的正态分布能够反应高斯噪声。由此,通过从均值为零且方差为常数的正态分布中获取变异参数,并利用该变异参数对访问流量数据进行变异,使得变异后的变异数值与现实中受到干扰的访问流量数据更相似,进而便于变异数值组合形成的第一变异数据更真实。

7、进一步地,所述变异参数包括第一变异参数、第二变异参数和第三变异参数;根据es算法利用所述变异参数对各所述访问流量数据进行变异,获得对应的变异数值,包括:按照获取各所述访问流量数据的时间顺序对各所述访问流量数据排列,形成统计序列;针对所述统计序列中的每一个访问流量数据:获取该访问流量数据对应的第一变异系数,计算和x'i=xi+σ'iri,获得该访问流量数据对应的变异数值;其中,ρ0为第一变异参数,ρi为统计序列中的位于第i个的访问流量数据对应的第二变异参数,ri为统计序列中的位于第i个的对应的第三变异参数,σi为统计序列中的位于第i个的访问流量数据对应的第一变异系数,σ'i为统计序列中的位于第i个的访问流量数据对应的第二变异系数,xi为统计序列中的位于第i个的访问流量数据,x'i为统计序列中的位于第i个的访问流量数据对应的变异数值,i为正整数,f为统计序列中的访问流量数据的总个数,τ1为第一预设参数,τ2第二预设参数。

8、进一步地,确定若干所述变异数值和对应的所述访问流量数据之间的数据差异性,包括:计算获得余弦相似度;将余弦相似度作为参与计算的变异数值对应的第一变异数据和所述访问流量数据之间的数据差异性;其中,similarity(a,b)为a和b之间的余弦相似度;a为访问流量数据,b为第一变异数据中的变异数值;ai为第i个的访问流量数据;bi为第i个变异数值,n为第一变异数据中的变异数值的总个数;相应地,所述预设差异条件为余弦相似度大于预设阈值。

9、在上述实现过程中,由于变异数值和对应的访问流量数据之间的余弦相似度相差较大的情况下,可能导致变异数值组成的第一变异数据与真实情况不符。因此,通过计算变异数值和对应的访问流量数据之间的余弦相似度,并将大于预设阈值的余弦相似度对应的第一变异数据确定为流量仿真数据,能够使得流量仿真数据与真实的访问流量数据相似且具备多样性。

10、进一步地,确定所述变异数值和对应的所述访问流量数据之间的数据差异性,包括:计算所述第一变异数据中多个变异数值之间的第一均值;计算所述第一变异数据中若干变异数值分别对应的各所述访问流量数据之间的第二均值;计算所述第一均值与所述第二均值之间的均值差异值,并将所述均值差异值作为数据差异性;相应地,所述预设差异条件包括所述均值差异值小于第一预设差异值。

11、在上述实现过程中,由于变异数值之间的第一均值和访问流量数据之间的第二均值相差较大的情况下,可能导致变异数值与真实的访问流量数据之间相差较大,从而使变异数值组成的第一变异数据与真实情况不符。因此,通过计算均值差异值,并将小于第一预设差异值的均值差异值对应的第一变异数据确定为流量仿真数据,能够使得流量仿真数据与真实的访问流量数据相似且具备多样性。

12、进一步地,确定所述变异数值和对应的所述访问流量数据之间的数据差异性,包括:计算所述第一变异数据中多个变异数值之间的第一方差;计算所述第一变异数据中若干变异数值分别对应的各所述访问流量数据之间的第二方差;计算所述第一方差与所述第二方差之间的方差差异值,并将所述方差差异值作为数据差异性;相应地,所述预设差异条件包括所述方差差异值小于第二预设差异值。

13、在上述实现过程中,由于变异数值之间的第一方差和访问流量数据之间的第二方差相差较大的情况下,可能导致变异数值与真实的访问流量数据之间相差较大,从而使变异数值组成的第一变异数据与真实情况不符。因此,通过计算方差差异值,并将小于第二预设差异值的方差差异值对应的第一变异数据确定为本文档来自技高网...

【技术保护点】

1.一种访问流量数据的仿真方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,对各所述访问流量数据进行变异,对应获得若干变异数值,包括:

3.根据权利要求2所述的方法,其特征在于,所述变异参数包括第一变异参数、第二变异参数和第三变异参数;所述预设时长小于第一设定时长;根据ES算法利用所述变异参数对各所述访问流量数据进行变异,获得对应的变异数值,包括:

4.根据权利要求1所述的方法,其特征在于,确定若干所述变异数值和对应的所述访问流量数据之间的数据差异性,包括:

5.根据权利要求1至4任一项所述的方法,其特征在于,确定若干所述变异数值和对应的所述访问流量数据之间的数据差异性,包括:

6.根据权利要求1至4任一项所述的方法,其特征在于,确定若干所述变异数值和对应的所述访问流量数据之间的数据差异性,包括:

7.根据权利要求1至4任一项所述的方法,其特征在于,对所述访问流量数据进行变异,获得第一变异数据后,所述方法还包括:

8.一种分析模型的训练方法,其特征在于,包括:

9.一种访问流量数据的仿真装置,其特征在于,包括:

10.一种分析模型的训练装置,其特征在于,包括:

...

【技术特征摘要】

1.一种访问流量数据的仿真方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,对各所述访问流量数据进行变异,对应获得若干变异数值,包括:

3.根据权利要求2所述的方法,其特征在于,所述变异参数包括第一变异参数、第二变异参数和第三变异参数;所述预设时长小于第一设定时长;根据es算法利用所述变异参数对各所述访问流量数据进行变异,获得对应的变异数值,包括:

4.根据权利要求1所述的方法,其特征在于,确定若干所述变异数值和对应的所述访问流量数据之间的数据差异性,包括:

5.根据权利要求1至...

【专利技术属性】
技术研发人员:陈伟
申请(专利权)人:上海斗象信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1