System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 测试数据的生成方法、装置、电子设备及存储介质制造方法及图纸_技高网

测试数据的生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:41768081 阅读:10 留言:0更新日期:2024-06-21 21:45
本申请公开了一种测试数据的生成方法、装置、电子设备及存储介质,涉及人工智能领域。其中,该方法包括:通过编码器对真实数据进行特征提取,得到真实数据对应的特征序列;对特征序列进行L次目标操作,得到L个目标特征序列;通过目标解码器依据L个目标特征序列生成L个第一数据,其中,每个第一数据与真实数据的相似度大于第一阈值;依据L个第一数据生成M个测试数据,其中,M为小于或等于L的正整数,M个测试数据与L个第一数据中的M个第一数据一一对应,每个测试数据与真实数据的相似度大于第一阈值,并且每个测试数据与该测试数据对应的第一数据的相似度大于第二阈值。本申请解决了现有技术中对于测试数据的生成成本高的技术问题。

【技术实现步骤摘要】

本申请涉及人工智能领域,具体而言,涉及一种测试数据的生成方法、装置、电子设备及存储介质


技术介绍

1、在现有技术中,通常是由测试人员通过编辑预设条件的方式从数据库中获取一些真实数据作为测试数据,或者基于一些真实数据进行修改后作为测试数据,但是这种获取测试数据的方式不仅耗时长、效率低,占用较高的时间成本,而且在传统的金融领域,由于涉及用户隐私的保护,大量的真实数据通常也难以获取,因此经常仅能获取小数据集的测试数据。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请提供了一种测试数据的生成方法、装置、电子设备及存储介质,以至少解决现有技术中对于测试数据的生成成本高的技术问题。

2、根据本申请的一个方面,提供了一种测试数据的生成方法,包括:通过编码器对真实数据进行特征提取,得到真实数据对应的特征序列;对特征序列进行l次目标操作,得到l个目标特征序列,其中,l为大于1的整数,每次目标操作用于随机对特征序列中的至少一个数据特征进行更新,得到一个目标特征序列;通过目标解码器依据l个目标特征序列生成l个第一数据,其中,l个第一数据与l个目标特征序列一一对应,每个第一数据与真实数据的相似度大于第一阈值;依据l个第一数据生成m个测试数据,其中,m为小于或等于l的正整数,m个测试数据与l个第一数据中的m个第一数据一一对应,每个测试数据与真实数据的相似度大于第一阈值,并且每个测试数据与该测试数据对应的第一数据的相似度大于第二阈值。

3、可选地,测试数据的生成方法,包括:通过目标生成器依据l个第一数据生成l个第二数据,其中,l个第二数据与l个第一数据一一对应;通过目标判别器检测l个第二数据中的每个第二数据与该第二数据对应的第一数据的相似度以及每个第二数据与真实数据的相似度;将l个第二数据中满足预设条件的m个第二数据作为m个测试数据,其中,满足预设条件的第二数据与对应的第一数据的相似度大于第二阈值并且与真实数据的相似度大于第一阈值。

4、可选地,测试数据的生成方法,包括:在依据l个第一数据生成m个测试数据之后,检测m个测试数据中的每个测试数据是否处于预设取值区间内;将m个测试数据中处于预设取值区间内的测试数据作为目标数据存储至数据库中;将m个测试数据中未处于预设取值区间的测试数据作为异常数据进行删除。

5、可选地,编码器与目标解码器相连接组成目标模型,目标生成器与目标判别器相连接组成对抗网络模型,其中,目标解码器的输出结果用于作为目标生成器的输入信息。

6、可选地,测试数据的生成方法,包括:获取n个样本数据,其中,n为大于1的整数;通过编码器对n个样本数据中的每个样本数据进行特征提取,得到每个样本数据对应的特征序列;对每个样本数据对应的特征序列进行l次目标操作,得到每个样本数据对应的l个样本特征序列;根据每个样本数据对应的l个样本特征序列对初始解码器进行h次更新,并将h次更新后的初始解码器作为目标解码器,其中,h为正整数;将编码器和目标解码器组成目标模型。

7、可选地,测试数据的生成方法,包括:将每个样本数据对应的l个样本特征序列分别输入至初始解码器,得到初始解码器输出的与每个样本数据相对应的l个预测数据;检测每个样本数据对应的每个预测数据与该样本数据的相似度是否大于第一阈值;在n个样本数据中存在任意一个样本数据对应的任意一个预测数据与该样本数据的相似度小于或等于第一阈值的情况下,对初始解码器进行更新,直至在完成h次更新后的初始解码器输出的每个预测数据均与对应的样本数据的相似度大于第一阈值。

8、可选地,测试数据的生成方法,包括:将目标模型输出的每个预测数据输入至初始生成器中,并通过初始生成器生成与每个预测数据相对应的待处理数据;通过初始判别器检测每个预测数据对应的待处理数据与该预测数据的相似度以及与该预测数据所对应的样本数据的相似度,得到检测结果;根据检测结果对初始生成器和初始判别器进行至少一次更新,直至最后一次更新后的初始判别器检测到最后一次更新后的初始生成器生成的每个待处理数据满足目标条件,其中,目标条件表征每个待处理数据与对应的预测数据的相似度大于第一阈值,并且每个待处理数据与对应的样本数据的相似度大于第二阈值;将最后一次更新后的初始判别器作为目标判别器,并将最后一次更新后的初始生成器作为目标生成器;将目标判别器和目标生成器组成对抗网络模型。

9、可选地,测试数据的生成方法,包括:通过初始生成器的随机干扰信息对每个预测数据进行更新,得到每个预测数据对应的待处理数据。

10、根据本申请的另一方面,还提供了一种测试数据的生成装置,其中,测试数据的生成装置,包括:第一处理单元,用于通过编码器对真实数据进行特征提取,得到真实数据对应的特征序列;第二处理单元,用于对特征序列进行l次目标操作,得到l个目标特征序列,其中,l为大于1的整数,每次目标操作用于随机对特征序列中的至少一个数据特征进行更新,得到一个目标特征序列;第一生成单元,用于通过目标解码器依据l个目标特征序列生成l个第一数据,其中,l个第一数据与l个目标特征序列一一对应,每个第一数据与真实数据的相似度大于第一阈值;第二生成单元,用于依据l个第一数据生成m个测试数据,其中,m为小于或等于l的正整数,m个测试数据与l个第一数据中的m个第一数据一一对应,每个测试数据与真实数据的相似度大于第一阈值,并且每个测试数据与该测试数据对应的第一数据的相似度大于第二阈值。

11、根据本申请的另一方面,还提供了一种计算机可读存储介质,其中,计算机可读存储介质中存储有计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项的测试数据的生成方法。

12、根据本申请的另一方面,还提供了一种电子设备,其中,电子设备包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任意一项的测试数据的生成方法。

13、在本申请中,采用通过目标解码器生成l个第一数据,并根据l个第一数据生成m个测试数据的方式,首先通过编码器对真实数据进行特征提取,得到真实数据对应的特征序列,然后对特征序列进行l次目标操作,得到l个目标特征序列,其中,l为大于1的整数,每次目标操作用于随机对特征序列中的至少一个数据特征进行更新,得到一个目标特征序列。随后,通过目标解码器依据l个目标特征序列生成l个第一数据,其中,l个第一数据与l个目标特征序列一一对应,每个第一数据与真实数据的相似度大于第一阈值。最后,依据l个第一数据生成m个测试数据,其中,m为小于或等于l的正整数,m个测试数据与l个第一数据中的m个第一数据一一对应,每个测试数据与真实数据的相似度大于第一阈值,并且每个测试数据与该测试数据对应的第一数据的相似度大于第二阈值。

14、由上述内容可知,本申请通过编码器对真实数据对应的特征序列进行l次目标操作,每次目标操作产生一个目标特征序列,并且通本文档来自技高网...

【技术保护点】

1.一种测试数据的生成方法,其特征在于,包括:

2.根据权利要求1所述的测试数据的生成方法,其特征在于,依据所述L个第一数据生成M个测试数据,所述测试数据的生成方法还包括:

3.根据权利要求1所述的测试数据的生成方法,其特征在于,在依据所述L个第一数据生成M个测试数据之后,所述测试数据的生成方法还包括:

4.根据权利要求2所述的测试数据的生成方法,其特征在于,所述编码器与所述目标解码器相连接组成目标模型,所述目标生成器与所述目标判别器相连接组成对抗网络模型,其中,所述目标解码器的输出结果用于作为所述目标生成器的输入信息。

5.根据权利要求4所述的测试数据的生成方法,其特征在于,所述目标模型通过以下步骤训练得到:

6.根据权利要求5所述的测试数据的生成方法,其特征在于,根据所述每个样本数据对应的L个样本特征序列对初始解码器进行H次更新,包括:

7.根据权利要求6所述的测试数据的生成方法,其特征在于,所述对抗网络模型通过以下步骤训练得到,包括:

8.根据权利要求7所述的方法,其特征在于,通过所述初始生成器生成与所述每个预测数据相对应的待处理数据,包括:

9.一种测试数据的生成装置,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至8中任意一项所述的测试数据的生成方法。

11.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至8中任意一项所述的测试数据的生成方法。

...

【技术特征摘要】

1.一种测试数据的生成方法,其特征在于,包括:

2.根据权利要求1所述的测试数据的生成方法,其特征在于,依据所述l个第一数据生成m个测试数据,所述测试数据的生成方法还包括:

3.根据权利要求1所述的测试数据的生成方法,其特征在于,在依据所述l个第一数据生成m个测试数据之后,所述测试数据的生成方法还包括:

4.根据权利要求2所述的测试数据的生成方法,其特征在于,所述编码器与所述目标解码器相连接组成目标模型,所述目标生成器与所述目标判别器相连接组成对抗网络模型,其中,所述目标解码器的输出结果用于作为所述目标生成器的输入信息。

5.根据权利要求4所述的测试数据的生成方法,其特征在于,所述目标模型通过以下步骤训练得到:

6.根据权利要求5所述的测试数据的生成方法,其特征在于,根据所述每个样本数据对应的l个样本特征序列对初...

【专利技术属性】
技术研发人员:陈妍伶黄菁唐琳娜张彬
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1