System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 随机采样的方法、装置、计算机设备及存储介质制造方法及图纸_技高网

随机采样的方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40750813 阅读:11 留言:0更新日期:2024-03-25 20:06
本公开涉及随机采样的方法、装置、计算机设备及存储介质,包括:获取初始数组内包含的目标对象对应的分组编号、初始数组对应的滑动窗口以及滑动步长;获取滑动窗口的游标指向的组别的第一起始位置和随机采样到的第一编号的第一目标位置;互换第一起始位置的数据和第一目标位置的数据,并根据滑动步长确定下次随机采样的滑动窗口的游标指向的组别的第二起始位置以及下次随机采样得到的第二编号的第二目标位置;互换第二起始位置的数据和第二目标位置的数据,循环执行上述随机采样操作,直到达到随机采样的预设结束条件,则结束随机采样,得到位置互换后的目标数组。本公开每次只能在特定的范围内抽取,同时利用位置互换的方式实现空间复利用。

【技术实现步骤摘要】

本公开涉及计算机,具体涉及随机采样的方法、装置、计算机设备及存储介质


技术介绍

1、在实际应用中,当目标基数较大时,系统无法或基于成本考虑不能在单位时间内对所有数据进行处理或校验的时候,这时就需要对目标进行分批抽检,周期性随机抽样。比如一些特定场景:有一个动态题库,需要根据这个题库来周期性地生成不同的考卷,这时由于题库会不断增加新的题目,也会移除过期的题目,需要每天抽取一批题目来生成考卷;再比如某平台拥有上万名用户,系统需要周期性对用户进行随机抽取进行测试,这时需要在随机时间下对每个用户选取题目进行随机测试。

2、相关技术在基于基数按照比例抽取的方式中,存在抽取数量失衡需要涉及复杂逻辑才能完成整轮抽取且不能控制抽取频率,无法保证相同的样本在n天内不会被重复抽中的问题。


技术实现思路

1、有鉴于此,本公开提供了一种随机采样的方法、装置、计算机设备及存储介质,以解决相关技术基于基数按照比例抽取存在抽取数量失衡需要涉及复杂逻辑才能完成整轮抽取且不能控制抽取频率,无法保证相同的样本在n天内不会被重复抽中的问题。

2、第一方面,本公开提供了一种随机采样的方法,该方法包括:

3、获取初始数组内包含的目标对象对应的分组编号、初始数组对应的滑动窗口以及滑动步长,其中,滑动窗口内包含预设数量个分组编号,滑动步长为每次滑动窗口向预设方向前进的长度;

4、获取滑动窗口的游标指向的组别的第一起始位置和随机采样到的第一编号的第一目标位置,其中,游标位于滑动窗口的预设位置处且游标用于指示滑动窗口每次基于滑动步长向预设方向前进后所指向的组别;

5、互换第一起始位置的数据和第一目标位置的数据,并根据滑动步长确定下次随机采样的滑动窗口的游标指向的组别的第二起始位置以及下次随机采样得到的第二编号的第二目标位置;

6、互换第二起始位置的数据和第二目标位置的数据,循环执行上述随机采样操作,直到达到随机采样的预设结束条件,则结束随机采样,得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组。

7、在本公开实施例中,通过获取初始数组内包含的目标对象对应的分组编号、初始数组对应的滑动窗口以及滑动步长,利用滑动窗口的游标确定需要互换位置的第一起始位置的数据和第一目标位置的数据,然后再根据滑动步长确定下次随机采样时滑动窗口的游标指向的需要互换位置的第二起始位置的数据和第二目标位置的数据,进而循环该随机采样操作,直到达到预设结束条件,结束随机采样,得到采样数据以及所有互换位置后的目标数组。由此可知,本公开实施例利用了数组结构,采样到分组编号后不会选择丢弃,而是通过位置交换来实现空间的复利用,进而形成了一份抽取记录,无需复杂逻辑即可完成整轮的目标对象的抽取,同时利用窗口的特性,限制了每次只能在特定的范围内抽取,结合复用空间里的数据存储顺序,可以实现单个目标对象的抽取频率控制,使得同一个目标对象不会在短时间内重复抽中,进而解决了相关技术中存在抽取数量失衡需要涉及复杂逻辑才能完成整轮抽取且不能控制抽取频率,无法保证相同的样本在n天内不会被重复抽中的问题。

8、在一种可选的实施方式中,在获取初始数组内包含的目标对象对应的分组编号、初始数组对应的滑动窗口以及滑动步长之前,方法包括:

9、获取目标对象和待分组的组别数量;

10、获取对目标对象执行目标算法后得到的整数值;

11、根据整数值和组别数量,得到目标对象对应的分组编号。

12、在本公开实施例中,通过对获取到的目标对象实现分组,减少题目分组信息的维护。

13、在一种可选的实施方式中,在获取初始数组内包含的目标对象对应的分组编号、初始数组对应的滑动窗口以及滑动步长之前,方法包括:

14、根据分组编号构建数组结构,得到与分组编号的编号数量相同的初始数组,其中,初始数组内包含的元素与分组编号之间是一一对应的关系。

15、在本公开实施例中,基于分组编号构建数组结构,这样可以利用数组结构的特点,在抽中分组编号后不会选择丢弃,然后将其使用到后续的空间复利用上,整个抽取逻辑可以不受目标群体基数变化的影响。

16、在一种可选的实施方式中,在预设结束条件为对初始数组内所有的目标对象抽取完毕的情况下,互换第二起始位置的数据和第二目标位置的数据,循环执行上述操作,直到达到随机采样的预设结束条件,则结束随机采样,得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组,包括:

17、互换第二起始位置的数据和第二目标位置的数据,直到滑动窗口的游标指向的组别的起始位置未在初始数组的数组范围内,则结束本轮随机采样,得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组。

18、在本公开实施例中,在滑动窗口的游标指向的组别的起始位置未在初始数组的数组范围内,则结束本轮随机采样,这样本公开实施例只需要初始数组、游标、滑动窗口和滑动步长即可实现整轮的随机采样,实现成本低。

19、在一种可选的实施方式中,在得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组之后,方法还包括:

20、将目标数组作为下一轮随机采样的初始数组,继续执行随机采样操作。

21、在本公开实施例中,在将初始数组内的所有分组编号均采样完毕后,可以将新得到的目标数组作为下一轮随机采样的初始数组,进入到下一轮的随机采样循环中,以此控制分组编号被抽中的频次,保证一段时间内可以不被重复抽中。

22、在一种可选的实施方式中,在互换第二起始位置的数据和第二目标位置的数据,循环执行上述操作,直到达到随机采样的预设结束条件,则结束随机采样,得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组之前,方法还包括:

23、获取初始数组中处于第一位的分组编号和处于最后一位的分组编号;

24、对处于第一位的分组编号和处于最后一位的分组编号进行连接,得到目标状态结构数组。

25、在本公开实施例中,通过将初始数组的首尾相连,进而形成目标状态结构数组,可以不局限于必须抽完初始数组内全部分组编号才能进行下一轮随机采样的限制,适用范围广。

26、在一种可选的实施方式中,在预设结束条件为接收到滑动窗口的游标指向目标状态结构数组内的参考组别的起始位置的情况下,互换第二起始位置的数据和第二目标位置的数据,循环执行上述操作,直到达到随机采样的预设结束条件,则结束随机采样,得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组,包括:

27、互换第二起始位置的数据和第二目标位置的数据,循环执行上述随机采样操作,并在滑动窗口的游标指向滑动窗口内包含的目标组别的起始位置时,根据滑动窗口和滑动步长,将初始数组内随机采样并完成位置互换后的目标分组编号加入到本轮随机采样操作的滑动窗口内,直到滑动窗口本文档来自技高网...

【技术保护点】

1.一种随机采样的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述获取初始数组内包含的目标对象对应的分组编号、所述初始数组对应的滑动窗口以及滑动步长之前,所述方法包括:

3.根据权利要求1或2所述的方法,其特征在于,在所述获取初始数组内包含的目标对象对应的分组编号、所述初始数组对应的滑动窗口以及滑动步长之前,所述方法包括:

4.根据权利要求1所述的方法,其特征在于,在所述预设结束条件为对所述初始数组内所有的所述目标对象抽取完毕的情况下,所述互换所述第二起始位置的数据和所述第二目标位置的数据,循环执行上述操作,直到达到随机采样的预设结束条件,则结束随机采样,得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组,包括:

5.根据权利要求4所述的方法,其特征在于,在所述得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组之后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,在所述互换所述第二起始位置的数据和所述第二目标位置的数据,循环执行上述操作,直到达到随机采样的预设结束条件,则结束随机采样,得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组之前,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,在所述预设结束条件为接收到所述滑动窗口的游标指向所述目标状态结构数组内的参考组别的起始位置的情况下,所述互换所述第二起始位置的数据和所述第二目标位置的数据,循环执行上述操作,直到达到随机采样的预设结束条件,则结束随机采样,得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组,包括:

8.一种随机采样的装置,其特征在于,所述装置包括:

9.一种计算机设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至7中任一项所述的随机采样的方法。

...

【技术特征摘要】

1.一种随机采样的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述获取初始数组内包含的目标对象对应的分组编号、所述初始数组对应的滑动窗口以及滑动步长之前,所述方法包括:

3.根据权利要求1或2所述的方法,其特征在于,在所述获取初始数组内包含的目标对象对应的分组编号、所述初始数组对应的滑动窗口以及滑动步长之前,所述方法包括:

4.根据权利要求1所述的方法,其特征在于,在所述预设结束条件为对所述初始数组内所有的所述目标对象抽取完毕的情况下,所述互换所述第二起始位置的数据和所述第二目标位置的数据,循环执行上述操作,直到达到随机采样的预设结束条件,则结束随机采样,得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组,包括:

5.根据权利要求4所述的方法,其特征在于,在所述得到采样数据以及完成所有起始位置和随机采样到的目标位置进行互换后的目标数组之后,所述方法还包括:

6.根据权利...

【专利技术属性】
技术研发人员:许良良刘海丰毛占磊连乐
申请(专利权)人:抖音视界有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1