【技术实现步骤摘要】
实验样本分组方法、实验样本收集平台和设备
[0001]本申请涉及在线实验测试领域,特别是涉及一种实验样本分组方法
、
实验样本收集平台和设备
。
技术介绍
[0002]实验设计在因果推断问题中是非常重要的一环,实验样本质量
、
分组结果对于实验结果有较大影响
。
传统的实验样本收集平台,通过招募被试者,进行社会学
、
心理学
、
经济学
、
教育学等学科的实验
。
在测试前,采取研究者手动输入或者程序辅助纯随机分组的方式(如
Research Randomizer
,研究随机化器),将被试者按照一定比例分到实验组与对照组
。
[0003]然而,在因果推断实验中,当面对样本数量较小
、
变量维度较多的情况,存在偶发性变量非均衡问题
。
当分组确定后,由于无法改变实验结果,使得某些重要标签的分布不均衡,导致试验结果误差较大
。
[0004]针对相关技术中存在实验样本分组均衡性较差的问题,目前还未提出有效解决方案
。
技术实现思路
[0005]基于此,有必要针对上述技术问题,提供一种能够改善实验样本分组均衡性的实验样本分组方法
、
实验样本收集平台和设备
。
[0006]第一方面,本申请提供了一种实验样本分组方法,所述方法包括:将第一样本进行随机分组;计算当前分组的均衡指 ...
【技术保护点】
【技术特征摘要】
1.
一种实验样本分组方法,其特征在于,所述方法包括:将第一样本进行随机分组;计算当前分组的均衡指标;判断当前分组的均衡指标是否落入阈值范围之内;若是,则中止分组,输出分组结果,所述分组结果包括分组信息和当前分组的均衡指标;若否,则返回至将第一样本进行随机分组的步骤;其中,确定所述阈值范围包括:将第二样本进行
N
次随机分组,输出对应于每一次分组的均衡指标,其中,所述均衡指标包括:各组样本之间的马氏距离,以及常数回归模型和全参数回归模型之间的
AIC
差值;
N
为大于1的自然数;在
N
个分组结果中根据第一预设比例
pa
选取目标分组,并根据所述目标分组的均衡指标确定所述阈值范围
。2.
根据权利要求1所述的实验样本分组方法,其特征在于,输出对应于每一次分组的均衡指标包括:根据所述第二样本的总数
、
第二预设比例
、
各组样本之间的变量差值,计算各组样本之间的马氏距离,并将所述马氏距离作为第一均衡指标,其中,所述第二预设比例为将所述第二样本随机划分为实验组和对照组的分组比例
。3.
根据权利要求2所述的实验样本分组方法,其特征在于,计算所述第一均衡指标,包括:;其中,
M
表示所述马氏距离,
n
表示所述第二样本的总数,
pw
表示所述第二预设比例,
X
表示总实验样本,
X
T
表示实验组中的样本,表示实验组的列均值向量,
X
C
表示对照组中的样本,表示对照组的列均值向量,
cov
表示协方差运算符,
‑1代表求逆
。4.
根据权利要求1所述的实验样本分组方法,其特征在于,计算常数回归模型和全参数回归模型之间的
AIC
差值,包括:将当前分组的分组信息作为因变量,将常数项作为自变量,构建常数回归模型,并计算所述常数回归模型的
AIC
;将当前分组的分组信息作为因变量,将当前分组的样本变量作为自变量,构建全...
【专利技术属性】
技术研发人员:杨佳熹,李晓晨,陈奎,那崇宁,翟毅腾,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。