一种基于统计学规则驱动的样本匹配方法及相关设备组成比例

技术编号:42809648 阅读:24 留言:0更新日期:2024-09-24 20:52
本发明专利技术提供了一种基于统计学规则驱动的样本匹配方法及相关设备,应用于数据处理技术领域。本申请通过获取初始待选组和初始固定组;根据第一预设规则分别对初始待选组和初始固定组进行处理,生成预设待选组和预设固定组;基于标识信息生成循环迭代规则;基于循环迭代规则对预设待选组中的协变量和预设固定组中的协变量进行处理,生成预处理待选组和预处理固定组;基于预设匹配规则对预处理待选组和预处理固定组进行处理,生成匹配结果;基于变量数值计算模型对匹配结果进行处理,生成预处理待选组的统计值和预处理固定组的统计值;若预处理待选组的统计值和预处理固定组的统计值分别符合匹配要求,则生成目标待选组和目标固定组。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别涉及一种基于统计学规则驱动的样本匹配方法及相关设备


技术介绍

1、任一研究领域内,在研究任一自变量对于所属实验结果的影响程度时,通常会受到一些不可控的协变量的影响。在数据科学和统计分析中,样本匹配是一项关键任务,它允许研究者发现和理解不同变量之间的关联性以及它们对特定现象或问题的影响。在样本匹配的过程中,协变量(也称为自变量或特征)扮演了至关重要的角色,因为它们可以提供关于样本之间相似性或差异性的关键信息,这些协变量可以用来识别潜在的匹配样本,以便进行后续的分析和建模。然而,在传统样本匹配方法中,协变量的影响经常被低估或未充分考虑。传统方法中的一种常见问题是在匹配过程中未能有效平衡多个协变量,导致匹配后样本之间的差异性过大,这可能会导致分析结果的不准确性,因为协变量的不平衡会引入偏差。

2、目前样本匹配方法通常可以分为两种主要类型:手动挑选和算法匹配。首先,手动挑选方法依赖于人工设定规则和阈值,这在许多情况下导致了匹配结果的主观性和不可重复性。这是因为不同的研究者或操作者可能会根据个人判断和经验设置不同的规则,从而本文档来自技高网...

【技术保护点】

1.一种基于统计学规则驱动的样本匹配方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基于所述循环迭代规则对所述预设待选组中的协变量和所述预设固定组中的协变量进行处理,生成预处理待选组和预处理固定组,包括:

3.如权利要求2所述的方法,其特征在于,所述基于所述循环迭代规则对所述预设待选组中的协变量和所述预设固定组中的协变量进行处理,生成预处理待选组和预处理固定组,还包括:

4.如权利要求2所述的方法,其特征在于,所述基于所述循环迭代规则对所述预设待选组中的协变量和所述预设固定组中的协变量进行处理,生成预处理待选组和预处理固定组,还包...

【技术特征摘要】

1.一种基于统计学规则驱动的样本匹配方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述基于所述循环迭代规则对所述预设待选组中的协变量和所述预设固定组中的协变量进行处理,生成预处理待选组和预处理固定组,包括:

3.如权利要求2所述的方法,其特征在于,所述基于所述循环迭代规则对所述预设待选组中的协变量和所述预设固定组中的协变量进行处理,生成预处理待选组和预处理固定组,还包括:

4.如权利要求2所述的方法,其特征在于,所述基于所述循环迭代规则对所述预设待选组中的协变量和所述预设固定组中的协变量进行处理,生成预处理待选组和预处理固定组,还包括:

5.如权利要求4所述的方法,其特征在于,所述基于所述循环...

【专利技术属性】
技术研发人员:黄杰谭淑平赵艳丽范宏振
申请(专利权)人:北京回龙观医院北京心理危机研究与干预中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1