【技术实现步骤摘要】
本申请涉及用于确定实验数据的方法、系统、实现上述方法的计算机可读存储介质以及计算机程序产品。
技术介绍
1、随着信息技术的快速发展,使用各种业务活动和业务产品进行业务推广的手段逐步向精细化、智能化转变,而各种业务活动和业务产品的效果评估是一项重要任务。目前,对于业务活动和业务产品的效果评估通常需要将用户划分为实验组和对照组,在同一时间维度,实验组的用户可以参与业务活动或使用业务产品,对照组的用户未参与业务活动或未使用业务产品,通过统计实验组和对照组的用户在各个指标(例如,交易笔数、交易金额等)方面的差异来分析评估业务活动和业务产品的效果。
2、一般而言,对照组和实验组需要在各个指标方面保持同分布,以保证准确地分析评估业务活动和业务产品的效果。目前,一般利用人工规则的抽样方法和分层抽样方法来得到对照组。在人工规则的抽样方法中,例如需要用户在年龄和交易笔数上同分布,则按照每个年龄段和每个交易笔数区间的用户分布从用户样本集合中分别抽取用户样本来得到对照组。在分层抽样方法中,可以将用户特征划分为多个区间段并根据用户在每个区间段的占比
...【技术保护点】
1.一种用于确定实验数据的方法,其特征在于,所述方法包括下列步骤:
2.根据权利要求1所述的方法,其中基于实验组内的多个第一用户的用户特征获取第一用户样本的集合包括:
3.根据权利要求1所述的方法,其中基于候选对照组内的多个第二用户的用户特征获取第二用户样本的集合包括:
4.根据权利要求1所述的方法,其中所述第一用户的用户特征和所述第二用户的用户特征各自包括下列中的一项或多项:用户自然属性、用户交易属性、用户活跃属性。
5.根据权利要求1所述的方法,其中基于所述第二用户样本的集合构建多维空间数据结构包括:
6
...【技术特征摘要】
1.一种用于确定实验数据的方法,其特征在于,所述方法包括下列步骤:
2.根据权利要求1所述的方法,其中基于实验组内的多个第一用户的用户特征获取第一用户样本的集合包括:
3.根据权利要求1所述的方法,其中基于候选对照组内的多个第二用户的用户特征获取第二用户样本的集合包括:
4.根据权利要求1所述的方法,其中所述第一用户的用户特征和所述第二用户的用户特征各自包括下列中的一项或多项:用户自然属性、用户交易属性、用户活跃属性。
5.根据权利要求1所述的方法,其中基于所述第二用户样本的集合构建多维空间数据结构包括:
6.根据权利要求1所述的方法,其中所述多维空间数据结构为多维空间分割树结构。
7.根据权利要求1所述的方法,其中在所述多维空间数据结构中确定与每个第一用户样本最邻近的第二用户样本以生成所述实验组的第一对照组包括:
8.根据权利要求7所述的方法,其中在所述多维空间数据结构中并行地搜索与所述每个第一用户样本最邻近的第二用户样本包括:
9.根据权利要求1所述的方法,其中在所述多维空间数据结构中确定与所述每个第一用户样本关联的多个第二用户样本包括:
10.根据权利要求1所述的方法,其中所述每个第一用户样本与所述多个第二用户样本之间的距离信息和样本映射信息通过以下方式来确定:
11.根据权利要求10所述的方法,其中基于所述每个第一用户样本与所述多个第二用户样本之间的距离信息和样本映射信息确定所述实验组的第二对照组包括循环地执行以下步骤直至所述距离矩阵为空矩阵:
12.根据权利要求1所述的方法,其中所述方法还包括:
13.一种用于确定实验数据的系统,其特征在于,所述系统包括:
14.根据权利要求13所述的系统,其中所述计算机程序的运行导致基于实验组内的多个第一用户的用户特征获取第一用户样本的集合包括:
15.根据权利要求13所述的系统,其中所述计算机程序的运行导致...
【专利技术属性】
技术研发人员:张凯,陈汉,余洋,胡伟,王文星,陈猛,李斌,林景怡,化沁,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。