一种基于多管道匹配的AB实验分流方法技术

技术编号:30431870 阅读:19 留言:0更新日期:2021-10-24 17:25
一种基于多管道匹配的AB实验分流方法,首先获取针对AB实验的当前用户的流量分配请求,根据不同的用户流量进行流量分桶数量的锚定,将当前可分配的用户流量打散并分配至预定数目的流量分桶中,再根据各个目标实验版本的用户流量比例,对每个用户标识进行Hash取数后进行流量分桶编码,确定各个目标实验版本的对应用户的流量分桶编码区间,进行AB实验版本数的取模。本发明专利技术通过每个用户的分桶编码进行AB实验版本数的取模数作为该用户路由的AB实验版本,此种方法解决了简单的UI D或I D用户标识进行Hash取数取模造成的AB实验版本分流不均的问题,通过多管道匹配路由的方式抹平了分配不均的问题。不均的问题。不均的问题。

【技术实现步骤摘要】
一种基于多管道匹配的AB实验分流方法


[0001]本专利技术涉及计算机数据处理应用
,尤其是一种基于多管道匹配的AB实验分流方法。

技术介绍

[0002]AB实验是在产品应用或页面或流程制作两个(A/B)或多个(A/B/N)版本,在同一个时间维度,从全体用户流量中划分出组成成分相同或相似的访客群组,来随机的访问这些不同的实验版本,为不同的实验版本设置不同的实验方案,收集各个群组的用户体验数据和业务数据,观察分析实验指标效果,通过数据驱动来推进产品的迭代、验证算法效果、获取业务产出等等,得到实验结论,最后分析评估出最优版本,并正式采用,此种实验方法被广泛应用在互联网产品中进行产品的迭代优化。
[0003]现代互联网产品在庞大的用户群体下,无法快速的决策某项功能的正确性以及最优方案,所以一个快速且有效的AB实验方案对整个产品的更迭优化起着至关重要的作用,一般情况下,为同一个优化目标制定两个方案,让同一用户群体中的一部分用户命中A方案,同时另一部分用户命中B方案,统计并比较不同方案下的点击率、转化率等数据指标,通过不同方案的数据表现,在确定数据表现通过假设检验后决定最终方案,应用AB实验来确定方案结果的项目包括多版本的活动落地页、多版本的营销发券等等,而AB实验过程中将用户群体进行分流的步骤又是决定AB实验是否能验证出最优指标的关键,AB实验的分流需要确保各个实验版本中所分配的用户流量符合预期,且所分配的用户流量满足一致性、均匀性以及独立性,才能确保AB实验的有效性。
[0004]现有的AB实验的分流方法,是对每个用户标识进行Hash取数取模后进行AB实验,用户标识包括系统自动分配的UID(User Identification)和用户自己设置的ID身份标识,Hash(哈希)是一种散列算法,将任意长度的输入通过散列算法变换成固定长度的输出,此种AB实验分流方法受限于UID或ID的生成规则,如果UID或ID本身是不均匀的,则Hash取数取模后也会造成AB实验的版本分流不均,也就无法确保AB实验的有效性。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足,提供一种将用户转换为分桶编号后再进行AB实验版本取数取模得到的流量均匀的AB实验分流方法。
[0006]本专利技术解决其技术问题是采取以下技术方案实现的:
[0007]一种基于多管道匹配的AB实验分流方法,包括以下步骤:
[0008]S1、获取针对AB实验的当前用户的流量分配请求,所述当前用户的流量分配请求包括当前用户流量分配的目标实验的目标实验版本以及各个目标实验版本的用户流量比例,根据不同的用户流量进行流量分桶数量的锚定,将当前可分配的用户流量打散并分配至预定数目的流量分桶中,其中,用户流量分桶数量的锚定为:
[0009]当用户流量数大于1亿时,流量分桶数量为1000,当用户流量数小于1亿时,流量分
桶数量为100;
[0010]S2、根据各个目标实验版本的用户流量比例,对每个用户标识进行Hash取数后进行流量分桶编码,确定各个目标实验版本的对应用户的流量分桶编码区间,流量分桶编码区间的确定规则为:
[0011]当用户流量数大于1亿时,流量分桶编码区间为1

1000,当用户流量数小于1亿时,流量分桶编码区间为1

100;
[0012]S3、根据所确定的各个目标实验版本的对应用户流量分桶编码区间,通过步骤S2中的每个用户的流量分桶编码进行AB实验版本数的取模,取模数作为该用户路由的AB实验版本,此种分流方法解决了简单的UID或ID用户标识进行Hash取数取模造成的AB实验版本分流不均的问题。
[0013]优选的,所述步骤S2中用户标识包括系统设定的UID标识码和用户自定的ID标识码。
[0014]优选的,所述步骤S2中Hash取数采用MD5算法进行取数,所述MD5算法的取数步骤为:
[0015]第一步,对于任意长度的明文,MD5对其进行分组,添加位数,使得每一组输入的长度为512位,在明文后添加位的方法是第一个添加位是1,其余都是0,然后将真正明文的长度以64位表示,附加于前面已添加过位的明文后,此时的明文长度正好为512位的倍数,当明文长度大于2的64次方时,仅仅使用低64位比特填充,附加到最后一个分组的末尾;
[0016]第二步,对这些明文分组反复重复处理,将512位的明文分组划分为16个子明文分组,每个子明文分组为32位,申请4个32位的链接变量,记为A、B、C、D,子明文分组与链接变量先后进行4轮运算,再将链接变量与初始链接变量进行求和运算,链接变量作为下一个明文分组的输入重复上述操作;
[0017]第三步,输出4个32位字的级联,4个链接变量的数据就是产生128位的MD5数据摘要。
[0018]优选的,所述步骤S3中AB实验版本数的取模方法为:
[0019]先配置数量为M的AB实验版本,再将每个用户标识经过Hash取数后得到的值按照AB实验版本的数量M进行取模,每个用户会落到1至M的AB实验版本中的其中一个,即对应的项目版本。
[0020]本专利技术的优点和积极效果是:
[0021]本专利技术通过将所有需要进行AB实验的用户流量根据特定的分桶标准进行分桶编码,再通过每个用户的分桶编码进行AB实验版本数的取模数作为该用户路由的AB实验版本,此种方法解决了简单的UID或ID用户标识进行Hash取数取模造成的AB实验版本分流不均的问题,通过多管道匹配路由的方式抹平了分配不均的问题。
附图说明
[0022]图1是本专利技术的流量分流方法的步骤流程示意图。
具体实施方式
[0023]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完
整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0024]需要说明的是,当组件被称为“固定于”另一个组件,它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“连接”另一个组件,它可以是直接连接到另一个组件或者可能同时存在居中组件。当一个组件被认为是“设置于”另一个组件,它可以是直接设置在另一个组件上或者可能同时存在居中组件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
[0025]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0026]以下结合附图对本专利技术实施例做进一步详述:
[0027]如图1所示,本专利技术所述的一种基于多管道匹配的AB实验分流方法,包括以下步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多管道匹配的AB实验分流方法,其特征在于:包括以下步骤:S1、获取针对AB实验的当前用户的流量分配请求,所述当前用户的流量分配请求包括当前用户流量分配的目标实验的目标实验版本以及各个目标实验版本的用户流量比例,根据不同的用户流量进行流量分桶数量的锚定,将当前可分配的用户流量打散并分配至预定数目的流量分桶中;S2、根据各个目标实验版本的用户流量比例,对每个用户标识进行Hash取数后进行流量分桶编码,确定各个目标实验版本的对应用户的流量分桶编码区间;S3、根据所确定的各个目标实验版本的对应用户流量分桶编码区间,通过步骤S2中的每个用户的流量分桶编码进行AB实验版本数的取模,取模数作为该用户路由的AB实验版本。2.根据权利要求1所述的一种基于多管道匹配的AB实验分流方法,其特征在于:所述步骤S1中的用户流量分桶数量的锚定为:当用户流量数大于1亿时,流量分桶数量为1000,当用户流量数小于1亿时,流量分桶数量为100。3.根据权利要求1所述的一种基于多管道匹配的AB实验分流方法,其特征在于:所述步骤S2中流量分桶编码区间的确定规则为:当用户流量数大于1亿时,流量分桶编码区间为1

1000,当用户流量数小于1亿时,流量分桶编码区间为1

100。4.根据权利要求3所述的一种基于多管道匹配的AB实验分流方法,其特征在于:所述步骤S2中用户标识包括系统设定的UID标...

【专利技术属性】
技术研发人员:史灵
申请(专利权)人:杭州索引科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1