【技术实现步骤摘要】
流量回放数据选取方法、系统和存储介质
本专利技术涉及软件测试领域,尤其涉及流量回放数据选取方法、系统和存储介质。
技术介绍
流量回放是指在软件预发布代码版本上线前,对预发布代码进行质量监控的一个至关重要的方法。现有流量回放的数据主要通过随机的方式从线上抓取已有接口请求数据,以直接进行回放。然而,随机选取某个数量的接口请求数据可能会导致回放的接口请求数据的覆盖面不够,为了弥补覆盖率不足的问题,一般需要选择尽可能多的接口请求数据进行回放,以避免因选取的接口请求数据覆盖不够广泛而影响预发布代码的测试结果。但是,若接口请求数据的数据量过大,会导致回放时间过长,严重影响回放效率。
技术实现思路
本专利技术的目的是提供一种流量回放数据选取方法,能够在同一数量的回放数据的情况下,相对传统随机选取接口请求数据的回放方式具有更大的覆盖面,能够有效避免因回放数据覆盖面小而影响测试判断,且当本方法的覆盖面和传统随机选取接口请求数据的回放方式相同时,本方法需要选取的回放数据的数量远小于传统回放方法,能够有效提高回放速度以 ...
【技术保护点】
1.一种流量回放数据选取方法,其特征在于,包括如下步骤:/n按照预设的时间间隔抓取接口请求数据;/n根据simhash算法计算每一所述接口请求数据的签名值,将获得的所有签名值标记为接口数据总集;/n根据k-means算法将所述接口数据总集划分为k个接口数据子集;/n从每一所述接口数据子集中分别选取n/k个签名值作为回放数据,其中,n为需要回放的接口请求数据的总条数。/n
【技术特征摘要】
1.一种流量回放数据选取方法,其特征在于,包括如下步骤:
按照预设的时间间隔抓取接口请求数据;
根据simhash算法计算每一所述接口请求数据的签名值,将获得的所有签名值标记为接口数据总集;
根据k-means算法将所述接口数据总集划分为k个接口数据子集;
从每一所述接口数据子集中分别选取n/k个签名值作为回放数据,其中,n为需要回放的接口请求数据的总条数。
2.如权利要求1所述的流量回放数据选取方法,其特征在于,所述根据simhash算法计算每一所述接口请求数据的签名值,将获得的所有签名值标记为接口数据总集,具体包括:
依据当前接口请求数据的入参值和对应值,将当前接口请求数据划分为若干个接口词;
分别计算每一所述接口词的哈希值以得到当前接口词的向量特征值,将当前接口请求数据对应的所有向量特征值进行向量合并,得到当前接口请求数据的签名值;
将获得的所有签名值标记为接口数据总集。
3.如权利要求2所述的流量回放数据选取方法,其特征在于,所述分别计算每一所述接口词的哈希值以得到当前接口词的向量特征值,将当前接口请求数据对应的所有向量特征值进行向量合并,得到当前接口请求数据的签名值,具体包括:
分别计算每一所述接口词的哈希值,以得到当前接口词的第一向量特征值;
将当前接口请求数据对应的所有第一向量特征值进行向量合并,得到当前接口请求数据的签名值。
4.如权利要求3所述的流量回放数据选取方法,其特征在于,所述将当前接口请求数据对应的所有第一向量特征值进行向量合并,得到当前接口请求数据的签名值,具体包括:
对每一所述第一向量特征值进行加权处理,得到第二向量特征值;
将当前接口请求数据对应的所有第二向量特征值进行向量合并,得到当前接口请求数据的签名值。
5.如权利要求4所述的流量回放数据选取方法,其特征在于,所述将当前接口请求数据对应的所有第二向量特征值进行向量合并,得到当前接口请求数据的签名值,具体包括:
将当前接口请求数据对应的所有第二向量特征值进行向量合并,得到第三向量特征值;
对所述第三向量特征值进行降维处理,得到当前接...
【专利技术属性】
技术研发人员:袁丽莉,梁北才,杨浩文,
申请(专利权)人:广州品唯软件有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。