【技术实现步骤摘要】
测试数据生成方法、提取策略测试方法及相关装置
[0001]本专利技术实施例涉及数据处理的
,尤其涉及一种测试数据生成方法、提取策略测试方法及相关装置。
技术介绍
[0002]随着互联网的快速发展,互联网数据呈爆炸式增长,从互联网上提取出有价值对象的对象数据,以通过对象数据进行大数据分析尤为重要。
[0003]目前,基于对象关系的互联网数据提取策略被广泛应用于从互联网上提取对象数据,而为了保证提取策略所提取的对象数据的准确性,在提取策略投入前需要对提取策略进行测试。然而,对提取策略进行验证需要测试数据,将测试数据上传测试平台后对提取策略测试,目前,测试数据由测试人员手动编辑生成。
[0004]由测试人员编辑生成测试数据存在测试数据少、数据准备周期长、错误率高、效率低的问题。
技术实现思路
[0005]本专利技术实施例提出了一种测试数据生成方法、提取策略测试方法及相关装置,以解决人工编辑生成测试数据存在测试数据量少、数据准备周期长、错误率高、效率低的问题。
[0006]第一方面,本专 ...
【技术保护点】
【技术特征摘要】
1.一种测试数据生成方法,其特征在于,包括:确定待测试的提取策略;从所述提取策略中确定目标对象;调用所述目标对象关联的数据生成函数生成对象数据,作为所述提取策略的测试数据。2.根据权利要求1所述的测试数据生成方法,其特征在于,在所述从所述提取策略中确定目标对象之前,包括:获取字段
‑
对象列表,所述字段
‑
对象列表为所述提取策略提取到的数据中字段与对象的映射表。3.根据权利要求2所述的测试数据生成方法,其特征在于,所述从所述提取策略中确定目标对象,包括:从所述提取策略中确定所需要提取的对象数据的目标字段;从所述字段
‑
对象列表中查找与所述目标字段匹配的对象作为目标对象。4.根据权利要求3所述的测试数据生成方法,其特征在于,所述提取策略包括至少一个提取条件,所述从所述提取策略中确定所需要提取的对象数据的目标字段,包括:针对每个提取条件,将满足所述提取条件时所要提取的对象数据的字段作为目标字段。5.根据权利要求4所述的测试数据生成方法,其特征在于,所述调用所述目标对象关联的数据生成函数生成对象数据,作为所述提取策略的测试数据,包括:针对每个所述提取条件,调用所述目标对象的数据生成函数生成所述目标对象的对象数据,得到满足所述提取条件的测试数据;将多个所述提取条件的测试数据打包为所述提取策略的测试数据。6.一种提取策略测试方法,其特征在于,包括:确定待测试的提取策略;获取所述提取策略的测试数据;将所述测试数据上传测试平台;采用所述提取策略从所述测试平台提取数据得到目标数据...
【专利技术属性】
技术研发人员:张林,王杰,万月亮,
申请(专利权)人:北京锐安科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。