【技术实现步骤摘要】
一种数据生成的方法和相关装置
[0001]本申请涉及数据处理
,尤其涉及一种数据生成的方法和相关装置。
技术介绍
[0002]随着信息技术以及互联网的快速发展,各行各业均产生呈爆炸式增长的数据。该数据不仅包括结构化数据,而且包括半结构化数据以及非结构化数据。在大数据平台的建设过程中,需要准备大量的结构化数据、半结构化数据和非结构化数据,作为测试数据对大数据平台进行测试。
[0003]在获取到的半结构化数据较少的情况下,一般采用人工构造方式生成大量的测试半结构化数据。但是,专利技术人经过研究发现,半结构化数据具有丰富信息量的特性,上述人工构造方式,不仅需要耗费大量的时间和精力等,而且所生成的测试半结构化数据的质量较低。
技术实现思路
[0004]有鉴于此,本申请实施例提供一种数据生成的方法和相关装置,不仅可以节省大量的时间和精力,而且可以提高所生成的测试半结构化数据的质量。
[0005]第一方面,本申请实施例提供了一种数据生成的方法,所述方法包括:
[0006]确定待生成测试半结构 ...
【技术保护点】
【技术特征摘要】
1.一种数据生成的方法,其特征在于,包括:确定待生成测试半结构化数据的预设数据模板,所述预设数据模板是数据分析待生成测试半结构化数据对应的目标半结构化数据构建的;获取待生成测试半结构化数据的预设数据格式和预设数据量,所述预设数据格式和所述预设数据量是根据半结构化数据测试需求确定的;根据所述预设数据格式、所述预设数据量和所述预设数据模板,生成测试半结构化数据。2.根据权利要求1所述的方法,其特征在于,所述预设数据模板包括所述目标半结构化数据的数据结构和字段约束。3.根据权利要求2所述的方法,其特征在于,所述预设数据模板的构建步骤包括:从上游接口获取所述目标半结构化数据;对所述目标半结构化数据的数据结构和字段约束进行数据分析,获得所述预设数据模板。4.根据权利要求1所述的方法,其特征在于,所述根据所述预设数据格式、所述预设数据量和所述预设数据模板,生成测试半结构化数据,包括:按照所述预设数据格式和所述预设数据模板,开始生成所述测试半结构化数据;统计所述测试半结构化数据的生成数据量;若所述生成数据量达到所述预设数据量,结束生成所述测试半结构化数据。5.根据权利要求1
‑
4任意一项所述的方法,其特征在于,所述预设数据格式包括XML格式和JSON格式中的一种或多种;所述预设数据量包括所述测试半结构化数据的预设数据大小和所述测试半结构化数据的预设数据数量中的一...
【专利技术属性】
技术研发人员:程慧,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。