一种数据解析方法及相关设备技术

技术编号:38729059 阅读:25 留言:0更新日期:2023-09-08 23:19
本说明书提供了一种数据解析方法和相关设备,应用于云服务平台,所述云服务平台与多个数据源分别对接。该方法包括:获取所述多个数据源中的任一目标数据源对应的样本数据集合;分析所述样本数据集合中的样本数据的数据结构,并基于分析结果生成与所述目标数据源对应的数据解析规则;所述数据解析规则用于指示所述目标数据源中的各个数据的数据结构;基于所述数据解析规则,对所述目标数据源中的待解析的目标数据进行数据结构解析。析的目标数据进行数据结构解析。析的目标数据进行数据结构解析。

【技术实现步骤摘要】
一种数据解析方法及相关设备


[0001]本说明书一个或多个实施例涉及数据处理
,尤其涉及一种数据解析方法及相关设备。

技术介绍

[0002]云服务平台可以对接云外的多个数据源,并对该多个数据源的数据进行统一的数据管理。但是,各个数据源的数据格式往往不同,没有统一的标准,这就导致云服务平台在接入这些数据源的数据时无法对其进行准确、有效的数据管理。
[0003]因此,云服务平台在接入各个数据源的数据时,经常需要针对各个数据源的数据,手动配置相应的数据解析规则,以使云服务平台能够基于这些手动配置的数据解析规则对各个数据源的数据进行解析,从而获得结构化的标准数据以便进行后续管理。但是,通过手动配置大量的数据解析规则非常耗时耗力且容易出错,极大程度上降低了云服务平台的数据接入效率和数据管理效率。

技术实现思路

[0004]有鉴于此,本说明书一个或多个实施例提供一种数据解析方法及相关设备。
[0005]第一方面,本说明书提供了一种数据解析方法,应用于云服务平台,所述云服务平台与多个数据源分别对接;所述方法包括:
...

【技术保护点】

【技术特征摘要】
1.一种数据解析方法,应用于云服务平台,所述云服务平台与多个数据源分别对接;所述方法包括:获取所述多个数据源中的任一目标数据源对应的样本数据集合;分析所述样本数据集合中的样本数据的数据结构,并基于分析结果生成与所述目标数据源对应的数据解析规则;所述数据解析规则用于指示所述目标数据源中的各个数据的数据结构;基于所述数据解析规则,对所述目标数据源中的待解析的目标数据进行数据结构解析。2.根据权利要求1所述的方法,所述数据解析规则包含用于指示数据中的字段分隔符和Key

Value键值分隔符的第一类解析规则;其中,所述字段分隔符用于分隔数据中相邻的两个字段,所述键值分隔符用于分隔数据中的每个字段的字段名称和字段值,所述字段名称作为字段的key,所述字段值作为与字段的key对应的value;所述分析样本数据集合中的样本数据的数据结构,并基于分析结果生成与所述目标数据源对应的数据解析规则,包括:统计所述样本数据集合中的样本数据包含的多种分隔符在每个样本数据中的数量;基于统计出的所述数量,在所述多种分隔符中确定出所述样本数据集合的字段分隔符和键值分隔符;基于所述样本数据集合的字段分隔符和键值分隔符生成所述第一类解析规则。3.根据权利要求2所述的方法,所述基于统计出的所述数量,在所述多种分隔符中确定出所述样本数据集合的字段分隔符和键值分隔符,包括:将在每个样本数据中数量最多的分隔符确定为所述样本数据集合的键值分隔符;将在每个样本数据中数量比所述键值分隔符少一个的分隔符确定为所述样本数据集合的字段分隔符。4.根据权利要求3所述的方法,所述将在每个样本数据中数量最多的分隔符确定为所述样本数据集合的键值分隔符,包括:将在每个样本数据中数量最多,且在不同样本数据之间数量的差异最小的分隔符确定为所述样本数据集合的键值分隔符;所述将在每个样本数据中数量比所述键值分隔符少一个的分隔符确定为所述样本数据集合的字段分隔符,包括:将在每个样本数据中数量比所述键值分隔符少一个,且在不同样本数据之间数量的差异最小的分隔符确定为所述样本数据集合的字段分隔符。5.根据权利要求4所述的方法,所述将在每个样本数据中数量最多,且在不同样本数据之间数量的差异最小的分隔符确定为所述样本数据集合的键值分隔符,包括:计算每种分隔符在不同样本数据之间的数量方差;将在每个样本数据中数量最多,且在不同样本数据之间的数量方差最小的分隔符确定为所述样本数据集合的键值分隔符;所述将在每个样本数据中数量比所述键...

【专利技术属性】
技术研发人员:张良
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1