一种数据处理方法及设备技术

技术编号:17110000 阅读:46 留言:0更新日期:2018-01-24 22:31
本申请公开了一种数据处理方法及设备,包括:获取第一表格文件中的第一表格数据和第二表格文件中的第二表格数据;并按照设定的数据转换规则,将所述第一表格数据转换成第一结构化数据,以及将所述第二表格数据转换成第二结构化数据,所述结构化数据中包含表格数据的表标识和数据结构体,所述数据结构体中包含数据属性、行标识和在不同所述行标识对应的行中所述数据属性对应的属性值;根据所述第一结构化数据和所述第二结构化数据,对所述第一表格文件中的所述第一表格数据与所述第二表格文件中的所述第二表格数据进行处理。

A data processing method and equipment

The invention discloses a method and apparatus for processing data, including obtaining the first second form data table file in the first and second table data in grid files; and conversion rules in accordance with the set of data, the first table data into the first structured data, and the second table data into second structured the table contains data, identification and data structure table data of the structured data, the attribute data attribute values corresponding to the data structure contains data attribute, for identification and the identification in different rows corresponding to the line; according to the first structured data and the second structured data to deal with the second data table of the first table file in the first table data and the second tables in the file.

【技术实现步骤摘要】
一种数据处理方法及设备
本申请涉及互联网信息处理技术以及计算机
,尤其涉及一种数据处理方法及设备。
技术介绍
表格,又可以称之为表,作为一种数据分析的工具,通常可以将数据写入表格中,借助表格的属性对写入的数据进行分析。一般地,写入表格的数据又可以称之为表格数据。表格数据中包含表头数据、行元素、单元格元素等等内容,如表1中所示:表1序号姓名年龄出生年月1张三201995.03.05以表1中所示的内容为例,“序号”、“姓名”、“年龄”和“出生年月”这些可以称之为数据属性,而这些数据属性又可以统称为表头数据;“1”对应的这一行数据,可以称之为行元素,也就是一个行元素对应至少一个单元表格元素;“1”对应的单元格、“张三”对应的单元格、“年龄”对应的单元格和“出生年月”对应的单元格可以称之为单元格元素,而各单元格元素又可以称之为所对应数据属性的属性值,即“张三”可以称之为数据属性“姓名”的一个属性值。那么如何利用表格实现数据分析呢?这里以表格为Excel表格为例进行说明。在现有技术中,一般通过设定函数实现对不同表格中数据的分析比对,例如:通过vlookup函数可以实现对一个Excel文件本文档来自技高网...
一种数据处理方法及设备

【技术保护点】
一种数据处理方法,包括:获取第一表格文件中的第一表格数据和第二表格文件中的第二表格数据;按照设定的数据转换规则,将所述第一表格数据转换成第一结构化数据,以及将所述第二表格数据转换成第二结构化数据,所述结构化数据中包含表格数据的表标识和数据结构体,所述数据结构体中包含数据属性、行标识和在不同所述行标识对应的行中所述数据属性对应的属性值;根据所述第一结构化数据和所述第二结构化数据,对所述第一表格文件中的所述第一表格数据与所述第二表格文件中的所述第二表格数据进行处理。

【技术特征摘要】
1.一种数据处理方法,包括:获取第一表格文件中的第一表格数据和第二表格文件中的第二表格数据;按照设定的数据转换规则,将所述第一表格数据转换成第一结构化数据,以及将所述第二表格数据转换成第二结构化数据,所述结构化数据中包含表格数据的表标识和数据结构体,所述数据结构体中包含数据属性、行标识和在不同所述行标识对应的行中所述数据属性对应的属性值;根据所述第一结构化数据和所述第二结构化数据,对所述第一表格文件中的所述第一表格数据与所述第二表格文件中的所述第二表格数据进行处理。2.根据权利要求1所述的数据处理方法,根据所述第一结构化数据和所述第二结构化数据,对所述第一表格文件中的所述第一表格数据与所述第二表格文件中的所述第二表格数据进行处理,包括:比较所述第一结构化数据和所述第二结构化数据;根据比较结果,分析所述第一表格文件中所述第一表格数据与所述第二表格文件中的所述第二表格数据之间的数据变化状态;根据分析得到的所述数据变化状态,对所述第一表格文件中所述第一表格数据与所述第二表格文件中的所述第二表格数据进行处理。3.根据权利要求2所述的数据处理方法,比较所述第一结构化数据和所述第二结构化数据,包括:确定所述第一结构化数据的数据属性以及所述第二结构化数据的数据属性;若所述第一结构化数据的数据属性与所述第二结构化数据的数据属性相同,则比较所述第一结构化数据中所述数据属性对应的属性值与所述第二结构化数据中所述数据属性对应的属性值。4.根据权利要求3所述的数据处理方法,比较所述第一结构化数据中所述数据属性对应的属性值与所述第二结构化数据中所述数据属性对应的属性值,包括:若所述数据属性对应的属性值的类型为文本类型,则利用构建的文本比对模型,比对所述第一结构化数据中所述数据属性对应的字符串与所述第二结构化数据中所述数据属性对应的字符串。5.根据权利要求4所述的数据处理方法,根据比较结果,分析所述第一表格文件中所述第一表格数据与所述第二表格文件中的所述第二表格数据之间的数据变化状态,包括:若所述第一结构化数据中所述数据属性对应的字符串与所述第二结构化数据中所述数据属性对应的字符串全部或者部分不同,则确定所述第一表格文件中所述第一表格数据与所述第二表格文件中的所述第二表格数据之间的数据变化状态为修改状态;若所述第一结构化数据中所述数据属性对应的字符串与所述第二结构化数据中所述数据属性对应的字符串相同,则确定所述第一表格文件中所述第一表格数据与所述第二表格文件中的所述第二表格数据之间的数据变化状态为不变状态。6.根据权利要求3所述的数据处理方法,比较所述第一结构化数据中所述数据属性对应的属性值与所述第二结构化数据中所述数据属性对应的属性值,包括:若所述数据属性对应的属性值的类型为非文本类型,则计算由所述第一结构化数据中所述数据属性对应的属性值到所述第二结构化数据中所述数据属性对应的属性值的编辑距离。7.根据权利要求6所述的数据处理方法,根据比较结果,分析所述第一表格文件中所述第一表格数据与所述第二表格文件中的所述第二表格数据之间的数据变化状态,包括:根据所述编辑距离的大小,分析所述第一表格文件中所述第一表格数据与所述第二表格文件中的所述第二表格数据之间的数据变化状态,所述数据变化状态包含变化状态和不变状态中的至少一种,所述变化状态包含新增变化状态和删除变化状态中的至少一种或多种。8.根据权利要求3所述的数据处理方法,确定所述第一结构化数据的数据属性与所述第二结构化数据的数据属性相同,包括:针对所述第一结构化数据中包含的不同的数据属性,分别执行以下操作:从所述第一结构化数据中选择第一数据属性,分别与所述第二结构化数据中包含的不同的数据属性进行比较;确定在所述第二结构化数据中包含的与所述第一数据属性相同的第二数据属性。9.根据权利要求8所述的数据处理方法,比较所述第一结构化数据中所述数据属性对应的属性值与所述第二结构化数据中所述数据属性对应的属性值,包括:比较所述第一结构化数据中所述第一数据属性对应的属性值与所述第二结构化数据中所述第二数据属性对应的属性值。10.根据权利要求2所述的数据处理方法,根据分析得到的所述数据变化状态,对所述第一表格文件中所述第一表格数据与所述第二表格文件中的所述第二表格数据进行处理,包括:根据预设的数据变化状态与显示方式的映射关系,确定所述第一表格文件中所述第一表格数据与所述第二表格文件中的所述第二表格数据之间的数据变化状态对应的显示方式;按照所述显示方式,渲染显示所述第一表格文件中所述第一表格数据与所述第二表格文件中的所述第二表格数据。11.一种数据处理设备,包括:获取单元,获取第一表格文件中的第一表格数据和第二表格文件中的第二表格数据;转换单元,按照设定的数据转换规则,将所述第一表格数据转换成第一结构化数据,以及将所述第二表格数据转换成第二结构化数据,所述结构化数据中包含表格数据的表标识和数据结构体,所述数据结构体中包含数据属性、行标识和在不同所述行标识对应的行中所述数据属性对应的属性值;处理单元,...

【专利技术属性】
技术研发人员:彭剑
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1