【技术实现步骤摘要】
数据转换操作语义的可视化方法及装置、电子设备
[0001]本申请涉及数据清洗可视化设计领域,尤其涉及一种数据转换操作语义的可视化方法及装置、电子设备。
技术介绍
[0002]数据清洗是一种通过清洗和转换操作将复杂凌乱的数据整理成理想数据格式的过程,是数据存取、数据建模和数据可视分析等任务的重要前置步骤。二维数据表格是一种组织整理数据的有效手段,人们在通讯交流、科学研究以及数据分析活动中广泛采用着形形色色的表格。由于原始表格常常包含“脏”数据,或是数据格式、内容等不符合预期目标,因此,数据工作者必须对表格进行数据清洗。
[0003]对表格数据执行各种数据转换操作是完成数据清洗任务的基础。然而,数据转换操作的种类繁多,部分操作十分复杂,数据工作者难以掌握全部种类的数据转换操作。相关研究曾按照操作对象(即表、行、列)及操作种类(即创建、删除、转化、拆分、合并)的不同将数据转换操作总结为15个大类,而大类中又可以继续细分成不同小类,如“删除行”大类操作可以进一步细分为“删除指定行”、“删除重复行”、“删除含有缺失值的行”、“ ...
【技术保护点】
【技术特征摘要】
1.一种数据转换操作语义的可视化方法,其特征在于,用于对真实表格进行数据转换操作过程的数据转换操作语义进行可视化,包括:根据所述数据转换操作的类型,挑选图形图符模板,所述图形图符模板包含二维数据表;根据所述数据转换操作,从所述真实表格中确定用于展示在所述二维数据表上的行和列;根据所述行和列,从所述真实表格中挑选出与所述数据转换操作语义相关的行列单元格数据;将所述行列单元格数据填入所述二维数据表中;在所述二维数据表的外围填入与所述数据转换操作语义相关的非真实表格数据;根据所述数据转换操作,为所述二维数据表中的单元格进行颜色的编码;在所述二维数据表中用第一标记框框选出在数据转换操作中具有依赖关系的列,各所述第一标记框通过第一连接线相连;根据所述真实表格的行列数目大小,为所述二维数据表绘制行列滚动条。2.根据权利要求1所述的可视化方法,其特征在于,根据数据转换操作的类型,挑选图形图符模板,所述图形图符模板包含二维数据表,包括:当所述数据转换操作的类型为创建表时,所述图形图符模板中还包含创建框,所述二维数据表为二维数据输出表;当所述数据转换操作的类型为删除表时,所述图形图符模板中还包含删除框,所述二维数据表为二维数据输入表;当所述数据转换操作的类型为其他操作时,所述二维数据表有二维数据输入表和二维数据输出表。3.根据权利要求1所述的可视化方法,其特征在于,根据所述数据转换操作,从所述真实表格中确定用于展示在所述二维数据表上的行和列,包括:根据所述数据转换操作,确定与所述数据转换操作相关的行和列;根据所述数据转换操作,确定用于辅助理解操作语义的上下文行和列;根据真实表格中的行列排列顺序,将所述数据转换操作相关的行和列、用于辅助理解操作语义的上下文行和列填入所述二维数据表内。4.根据权利要求1所述的可视化方法,其特征在于,根据所述行和列,从所述真实表格中挑选出与所述数据转换操作语义相关的行列单元格数据,包括:根据所述行列单元格的长度,挑选出长度小于设定阈值的行列单元格作为与所述数据转换操作语义相关的行列单元格数据,其中挑选出的行列单元格数据不重复。5.根据权利要求1所述的可视化方法,其特征在于,在所述二维数据表的外围填入与所述数据转换操作语义相关的非真实表格数据,包括:在所述二维数据表外围的第一区域填入表名;在所述二维数据表外围的第二区域填入对数据转换操作语义的文本描述;当所述数据转换操作指定了具体的行或列索引号时,在所述二维数据表或外围的第三区域填入完整的行或列索引号。6.根据权利要求1所述的可视化方法,其特征在于,根据所述数据转换操作,为所述二
维数据表中的单元格进行颜色的编码,包括:将所述二维数据表中的表头所在的单元格的背景颜色设为第...
【专利技术属性】
技术研发人员:巫英才,熊凯,傅四维,王永恒,罗实,张璠璠,于榕,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。