数据处理方法、装置、设备和存储介质制造方法及图纸

技术编号:20272573 阅读:28 留言:0更新日期:2019-02-02 03:40
本发明专利技术实施例公开了一种数据处理方法、装置、设备和存储介质,该方法包括:获取两个或两个以上的数据集,数据集中的数据包括字段名称和字段值;根据两个或两个以上的数据集中数据的字段值确定数据交集;将两个或两个以上的数据集和数据交集合并进行可视化展示。本发明专利技术实施例根据数据集中数据的字段值确定数据交集并进行可视化展示,提高了数据交集可视化展示的准确性,可以直观地表达参与计算的数据集及结果数据集间的结果关系和来源关系,帮助数据应用方更容易理解数据间的关系意义和价值表达。

【技术实现步骤摘要】
数据处理方法、装置、设备和存储介质
本专利技术实施例涉及数据处理技术,尤其涉及一种数据处理方法、装置、设备和存储介质。
技术介绍
数据可视化技术已经成为用户使用数据的一种重要方式。目标,用户普遍利用条形图、直方图、趋势图和饼图等传统图表展现客户分布、商品价格趋势和市场区域占比等业务,也会利用树图、热力图、标签云、气泡图(BubbleChart)、弦图(ChordDiagram)和维诺图(VoronoiDiagram)等图表达多维的数据分布、数据占比和数据关系等。但是现有技术中一般采用字段名称计算数据交集,准确性低,影响数据交集的可视化结果,从而造成用户在应用数据交集结果数据时很不方便,不能直观且正确地使用户理解数据的业务意义,也降低了数据的应用效率和价值表达。
技术实现思路
本专利技术实施例提供了一种数据处理方法、装置、设备和存储介质,可以解决现有技术中准确性不高的问题。第一方面,本专利技术实施例提供了一种数据处理的方法,包括:获取两个或两个以上的数据集,所述数据集中的数据包括字段名称和字段值;根据所述两个或两个以上的数据集中数据的字段值确定数据交集;将所述两个或两个以上的数据集和所述数据交集合并进行可视化展示。第二方面,本专利技术实施例还提供了一种数据处理装置,该装置包括:数据集模块,用于获取两个或两个以上的数据集,所述数据集中的数据包括字段名称和字段值;数据交集模块,用于根据所述两个或两个以上的数据集中数据的字段值确定数据交集;可视化模块,用于将所述两个或两个以上的数据集和所述数据交集合并进行可视化展示。第三方面,本专利技术实施例还提供了一种设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的数据处理方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的数据处理方法。本专利技术实施例通过获取两个或两个以上的数据集,根据两个或两个以上的数据集中数据的字段值确定数据交集,并将两个或两个以上的数据集和数据交集合并进行可视化展示。本专利技术实施例根据数据集中数据的字段值确定数据交集并进行可视化展示,提高了数据交集可视化展示的准确性,可以直观地表达参与计算的数据集及结果数据集间的结果关系和来源关系,帮助数据应用方更容易理解数据间的关系意义和价值表达。附图说明图1为本专利技术实施例一中的数据处理方法的流程图;图2为本专利技术实施例一中的数据交集可视化展示示意图;图3为本专利技术实施例二中的数据处理方法的流程图;图4为本专利技术实施例三中的数据处理装置的结构示意图;图5为本专利技术实施例四中的设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一中的数据处理方法的流程图,本实施例可适用于实现数据处理的情况,该方法可以由数据处理装置执行,该装置可以采用软件和/或硬件的方式实现,例如,该装置可配置于设备中。如图1所示,该方法具体可以包括:S110、获取两个或两个以上的数据集,数据集中的数据包括字段名称和字段值。其中,数据集又称数据集合,是一种由数据所组成的集合,数据集中数据的数量本实施例中不作限定。数据集中的数据包括字段名称和字段值,字段名称用于表示该数据,字段值用于存储该数据具体的值,字段名称可以由字母、数字或标点符号组成,具体的字段名称本实施例中不做限定。示例性的,一个数据的字段名称可以为“LXR”,字段值可以为“一叶知秋”。本实施例中对数据集的来源也不作限定,例如数据集可以来自于互联网。S120、根据两个或两个以上的数据集中数据的字段值确定数据交集。具体的,若属于不同数据集的至少两个数据的字段值相同,则将该两个数据确定为数据交集中的数据,遍历全部的数据集,将字段值相同且属于不同数据集的数据的集合确定为数据交集。示例性的,若获取到两个数据集A和B,数据集A中包括的数据如表1所示,数据集B中包括的数据如表2所示。其中,数据集A包括5个数据,数据集B包括4个数据。表1数据集A的数据表数据集名称字段名称字段值AXx_number12345678AXx_name一叶知秋AMob_number13912345678ALXR王强ATXDZX市Y区西小口甲一号表2数据集B的数据表数据集名称字段名称字段值BeMailshili@ab.comBMobile_num13912345678Bname王先生BSHDZX市Y区西小口甲一号数据集A和数据集B的数据交集包括的数据如表3所示,数据交集中包括4个数据。表3数据交集的数据表字段值字段名称数据集名称13912345678Mob_numberA13912345678Mobile_numBX市Y区西小口甲一号TXDZAX市Y区西小口甲一号SHDZB参见表3,第一个数据和第二个数据的字段值相同而字段名称不同,第三个数据和第四个数据的字段值相同而字段名称也不同。本实施例中的通过字段值计算数据集的交集,可以避免字段名称相同但字段值不同引起的误差,提高准确率。S130、将两个或两个以上的数据集和数据交集合并进行可视化展示。具体的,可以利用视觉表达要素将两个或两个以上的数据集和数据交集合并进行可视化展示。视觉表达要素可以预置在数据处理装置中,视觉表达要素的类型本实施例中不作限定,例如两个或两个以上的数据集与数据交集的部局为上中下或左中右部局等,两个或两个以上的数据集与数据交集的背景色分别为浅蓝色、淡黄色、亮紫色或深蓝色等,两个或两个以上的数据集与数据交集的形状分别为椭圆形、矩形或圆形等。本实施例中也可以根据特定的业务需求和经验定义更直观和易理解的交集结果数据展现方式以便更满足用户的实际需求。示例性的,将上述表1、表2和表3对应的数据集A、数据集B和数据交集进行可视化展示的示意图如图2所示,图2为本专利技术实施例一中的数据交集可视化展示示意图。图2中左边背景为竖线的椭圆表示减去数据交集的数据集A,右边背景为横线的椭圆表示减去数据交集的数据集B,中间无背景的椭圆表示数据交集,图中的单方向箭头表示数据来源关系。需要说明的是,本实施例中针对的是数据集的数据交集的可视化展示,但可以理解的是本实施例的方法也适用于其他类型的数据处理,例如数据交集与并集的集合等,具体实施时可以根据需要进行调整。本实施例通过获取两个或两个以上的数据集,根据两个或两个以上的数据集中数据的字段值确定数据交集,并将两个或两个以上的数据集和数据交集合并进行可视化展示。本实施例中根据数据集中数据的字段值确定数据交集并进行可视化展示,提高了数据交集可视化展示的准确性,可以直观地表达参与计算的数据集及结果数据集间的结果关系和来源关系,帮助数据应用方更容易理解数据间的关系意义和价值表达。实施例二图3为本专利技术实施例二中的数据处理方法的流程图。本实施例在上述实施例的基础上,进一步优化了上述数据处理方法。相应的,本实施例的方法具体包括:S210、获取两个或两个以上的数据集,数据集中的数据包括字段名称和字段值。可选地,获取两本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:获取两个或两个以上的数据集,所述数据集中的数据包括字段名称和字段值;根据所述两个或两个以上的数据集中数据的字段值确定数据交集;将所述两个或两个以上的数据集和所述数据交集合并进行可视化展示。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取两个或两个以上的数据集,所述数据集中的数据包括字段名称和字段值;根据所述两个或两个以上的数据集中数据的字段值确定数据交集;将所述两个或两个以上的数据集和所述数据交集合并进行可视化展示。2.根据权利要求1所述的方法,其特征在于,所述获取两个或两个以上的数据集,包括:获取两个或两个以上的原始数据集;将各原始数据集中的数据按照字段值的类型进行分类;将分类后的各原始数据集排序,得到对应的数据集。3.根据权利要求2所述的方法,其特征在于,根据所述两个或两个以上的数据集中数据的字段值确定数据交集,包括:将所述两个或两个以上的数据集进行归并,得到目标数据集;顺序比较所述目标数据集中数据的字段值,将字段值相同的数据的集合确定为数据交集。4.根据权利要求1所述的方法,其特征在于,将所述两个或两个以上的数据集和所述数据交集合并进行可视化展示之前,还包括:根据所述两个或两个以上的数据集和所述数据交集中数据的数量,分别确定所述两个或两个以上的数据集和所述数据交集的可视化区域占比。5.根据权利要求4所述的方法,其特征在于,将所述两个或两个以上的数据集和所述数据交集合并进行可视化展示,包括:利用视觉表达要素将所述两个或两个以上的数据集和所述数据交集按照各所述可视化区域占比合并进行可视化展示,所...

【专利技术属性】
技术研发人员:万月亮于吉胜火一莽
申请(专利权)人:北京锐安科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1