数据分析方法、数据分析装置、电子设备及存储介质制造方法及图纸

技术编号:27059280 阅读:43 留言:0更新日期:2021-01-15 14:39
本申请适用于大数据技术领域,提供了一种数据分析方法、装置、电子设备及计算机可读存储介质,其中,该方法包括:通过预设的数据平台,获取至少一个原始数据流;根据数据类别对各个原始数据流进行分类;对分类后的所述原始数据流进行清洗,得到有效数据流;调用预设的分析工具,根据各个有效数据流之间的关联关系提取出目标有效数据,并对目标有效数据进行分析,以得到待分析维度下的分析图谱。通过上述方法,可提升数据分析的分析效率及分析准确率。

【技术实现步骤摘要】
数据分析方法、数据分析装置、电子设备及存储介质
本申请涉及大数据
,尤其涉及一种数据分析方法、数据分析装置、电子设备及计算机可读存储介质。
技术介绍
如今,由于宏观经济形势的变化及互联网金融公司的接连爆雷,导致金融案件处于高发态势。对于金融案件来说,其涉案当事人往往数量较多、群众挽损迫切。检察院在审查起诉阶段,往往会面临庞杂的卷宗和复杂的账目,并从中对案件进行分析。面对复杂的交易、海量的信息和繁琐的分析工作,传统的分析图谱仅仅作为一种数据导入工具,在人工选择下对部分或全部的案件进行分析,可能导致所获得的分析结果较为分散,难以获得场景化及系统化的分析结果。
技术实现思路
有鉴于此,本申请实施例提供了一种数据分析方法、数据分析装置、电子设备及计算机可读存储介质,可在分析前去除冗余数据,增强待分析的数据的关联性,以此提升数据分析的效率及准确率。本申请实施例的第一方面提供了一种数据分析方法,包括:通过预设的数据平台,获取至少一个原始数据流;根据数据类别对各个原始数据流进行分类;对分类后的上述原始数据流进行清洗,得到有效数据流;调用预设的分析工具,根据各个有效数据流之间的关联关系提取出目标有效数据,并对上述目标有效数据进行分析,以得到待分析维度下的分析图谱。本申请实施例的第二方面提供了一种数据分析装置,包括:获取单元,用于通过预设的数据平台,获取至少一个原始数据流;分类单元,用于根据数据类别对各个原始数据流进行分类;清洗单元,用于对分类后的上述原始数据流进行清洗,得到有效数据流;分析单元,用于调用预设的分析工具,根据各个有效数据流之间的关联关系提取出目标有效数据,并对上述目标有效数据进行分析,以得到待分析维度下的分析图谱。本申请实施例的第三方面提供了一种电子设备,包括存储器、处理器以及存储在上述存储器中并可在电子设备上运行的计算机程序,上述处理器执行上述计算机程序时实现第一方案提供的数据分析方法的各步骤。本申请实施例的第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现第一方案提供的数据分析方法的各步骤。通过实施本申请实施例提供的数据分析方法,首先通过预设的数据平台,获取至少一个原始数据流,然后根据数据类别对各个原始数据流进行分类,并对分类后的上述原始数据流进行清洗,得到有效数据流,再调用预设的分析工具,根据各个有效数据流之间的关联关系提取出目标有效数据,并对上述目标有效数据进行分析,以得到待分析维度下的分析图谱。上述过程中,通过对原始数据的分类操作,将原始数据流中所包含的原始数据进行归纳整理,使得原本无序的原始数据得以有序化;通过对原始数据的清洗操作,能够筛除掉无用的数据,使得清洗后仅保留对后续分析操作有意义的有效数据;且在数据分析前,基于有效数据流之间的关联关系提取出目标有效数据作为待分析的数据,可去除数据冗余,以此提升数据分析效率,获得场景化及结构化的分析结果。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的数据分析方法的实现流程图;图2是本申请实施例提供的数据分析方法中步骤102的实现流程图;图3是本申请实施例提供的数据分析方法中步骤104的实现流程图;图4是本申请实施例提供的数据分析方法中步骤104的另一实现流程图;图5是本申请实施例提供的数据分析方法中的资金交易关系网络图的实例图;图6是本申请实施例提供的一种数据分析装置的结构框图;图7是本申请实施例提供的一种电子设备的结构框图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请实施例所涉及的数据分析方法,可以应用于服务器、台式电脑、手机、平板电脑、可穿戴设备、车载设备、增强现实(augmentedreality,AR)/虚拟现实(virtualreality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobilepersonalcomputer,UMPC)、上网本、个人数字助理(personaldigitalassistant,PDA)等电子设备上,本申请实施例对电子设备的具体类型不作任何限制。请参阅图1,图1示出了本申请实施例提供的一种数据分析方法的实现流程图。如图1所示,本实施例提供的数据分析方法可以包括:步骤101,通过预设的数据平台,获取至少一个原始数据流。在本实施例中,电子设备可集成有数据分析系统,该数据分析系统可接入预设的数据平台。其中,数据平台指的是以存储、运算及展现作为目的平台,可提供针对某些特定数据类别的数据接入、数据处理及数据存储等服务。示例性地,每一数据平台已设定好各自的访问接口;之后,电子设备即可通过该访问接口访问各个数据平台中的数据,获得至少一个原始数据流。在一些实施例中,上述预设的数据平台的数量可以是一个、两个或多个,此处不对数据平台的数量作出限定。基于此,上述数据分析系统也可以采用分布式框架,以提高数据分析的并发。仅作为示例,本实施例中的原始数据流可以基于法院中的待分析案件,例如金融案件来获得,此处不作限定。其中,不同数据平台可基于同一待分析案件导入不同的原始数据流,例如,数据平台1可导入金融案件1的银行流水数据流;数据平台2可导入金融案件1的涉案人员数据流,此处不对不同数据平台所可以导入的原始数据流作出限定。在一些实施例中,电子设备可以在通过各个数据平台导入原始数据流后,对所获得的原始数据流作归纳整理。例如,将同属于一个金融案件的两条或多条原始数据流整合到一起,形成一条新的原始数据流。步骤102,根据数据类别对上述各个原始数据流进行分类。在本实施例中,原始数据流中所包含的数据即为原始数据。在一条原始数据流中,可能包含有属于不同类别的多项原始数据。仅作为示例,针对金融案件所获取到的银行流水数据流,其可包含有资金流出方、资金流入方、资金金额及资金流动时间等各项原始数据;这其中,资金流出方及资金流入方均属于涉案机构主体类别,资金金额属于交易金额类别,资金流动时间属于交易时间类别。由于各个原始数据流可能来源于不同的数据平台,而不同的原始数据流所包含的原始数据的数据类别会有所区别,导致原始数据流中的原始数据较为无序;基于此,本实施例中,可以对各个原始数据流所包含的原始数据进行分类,使得原本无序的原始数据得以有序化,得到各个原始数据所属的数据类别,以实现对原始数据流的分类。在一些实施例中,数据分析系统已预先划分有若干个数据类别。示例性本文档来自技高网...

【技术保护点】
1.一种数据分析方法,其特征在于,包括:/n通过预设的数据平台,获取至少一个原始数据流;/n根据数据类别对各个原始数据流进行分类;/n对分类后的所述原始数据流进行清洗,得到有效数据流;/n调用预设的分析工具,根据各个有效数据流之间的关联关系提取出目标有效数据,并对所述目标有效数据进行分析,以得到待分析维度下的分析图谱。/n

【技术特征摘要】
1.一种数据分析方法,其特征在于,包括:
通过预设的数据平台,获取至少一个原始数据流;
根据数据类别对各个原始数据流进行分类;
对分类后的所述原始数据流进行清洗,得到有效数据流;
调用预设的分析工具,根据各个有效数据流之间的关联关系提取出目标有效数据,并对所述目标有效数据进行分析,以得到待分析维度下的分析图谱。


2.根据权利要求1所述的数据分析方法,其特征在于,所述根据数据类别对各个原始数据流进行分类,包括:
分别对各个原始数据流中所包含的实词进行提取,得到各个原始数据流所包含的原始数据;
针对每个原始数据流,将所述原始数据流中所包含的各个原始数据分别与预设的至少一个数据类别进行匹配;
根据匹配结果,确定各个原始数据所属的数据类别,以实现对原始数据流的分类。


3.如权利要求1所述的数据分析方法,其特征在于,所述调用预设的分析工具,根据各个有效数据流之间的关联关系提取出目标有效数据,包括:
对所述有效数据流进行向量化处理,得到有效数据流向量;
基于预设的聚类算法构建聚类分析模型,并将所述有效数据流向量输入至所述聚类分析模型中,得到至少一个群组,每个群组包括至少一个有效数据流向量;
根据所述至少一个群组,提取出目标有效数据。


4.如权利要求3所述的数据分析方法,其特征在于,所述根据所述至少一个群组,提取出目标有效数据,包括:
根据所述聚类分析模型确定所述至少一个群组中的互斥群组及关联群组;
基于所述互斥群组及所述关联群组,在所述至少一个群组中确定目标群组;
将与所述目标群组中的有效数据流向量相关联的有效数据流确定为目标有效数据。


5.根据权利要求1所述的数据分析方法,其特征在于,若所述待分析维度为资金穿透分析维度,则所述对所述目标有效数据进行分析,以得到待分析维度下的分析图谱,包括:
基于所述目标有效数据,生成资金交易关系网络图;
监测是...

【专利技术属性】
技术研发人员:姚石傅君玉吴梁纯李俊杰常晋曦
申请(专利权)人:平安直通咨询有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1