【技术实现步骤摘要】
本专利技术涉及数据湖、因果推断和数据管理的,特别是涉及一种因果关系数据湖构建方法、系统、电子设备及介质。
技术介绍
1、在数据驱动的决策过程中,了解因果关系对于分析和预测具有重要意义,现有的分析工具和方法在处理因果关系分析时面临数据来源分散、分析效率低下等问题。
技术实现思路
1、本专利技术的目的是提供一种因果关系数据湖构建方法、系统、电子设备及介质,可解决现有因果分析方法数据来源分散、分析效率低下,以及数据湖本身不具备数据间因果关系的问题。
2、为实现上述目的,本专利技术提供了如下方案:
3、一种因果关系数据湖构建方法,包括:
4、获取数据湖中各因果分析来源表;所述因果分析来源表为要进行因果分析的表;
5、将获取的各因果分析来源表按照共同项进行合并得到合成来源表并存储在数据湖中;所述合成来源表中包括所有属性的值;对于列级分析,所述属性包括合成来源表中所有内容为数值型的列对应的属性;对于字段级分析,所述属性包括合成来源表中内容为string类
...【技术保护点】
1.一种因果关系数据湖构建方法,其特征在于,包括:
2.根据权利要求1所述的因果关系数据湖构建方法,其特征在于,所述因果算法包具体为:CDT工具包。
3.根据权利要求1所述的因果关系数据湖构建方法,其特征在于,根据各所述因果边的ID和预设全局唯一因果关系ID得到因果关系表中的信息和来源关系表中的信息,并将因果关系表中的信息增添到构建的因果关系表中,将来源关系表中的信息增添到构建的来源信息表中,且将所述因果关系表和所述来源信息表存储在数据湖中,实现因果关系数据湖构建,之后还包括:
4.一种因果关系数据湖构建系统,其特征在于,包括:
...【技术特征摘要】
1.一种因果关系数据湖构建方法,其特征在于,包括:
2.根据权利要求1所述的因果关系数据湖构建方法,其特征在于,所述因果算法包具体为:cdt工具包。
3.根据权利要求1所述的因果关系数据湖构建方法,其特征在于,根据各所述因果边的id和预设全局唯一因果关系id得到因果关系表中的信息和来源关系表中的信息,并将因果关系表中的信息增添到构建的因果关系表中,将来源关系表中的信息增添到构建的来源信息表中,且将所述因果关系表和所述来源信息表存储在数据湖中,实现因果关系数据...
【专利技术属性】
技术研发人员:王琪,刘昊,张涛,陈巍,刘荫隆,郁晨熹,王朋,刘哲峰,陈志凌,
申请(专利权)人:南湖实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。