【技术实现步骤摘要】
多源数据融合方法、装置、计算机设备及存储介质
本专利技术涉及大数据
,尤其涉及多源数据融合方法、装置、计算机设备及存储介质。
技术介绍
传统的统计分析经常是对单一数据源(例如:营销数据、行政报表、问卷调查、人口普查等)进行深入的追踪和分析。分析人员对数据的来源和结构有一定的控制和深层的了解。在大数据时代,海量的数据源是多样化通常是半结构或无结构的,要求数据科学家和分析师驾驭多样、多源的数据,将它们梳理后进行挖掘和分析。在这个过程中,数据融合(datablending)就成为不可或缺的一步。数据融合的另一个价值就是新规律新价值的发现。以前的用户信用主要基于用户是否有历史借贷违约来评定的,但很多人无借贷关系数据,因此无法准确获取用户信用。现有的数据融合方法存在数据来源覆盖度差、准确度低的问题。
技术实现思路
针对现有数据融合方法存在的数据覆盖度差、准确度低的问题,现提供一种旨在可提高数据覆盖度以及融合准确度的多源数据融合方法、装置、计算机设备及存储介质。为实现上述目的,本专利技术提供一种 ...
【技术保护点】
1.一种多源数据融合方法,其特征在于,包括:/n采集目标对象的至少两种数据源,每一种数据源关联一种数据属性;/n依据预设标签集合提取每一种所述数据源中相应的目标子元素,每一个所述目标子元素对应一个预设标签;/n将所述目标子元素依据所述预设标签输入到融合模型中,以获取目标父元素;/n对所有的所述目标父元素进行分析,生成所述目标对象的预测信息。/n
【技术特征摘要】
1.一种多源数据融合方法,其特征在于,包括:
采集目标对象的至少两种数据源,每一种数据源关联一种数据属性;
依据预设标签集合提取每一种所述数据源中相应的目标子元素,每一个所述目标子元素对应一个预设标签;
将所述目标子元素依据所述预设标签输入到融合模型中,以获取目标父元素;
对所有的所述目标父元素进行分析,生成所述目标对象的预测信息。
2.根据权利要求1所述的多源数据融合方法,其特征在于,在所述依据预设标签集合提取每一种所述数据源中相应的目标子元素之前,还包括:
对所述数据源的数据进行预处理;
所述预处理为对所述数据源中的数据进行清洗和转换。
3.根据权利要求1所述的多源数据融合方法,其特征在于,所述融合模型包括多个融合公式,所述融合公式由与所述预设标签对应的子元素变量、运算逻辑和目标父元素组成;
每一种所述数据属性与至少一个所述融合公式关联。
4.根据权利要求3所述的多源数据融合方法,其特征在于,所述将所述目标子元素依据所述预设标签输入到融合模型中,以获取目标父元素,包括:
根据所述目标子元素对应的所述预设标签,将所述目标子元素与融合公式中与所述预设标签对应的子元素变量替换,依据相应的运算逻辑计算所述目标父元素。
5.根据权利要求1所述的多源数据融合方法,其特征在于,所述对所有的所述目标父元素进行分析,生成所述目标对象的预测信息,包括:
将每个所述目标父元素分别映射到相应的区间表单中,获取与所述目标父元素关联的阈值区间及相应的置信度;
其中,所述区间表单包括阈值区间以及与所述阈值区间关联的置信度;
对所有的所述目标父元素关联的阈值区间进行分析,生成所述目标对象的预测信息。
6.根据权利要求5所述的多源数据融合方法,其特征在于,所述对所有的所述目标父元素关联的阈值区间进行分析,生成所述目标...
【专利技术属性】
技术研发人员:吴满芳,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。