【技术实现步骤摘要】
本专利技术涉及数据融合领域,特别是涉及一种多源数据融合系统和方法。
技术介绍
随着信息系统和互联网的使用,各企事业单位拥有了大规模的数据。这些大规模的数据,促使人们不断使用新的方法和工具来对这些数据进行分析。大数据具有四个维度(简称为4V):容量(Volume);高速(Velocity);多样(Variety);真实性(Veracity)。相应地,大数据具有四个特点,即数据体量大,数据增加和变化快,数据来源和类型繁多,以及数据的真实性难以保证。大数据往往是由来源不同的数据归集而来,具有不同的数据模式以及数据表示方法。如何将这些数据融合起来是大数据研究的核心问题。数据融合通常是指采集多个数据源,将这些多个数据源合并成一个一致的数据存储,如存放在数据仓库中。良好的数据融合方法有助于减少数据集的冗余和不一致,可以大大提高数据挖掘过程的准确性和速度。随着近年来互联网、移动互联网、新社交媒体的发展,用户成为商业行为的主宰者。随之而来的,用户(例如消费者,企业等)个性化的需求也越来越凸显,如何通过对多源数据进行数据融合以形成有效的分析数据集,来更好地解决用户个性化的需求是目 ...
【技术保护点】
一种多源数据融合系统,其特征在于,包括:数据来源子系统,用于采集多源数据;场景规则库,用于存储基于不同场景设定的场景规则;数据融合子系统,用于将所述多源数据进行数据融合,形成分析数据集,根据所述场景规则关联所述分析数据集,输出基于所述场景规则的融合数据库;融合数据库子系统,用于存储基于所述场景规则的融合数据库。
【技术特征摘要】
1.一种多源数据融合系统,其特征在于,包括:数据来源子系统,用于采集多源数据;场景规则库,用于存储基于不同场景设定的场景规则;数据融合子系统,用于将所述多源数据进行数据融合,形成分析数据集,根据所述场景规则关联所述分析数据集,输出基于所述场景规则的融合数据库;融合数据库子系统,用于存储基于所述场景规则的融合数据库。2.根据权利要求1所述的系统,其特征在于,所述场景规则包括行为类型规则、行为相似规则、时间串联规则和地点邻近规则中的一种或多种。3.根据权利要求1所述的系统,其特征在于,所述数据融合子系统具体包括:属性归集子模块,用于读取所述数据来源子系统中的多源数据,所述多源数据由不同的数据库中的数据表组成,按照所述数据表的属性进行分类和记录,存储到元模型数据库的不同的数据表中;实体识别子模块,用于识别所述元模型数据库的不同的数据表的相同/相似属性的字段并进行合并;数据去冗子模块,用于去除合并后的数据表中的冗余字段,形成分析数据集;数据关联子模块,用于根据所述场景规则关联所述分析数据集,输出基于所述场景规则的融合数据库。4.根据权利要求1-3任一所述的系统,其特征在于,所述融合数据库包括:行为融合数据库、信用融合数据库和异常融合数据库;其中,所述行为融合数据库包含以用户标识为关键字的消费/支付行为的融合数据库;...
【专利技术属性】
技术研发人员:程明强,王向阳,曹国梁,
申请(专利权)人:上海坤士合生信息科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。