The invention discloses a data processing system based on a large data platform, which includes: a data input unit for inputting various types of data; a user ID tagging unit for each type of input data corresponding to the user ID according to the different data input users; a user ID tagging unit for classifying various types of data and creating tags according to classification respectively. At the same time, the same user's label data is linked to the pull-through big data platform by user ID, and the corresponding label data is queried by user label portrait. The present invention can greatly improve the efficiency of data processing and reduce the time of data processing even when the amount of data is considerable. Moreover, through effective and reasonable classification labels, the hierarchical association between data is clear and orderly, and the function of fast query using label portraits and combination labels is provided, which is simple and fast, effectively improves the user's experience, and greatly strengthens the application value.
【技术实现步骤摘要】
基于大数据平台进行数据处理的系统及方法
本专利技术涉及大数据处理
技术介绍
目前,数据处理往往都是基于关系型数据库,大数据量的处理需要较长的时间和较多的金钱,超过一定数据量(例如TB级数据链)甚至无法处理,扩展性较弱。大数据(bigdata)指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。随着云时代的来临,大数据也吸引了越来越多的关注。因此,如何有效利用大数据技术对上述的数据进行处理,是本领域技术人员需要解决的技术问题。
技术实现思路
本专利技术的目的在于一种基于大数据平台进行数据处理的系统和方法,支持TB级的数据量处理,有效缩短处理时间。实现上述目的的技术方案是:本专利技术之一的基于大数据平台进行数据处理的系统,包括:用于输入各类数据的数据输入单元;根据数据输入用户的不同,对输入的各类数据分别标记对应用户ID的用户ID标记单元;将各类数据进行分类并按分类分别创建标签,同时通过用户ID将相同用户的各标签数据关联拉通的大数据平台;以及通过用户标签画像查询其对应的标签数据的用户标签查询单元。在上述的基于大数据平台进行数据处理的系统中,每个用户标签画像专属于一个用户,为用户ID或者特征标签。在上述的基于大数据平台进行数据处理的系统中,所述的用户ID为身份证号码,所述的特征标签为手机号码。在上述的基于大数据平台进行数据处理的系统中,还包括:通过输入标签组合查询符合条件的所有用户的标签数据的组合标签用户群查询单元。在上述的基于大数据平台进行数据处理的系统中,所述大数据平台包括:将标记了用户ID的各类数据进行存储的一级数据存储单元;将存储于所 ...
【技术保护点】
1.一种基于大数据平台进行数据处理的系统,其特征在于,包括:用于输入各类数据的数据输入单元;根据数据输入用户的不同,对输入的各类数据分别标记对应用户ID的用户ID标记单元;将各类数据进行分类并按分类分别创建标签,同时通过用户ID将相同用户的各标签数据关联拉通的大数据平台;以及通过用户标签画像查询其对应的标签数据的用户标签查询单元。
【技术特征摘要】
1.一种基于大数据平台进行数据处理的系统,其特征在于,包括:用于输入各类数据的数据输入单元;根据数据输入用户的不同,对输入的各类数据分别标记对应用户ID的用户ID标记单元;将各类数据进行分类并按分类分别创建标签,同时通过用户ID将相同用户的各标签数据关联拉通的大数据平台;以及通过用户标签画像查询其对应的标签数据的用户标签查询单元。2.根据权利要求1所述的基于大数据平台进行数据处理的系统,其特征在于,每个用户标签画像专属于一个用户,为用户ID或者特征标签。3.根据权利要求2所述的基于大数据平台进行数据处理的系统,其特征在于,所述的用户ID为身份证号码,所述的特征标签为手机号码。4.根据权利要求1所述的基于大数据平台进行数据处理的系统,其特征在于,还包括:通过输入标签组合查询符合条件的所有用户的标签数据的组合标签用户群查询单元。5.根据权利要求1或4所述的基于大数据平台进行数据处理的系统,其特征在于,所述大数据平台包括:将标记了用户ID的各类数据进行存储的一级数据存储单元;将存储于所述一级数据存储单元的各类数据进行分类的数据分类单元;将分类后的各类数据分别按所属类别分别创建相应...
【专利技术属性】
技术研发人员:何中,刘剑波,何登,戴建峰,严伟,巢振军,姚童,陈明敏,
申请(专利权)人:江苏中威科技软件系统有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。