一种基于用户浏览轨迹推的大数据建模系统技术方案

技术编号：23851988 阅读：42 留言：0更新日期：2020-04-18 09:07

本发明专利技术提供一种基于用户浏览轨迹推的大数据建模系统，包括应用层，将各业务系统通过各终端基于BI实时上报用户行为作为维度数据，并将维度数据存储于mysql、oracle、mongodb数据库中；数据层，将各业务系统的维度数据通过Kafka作为统一采集平台的消息管理层，采集汇总到总数据仓库oracle中；清洗过滤层，将总数据仓库oracle中的数据进行清洗、沉淀、标注、归类、纠错来重新规范化数据源，并进行全新定义、颗粒化、索引；AI数据中台，提供底层的服务架构，将清洗过滤层处理后的数据进行数据建模分析，为服务层提供底层维度数据；服务层，为各业务系统提供维度数据作为业务支撑；实现挖掘更有价值用户数据源，提高用户体验和使用率。

A big data modeling system based on user browsing trajectory push

全部详细技术资料下载

【技术实现步骤摘要】
一种基于用户浏览轨迹推的大数据建模系统
本专利技术属于大数据建模
，具体涉及一种基于用户浏览轨迹推的大数据建模系统。
技术介绍
目前已有的相关大数据建模系统很多，在数据的可扩展性和规模性都很大，能满足许多日常统计性行为。但是具体实际业务驱动很缺乏，无法更深层次挖掘潜在数据和商机。如今需要更完善更智能的数据平台，挖掘更有价值用户，减轻运营人员的工作压力，和提高资源利用率和使用率。
技术实现思路
本专利技术的目的是提供一种基于用户浏览轨迹推的大数据建模系统，以解决目前大数据中业务驱动的问题，实现挖掘更有价值用户数据源，提高用户体验和使用率。本专利技术提供了如下的技术方案：一种基于用户浏览轨迹推的大数据建模系统，包括：应用层，将各业务系统通过各终端基于BI实时上报用户行为作为维度数据，并将维度数据存储于mysql、oracle、mongodb数据库中；数据层，将各业务系统的维度数据通过Kafka作为统一采集平台的消息管理层，采集汇总到总数据仓库oracle中；清洗过滤层，将总数据仓库oracle中的数据进行清洗、沉淀、标注、归类、纠错来重新规范化数据源，并进行全新定义、颗粒化、索引；AI数据中台，提供底层的服务架构，将清洗过滤层处理后的数据进行数据建模分析，为服务层提供底层维度数据；服务层，为各业务系统提供维度数据作为业务支撑。进一步的，所述清洗过滤层先通过python处理总数据仓库oracle中部分异常数据源，再采用Hive作为数据清洗引擎，将用户行为及上下文模型数据进行...

【技术保护点】
1.一种基于用户浏览轨迹推的大数据建模系统，其特征在于，包括：/n应用层，将各业务系统通过各终端基于BI实时上报用户行为作为维度数据，并将维度数据存储于mysql、oracle、mongodb数据库中；/n数据层，将各业务系统的维度数据通过Kafka作为统一采集平台的消息管理层，采集汇总到总数据仓库oracle中；/n清洗过滤层，将总数据仓库oracle中的数据进行清洗、沉淀、标注、归类、纠错来重新规范化数据源，并进行全新定义、颗粒化、索引；/nAI数据中台，提供底层的服务架构，将清洗过滤层处理后的数据进行数据建模分析，为服务层提供底层维度数据；/n服务层，为各业务系统提供维度数据作为业务支撑。/n

【技术特征摘要】
1.一种基于用户浏览轨迹推的大数据建模系统，其特征在于，包括：
应用层，将各业务系统通过各终端基于BI实时上报用户行为作为维度数据，并将维度数据存储于mysql、oracle、mongodb数据库中；
数据层，将各业务系统的维度数据通过Kafka作为统一采集平台的消息管理层，采集汇总到总数据仓库oracle中；
清洗过滤层，将总数据仓库oracle中的数据进行清洗、沉淀、标注、归类、纠错来重新规范化数据源，并进行全新定义、颗粒化、索引；
AI数据中台，提供底层的服务架构，将清洗过滤层处理后的数据进行数据建模分析，为服务层提供底层维度数据；
服务层，为各业务系统提供维度数据作为业务支撑。

2.根据权利要求1所述的一种基于用户浏览轨迹推的大数据建模系统，其特征在于，所述清洗过滤层先通过python处理总数据仓库oracle中部分异常数据源，再采用Hive作为数据清洗引擎，将用户行为及上下文模型数据进行推理，进行数据预处理、加工、整合。

3.根据权利要求1所述的一种基于用户浏览轨迹推的大数据建模系统，其特征在于，所述AI数据中台中所述数据分析包括数据预处理和数据建模分析，所述数据预处理是从海量数据中提取可用特征，用Impala做数据预处理；所述数据建模分析是针对数据预处理提取的特征，用的机器学习算法包括决策树、协同过滤。

4.根据权利要求1所述的一种基于用户浏览轨迹推的大数据建模系统，其特征在于，所述AI数据中台通过多个服务器搭建Hadoop集群，Hadoop集群的框架核心为HDFS和MapReduce，HDFS是一个高度容错性系统，提高吞吐量的数据访问，同时利用了Impala的开源组件；通过Sqoop将数据从mysql、oracle、mongodb数据库中导入Hive；通过Zookeeper提供数据同步服务，Impala是对hive对一个补充，可以实现高效的sql查询。

5.根据权利要求4所述的一种基于用户浏览轨迹推的大数据建模系统，其特征在于，所述AI数据中台，包括：
兴趣源模块，基于MapReduce的数据预处理与聚合模块，用于对用户行为、实时上下文信息采用MapReduce并行模型进...

【专利技术属性】
技术研发人员：陆洋，
申请(专利权)人：江苏三六五网络股份有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人