一种基于hadoop平台构建用户标签信息的方法技术

技术编号:16644904 阅读:39 留言:0更新日期:2017-11-26 17:24
本发明专利技术公开了一种基于hadoop平台构建用户标签信息的方法,包括电商网站后台、智能电视终端、kafka消息系统、hadoop平台、hive数据仓库和全文搜索引擎平台,其方法如下:a、定义用户标签,b、采集用户相关业务数据,c、加载入hive数据仓库,d、生成hive标签中间表,e、中间结构加载入hbase,f、将hbase结果加载入全文搜索引擎平台,h、开发web界面展示用户画像。本发明专利技术基于采集到用户各渠道的行为数据,定义用户完整的标签体系,完成用户全景画像的构建。

A method of constructing user tag information based on Hadoop platform

The invention discloses a method for user label information construction based on Hadoop platform, including electricity supplier website backstage, intelligent TV terminal, Kafka message system, Hadoop platform, hive data warehouse and full-text search engine platform, the method is as follows: A, B, user defined tags, collect user related business data, C, loaded into hive data warehouse, D, to generate hive labels in the middle table, e, intermediate structure is loaded into HBase, F and HBase will be loaded into the search engine platform, h, development of web user interface to display the picture. The invention defines the user complete label system based on the behavior data collected from each channel of the user, and completes the construction of the panoramic portrait of the user.

【技术实现步骤摘要】
一种基于hadoop平台构建用户标签信息的方法
本专利技术涉及大数据应用
,尤其涉及一种基于hadoop平台构建用户标签信息的方法。
技术介绍
在互联网逐渐步入大数据时代后,不可避免的给企业及消费者行为带来一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是“可视化”的。随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,用户画像的概念也就应运而生。用户画像,作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了大数据时代的基石。构建用户画像,不仅可以完善产品运营,提升用户体验:改变以往闭门造车的生产模式,通过事先调研用户需求,设计制造更适合用户的产品,提升用户体验;还可以对外服务,提升盈利:根据产品特点,找到目标用户,在用户偏好的渠道上与其交互,促成购买,实现精准运营和营销。现有的用户画像构建技术无法充分体现用户的特征,或者用户全景画像,本专利技术解决了现有技术瓶颈,充分了解用户,为用户提供精细化服务,本文档来自技高网...
一种基于hadoop平台构建用户标签信息的方法

【技术保护点】
一种基于hadoop平台构建用户标签信息的方法,其特征在于:包括电商网站后台、智能电视终端、kafka消息系统、hadoop平台、hive数据仓库和全文搜索引擎平台,其方法如下:A、定义用户标签体系:根据场景描述定义如下用户标签:行政区域、价格段、直播频道、电影类型;所述行政区域为通过电商网站后台获取用户地址,所述价格段为通过电商后台获取用户购买的支付金额,所述直播频道为通过智能电视终端采集用户电视直播观看行为数据,所述电影类型为通过智能电视终端采集用户电视直播观看行为数据;B、根据步骤A中的标签体系采集用户相关业务数据:对于用户观看直播节目及点播行为数据,通过kafka消息系统以json字符...

【技术特征摘要】
1.一种基于hadoop平台构建用户标签信息的方法,其特征在于:包括电商网站后台、智能电视终端、kafka消息系统、hadoop平台、hive数据仓库和全文搜索引擎平台,其方法如下:A、定义用户标签体系:根据场景描述定义如下用户标签:行政区域、价格段、直播频道、电影类型;所述行政区域为通过电商网站后台获取用户地址,所述价格段为通过电商后台获取用户购买的支付金额,所述直播频道为通过智能电视终端采集用户电视直播观看行为数据,所述电影类型为通过智能电视终端采集用户电视直播观看行为数据;B、根据步骤A中的标签体系采集用户相关业务数据:对于用户观看直播节目及点播行为数据,通过kafka消息系统以json字符串的格式采集用户行为数据到hadoop平台,然后加载到hive数据仓库中;对于用户购买电视的交易记录,从电商后台数据库以文本的方式抽取数据到hadoop平台中,...

【专利技术属性】
技术研发人员:杜科唐军龚世宇曹梦麟
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1