一种基于Hadoop的HA机制集群精准广告推送方法技术

技术编号：17940691 阅读：26 留言：0更新日期：2018-05-15 20:52

本发明专利技术公开了一种基于Hadoop的HA机制集群精准广告推送方法，首先组建一个工作群,在工作群中安装相应的软件搭建的平台其次采集社交网络信息；第三,对采集到的社交网络数据进行分词处理、词汇权值计算、出现频率较大的关键词抽取；第四根据提取关键词权值进行排序；第五对排序的结果分析用户的关注喜好，当用户登陆社交网络时选取合适的时机合适的地方对用户推送相应的广告。本发明专利技术利用框架中运算模型的特点,能够准确地判断出社交网络用户的关注热点,使广告能更精准地推送到目标客户，使挖掘结果更能反映互联网舆论的客观事实,有较强的可扩展性和容错性。

A Hadoop based HA mechanism cluster precise advertising push method

The invention discloses a Hadoop based HA mechanism cluster precision advertising push method. First, a working group is set up, and the corresponding software platform is installed in the work group to collect the social network information. Third, the word segmentation processing, the weight calculation of the vocabulary, the higher frequency of the social network data are made. Key words extraction; fourth according to the extraction of keyword weight value to sort; fifth to analyze the result of the ranking of users to analyze the interest of the user, when users log in the social network to select the appropriate time appropriate place to push the appropriate advertising for the user. Using the characteristics of the operational model in the framework, the invention can accurately determine the focus of attention of social network users, make the advertising more accurate to the target customers, and make the mining results more able to reflect the objective facts of the Internet public opinion, and have strong scalability and fault tolerance.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Hadoop的HA机制集群精准广告推送方法
本专利技术涉及社交网络中数据挖掘领域，特别涉及一种基于Hadoop的HA机制集群精准广告推送方法。
技术介绍
近年来，随着宽带互联网的迅速发展以及网民数量不断攀升，越来越多的人乐于刷微博、逛知乎和玩人人。人们也习惯于写博客、记日志和看网页，网络信息的急剧上升影响着社会生活的方方面面。互联网上的广告推送服务迎来了新的商机，己经得到了众多的门户网站、购物网站以及社交网站等的关注。在互联网广告推送服务中，网站将其广告位以有偿使用的方式提供给广告主投放广告。广告主在使用广告推送服务时，一方面希望提高产品广告的推送效果，即将广告及时准确地推送给对此类产品感兴趣的目标客户；另一方面，还希望扩大广告推送的范围，即将广告推送给更多的目标客户。
技术实现思路
本专利技术的主要目的在于克服现有技术的缺点与不足，提供一种基于Hadoop的HA机制集群精准广告推送方法，能够有效克服单机在处理大数据时空间以及速度方面的不足。本专利技术的目的通过以下的技术方案实现：一种基于Hadoop的HA机制集群精准广告推送方法，包含以下步骤：步骤一、基本工作群创建(1)为工作组中每一台虚拟机安装基于RedHatLinux的CentOS操作系统；(2)为工作组中每一台虚拟机配置主机名，通过命令vi/etc/sysconfig/network修改文档；(3)为工作组中每一台虚拟机配置IP，通过命令vi/etc/sysconfig/network-scripts/ifcfg-eth0将IP地址设置为静态且开机启动并配置IP地址和子网掩码。(4)为了集群运...
一种基于Hadoop的HA机制集群精准广告推送方法

【技术保护点】
一种基于Hadoop的HA机制集群精准广告推送方法，其特征在于，包括如下步骤：步骤S1、基本工作群创建：在计算机中安装VMware Workstation Pro虚拟系统软件，在VMware Workstation Pro中安装一个以上的基于Red Hat Linux的CentOS系统虚拟机；配置每个机子的IP网络和Hostname使之与PC机在同一个网段内；步骤S2、组建Hadoop的HA机制集群平台：将Hadoop安装包上传到服务器，在每台虚拟机上安装Hadoop软件并对Hadoop的5个配置文件hadoop‑env.sh、core‑site.xml、hdfs‑site.xml、mapred‑site.xml、yarn‑site.xml进行配置；安装相关的依赖软件并配置环境变量，选取指定虚拟机配置NameNode、DataNode、JournalNode、Zookeeper；步骤S3、社交网络数据采集：利用社交网络开放的API接口采集社交网络用户数据；其中,所述的社交网络用户数据包括用户发布的内容、用户信息、文章信息、留言信息；将采集当天的社交网络数据使用分布式文件命令一将数据集上...

【技术特征摘要】
1.一种基于Hadoop的HA机制集群精准广告推送方法，其特征在于，包括如下步骤：步骤S1、基本工作群创建：在计算机中安装VMwareWorkstationPro虚拟系统软件，在VMwareWorkstationPro中安装一个以上的基于RedHatLinux的CentOS系统虚拟机；配置每个机子的IP网络和Hostname使之与PC机在同一个网段内；步骤S2、组建Hadoop的HA机制集群平台：将Hadoop安装包上传到服务器，在每台虚拟机上安装Hadoop软件并对Hadoop的5个配置文件hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml进行配置；安装相关的依赖软件并配置环境变量，选取指定虚拟机配置NameNode、DataNode、JournalNode、Zookeeper；步骤S3、社交网络数据采集：利用社交网络开放的API接口采集社交网络用户数据；其中,所述的社交网络用户数据包括用户发布的内容、用户信息、文章信息、留言信息；将采集当天的社交网络数据使用分布式文件命令一将数据集上传至Hadoop的HA机制集群平台的各个节点上；步骤S4、词条统计：词条统计就是对采集的社交网络内容进行分词处理,选取产品相关的关键词条,统计词条在用户在社交网络发布每条内容的词条数和词条出现总数，然后对采集信息在Hadoop的HA机制集群平台建立索引；步骤S5、词条排序：根据统计到词条的数量，通过TF-IDF算法算出每个词条的权值；步骤S6、广告推送：对每个词条的权值进行排序，选取对应的广告对用户进行推送。2.根据权利要求1所述基于Hadoop的HA机制集群精准广告推送方法，其特征在于，所述步骤S1具体为：(1)为工作组中每一台虚拟机安装基于RedHatLinux的CentOS操作系统；(2)为工作组中每一台虚拟机配置主机名，通过命令修改文档；所述命令包括vi/etc/sysconfig/network；(3)为工作组中每一台虚拟机配置IP，通过命令将IP地址设置为静态且开机启动并配置IP地址和子网掩码；所述命令包括vi/etc/sysconfig/network-scripts/ifcfg-eth0；(4)通过命令serviceiptablesstop将所有的虚拟机的防火墙关闭；(5)为工作组中每一台虚拟机制作本地YUM源，利用配置好的YUM源安装相关软件。3.根据权利要求1所述基于Hadoop的HA机制集群精准广告推送方法，其特征在...

【专利技术属性】
技术研发人员：柯峰，梁烜彰，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人