The invention discloses a modular public opinion monitoring method and system for network public opinion events. Firstly, the network social platform is divided into several modules for monitoring; secondly, the active number of public opinion in each module platform in each period of time is acquired regularly, the main topics of public opinion are predicted and the active degree of module topics is calculated; and the topics whose active degree exceeds the threshold value are acquired. The overall information of the topic is included in the list of key public opinion; all modules are integrated to obtain the number of topics of each public opinion module, which is used to redistribute the weight of each module; then all public opinion information under the topic is obtained, and each public opinion information is clustered and classified to obtain the basic public opinion analysis report; finally, samples of public opinion are extracted proportionally and put into the integrated model. Practice training to predict the future trend of the topic of public opinion. The invention can detect the outbreak of major public opinion events in the first time, obtain real-time public opinion information, and predict the next trend of public opinion.
【技术实现步骤摘要】
针对网络舆情事件的基于模块化的舆情监测方法及系统
本研究属于计算机
,具体属于计算机学科中的机器学习、数据挖掘以及模块化权重的
;涉及一种基于集成方法的舆情预测方法及系统,具体涉及一种针对重大网络舆情事件的基于模块化的舆情监测方法及系统。
技术介绍
机器学习(MachineLearning)是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。数据挖掘(英语:Datamining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。模型集成的主要思路是先通过一定的规则生成多个学习器,再采用某种集成策略进行组合,最后综合判断输出最终结果。一般而言,通常所说的集成学习中的多个学习器都是同质的"弱学习器"。基于该弱学习器,通过样本集扰动、输入特征扰动、输出表示扰动、算法参数扰动等方式生成多个学习器,进行集成后获得一个精度较好的"强学习器"。随着集成学习研究的深入,其广义的定义逐渐被学者们所接受,它是指对多个学习器集合采用学习的方式,而不对学习器性质加以区分。根据这一定义,多学习器系统(multi-classifiersystem)、多专家混合(mixtureofexperts)以及基于委员 ...
【技术保护点】
1.一种针对网络舆情事件的基于模块化的舆情监测方法,其特征在于,包括以下步骤:步骤1:将网络社交平台分为若干模块进行监控;步骤2:定时获取每个时间段内各个模块平台内的舆情活跃数,并预测舆情的舆情主要话题并计算模块话题活跃度;步骤3:获取话题活跃度超过界限值的话题整体信息,并列入重点舆情列表;步骤4:对所有模块进行整合,获取每个舆情模块的话题数量,用来重新分配每个模块的权重;步骤5:获取该话题下所有舆情信息,对每个舆情信息进行聚类分类操作,得到基本的舆情分析报告;步骤6:根据步骤4中获得的每个模块的权重,按比例抽取舆情样本放入集成模型进行训练,预测未来该舆情话题的走向。
【技术特征摘要】
1.一种针对网络舆情事件的基于模块化的舆情监测方法,其特征在于,包括以下步骤:步骤1:将网络社交平台分为若干模块进行监控;步骤2:定时获取每个时间段内各个模块平台内的舆情活跃数,并预测舆情的舆情主要话题并计算模块话题活跃度;步骤3:获取话题活跃度超过界限值的话题整体信息,并列入重点舆情列表;步骤4:对所有模块进行整合,获取每个舆情模块的话题数量,用来重新分配每个模块的权重;步骤5:获取该话题下所有舆情信息,对每个舆情信息进行聚类分类操作,得到基本的舆情分析报告;步骤6:根据步骤4中获得的每个模块的权重,按比例抽取舆情样本放入集成模型进行训练,预测未来该舆情话题的走向。2.根据权利要求1所述的针对网络舆情事件的基于模块化的舆情监测方法,其特征在于:步骤2中,利用分类集成方法预测舆情的舆情主要话题并计算模块话题活跃度;其中第i个模块话题活跃度ai计算公式为:3.根据权利要求1所述的针对网络舆情事件的基于模块化的舆情监测方法,其特征在于:步骤4中,权重计算公式为4.根据权利要求1所述的针对网络舆情事件的基于模块化的舆情监测方法,其特征在于:步骤5中,利用聚类分类等方法对每个舆情信息的发表的时间、地理位置、用户年龄、性别、职业进行聚类分类操作,得到基本的舆情分析报告。5.根据权利要求1-4任意一项所述的针对网络舆情事件的基于模块化的舆情监测方法,其特征在于:步骤6中所述的集成模型,构建方法为:...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。