一种网络热点分析方法及系统技术方案

技术编号:23558297 阅读:20 留言:0更新日期:2020-03-25 03:53
本发明专利技术实施例提供一种网络热点分析方法及系统。该方法包括:获取网络中的用户属性、网络属性和用户关联性数据;对用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;将用户属性和网络属性输入至预先训练好的网络关键词分类模型中,得到网络关键词分类模型输出的高频网络关键词分类结果;基于用户关联性数据,计算得到关键网络行为影响力;根据关键网络用户集合和关键网络行为影响力,对高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。本发明专利技术实施例通过采用改进神经网络算法的智能决策分析方法,实现了分析稳定性较强,达到了减少影响分析结果的目的,并且算法学习速度明显加快,准确性大大提高。

A network hotspot analysis method and system

【技术实现步骤摘要】
一种网络热点分析方法及系统
本专利技术涉及大数据应用
,尤其涉及一种网络热点分析方法及系统。
技术介绍
随着网络的兴起和网络技术的普及,互联网时代的来临,各种移动设备的出现,为人们的生活增添了更多便捷的入网形式,从最初的QQ到现有的微信、微博、博客再到论坛,各类社交网络平台迅猛发展。人们生活日益简便,同时用户亦能方便地从社交网络平台获得所需信息,将自己的观点分享给大家,或者直接参加不同种类话题的研究分析,与其他用户进行沟通,人们对网络事件参与度越来越高。如朋友圈、微博的使用,其中微博信息的使用量达到上亿条,每类微博话题均有上百亿的阅读量,用户活跃量逐渐增加。而随着数据量的快速增加,传统系统已无法满足网络热点分析要求。而如何在超大数据量面前快速准确地分析网络热点成为一个重要的话题。一方面,如何对大量数据进行有效存储及快速检索是该领域面临的一大挑战;另一方面,从海量数据里面如何快速获取及计算所需的网络热点特征,也是该领域关注的重点。
技术实现思路
本专利技术实施例提供一种网络热点分析方法及系统,用以解决现有技术中用于分析网络热点的方法存在不稳定性,且存在输出的分析结果不准确的问题。第一方面,本专利技术实施例提供一种网络热点分析方法,包括:获取网络中的用户属性、网络属性和用户关联性数据;对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;将所述用户属性和所述网络属性输入至预先训练好的网络关键词分类模型中,得到所述网络关键词分类模型输出的高频网络关键词分类结果;其中所述网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;基于所述用户关联性数据,计算得到关键网络行为影响力;根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。优选地,所述获取网络中的用户属性、网络属性和用户关联性数据,具体包括:调用网络平台的API,采用网络爬虫算法采集所述用户属性、所述网络属性和所述用户关联性数据。优选地,所述对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合,具体包括:消除无关联的用户属性,结合关联的用户属性,计算用户自身的影响力,得到所述关键网络用户集合。优选地,所述网络关键词分类模型,通过以下步骤获得:获取网络话题数据,从所述网络话题数据中提取预定义文件,并基于预设条件从所述预定义文件中提取数据样本;将所述数据样本进行归一化处理,得到所述网络信息样本集合;获取关键词预设阈值,根据所述关键词预设阈值得到所述网络热点分类标签;按照所述网络热点分类标签将所述网络信息样本集合进行分类,生成用于训练的若干个数据集;获取改进的BP神经网络作为初始模型;将所述若干个数据集输入所述初始模型进行训练,得到所述网络关键词分类模型。优选地,所述基于所述用户关联性数据,计算得到关键网络行为影响力,具体包括:分析用户之间存在的影响概率,以及用户好友之间的联合影响概率,得到所述关键网络行为影响力。优选地,所述根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果,具体包括:根据所述关键网络用户集合设置现有网络的社交网络有向图;根据所述关键网络行为影响力构建现有的用户行为日志表;基于所述社交网络有向图和所述用户行为日志表,计算所述高频网络关键词分类结果的传播趋势,得到所述网络热点分析结果。优选地,该方法还包括:将分析得到的网络热点放入热点资源池;将分析得到的网络非热点经过预设时间段验证后,若满足网络热点条件,则将所述网络非热点放入所述热点资源池,否则,放入历史数据集。第二方面,本专利技术实施例提供一种网络热点分析系统,包括:获取模块,用于获取网络中的用户属性、网络属性和用户关联性数据;预处理模块,用于对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;分类模块,用于将所述用户属性和所述网络属性输入至预先训练好的网络关键词分类模型中,得到所述网络关键词分类模型输出的高频网络关键词分类结果;其中所述网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;计算模块,用于基于所述用户关联性数据,计算得到关键网络行为影响力;分析模块,用于根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一项所述网络热点分析方法的步骤。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现任一项所述网络热点分析方法的步骤。本专利技术实施例提供的网络热点分析方法及系统,通过采用改进神经网络算法的智能决策分析方法,实现了分析稳定性较强,达到了减少影响分析结果的目的,并且算法学习速度明显加快,准确性大大提高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种网络热点分析方法流程图;图2为本专利技术实施例提供的智能决策分析示意图;图3为本专利技术实施例提供的智能决策分析神经网络模型图;图4为本专利技术实施例提供的用于微博热点的智能决策分析流程示意图;图5为本专利技术实施例提供的网络热点业务验证流程示意图;图6为本专利技术实施例提供的传统分析系统稳定性显示结果示意图;图7为本专利技术实施例提供的网络热点业务验证示意图;图8为本专利技术实施例提供的一种网络热点分析系统结构图:图9为本专利技术实施例提供的电子设备的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提出了一种网络热点分析方法,是基于改进的BP神经网络算法的智能决策分析方法,针对传统智能决策分析系统一直存在分析结果不准确、系统稳定性差的问题,提出并设计了基于改进BP神经网络算法的智能决策分析系统,通过改进BP神经网络算法,对原有系统进行了优化,同时对网络信息传播趋势分析模块、网络热点判本文档来自技高网...

【技术保护点】
1.一种网络热点分析方法,其特征在于,包括:/n获取网络中的用户属性、网络属性和用户关联性数据;/n对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;/n将所述用户属性和所述网络属性输入至预先训练好的网络关键词分类模型中,得到所述网络关键词分类模型输出的高频网络关键词分类结果;其中所述网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;/n基于所述用户关联性数据,计算得到关键网络行为影响力;/n根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。/n

【技术特征摘要】
1.一种网络热点分析方法,其特征在于,包括:
获取网络中的用户属性、网络属性和用户关联性数据;
对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;
将所述用户属性和所述网络属性输入至预先训练好的网络关键词分类模型中,得到所述网络关键词分类模型输出的高频网络关键词分类结果;其中所述网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;
基于所述用户关联性数据,计算得到关键网络行为影响力;
根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。


2.根据权利要求1所述的网络热点分析方法,其特征在于,所述获取网络中的用户属性、网络属性和用户关联性数据,具体包括:
调用网络平台的API,采用网络爬虫算法采集所述用户属性、所述网络属性和所述用户关联性数据。


3.根据权利要求1所述的网络热点分析方法,其特征在于,所述对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合,具体包括:
消除无关联的用户属性,结合关联的用户属性,计算用户自身的影响力,得到所述关键网络用户集合。


4.根据权利要求1所述的网络热点分析方法,其特征在于,所述网络关键词分类模型,通过以下步骤获得:
获取网络话题数据,从所述网络话题数据中提取预定义文件,并基于预设条件从所述预定义文件中提取数据样本;
将所述数据样本进行归一化处理,得到所述网络信息样本集合;
获取关键词预设阈值,根据所述关键词预设阈值得到所述网络热点分类标签;
按照所述网络热点分类标签将所述网络信息样本集合进行分类,生成用于训练的若干个数据集;
获取改进的BP神经网络作为初始模型;
将所述若干个数据集输入所述初始模型进行训练,得到所述网络关键词分类模型。


5.根据权利要求1所述的网络热点分析方法,其特征在于,所述基于所述用户关联性数据,计算得到关键网络行为影响力,具体包括:
分析用户之间存在的影响概率,以...

【专利技术属性】
技术研发人员:王凯琢于洁
申请(专利权)人:北京天元创新科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1