The present invention provides an efficient network hot spot mining system, including the subsystem, storage subsystem, filtering subsystem and hot mining subsystem, the recommendation subsystem uses micro-blog users for network data is recommended, the storage subsystem to store network data of micro-blog users recommended, the filter subsystem according to the filtering rules for filtering the network data, and extract the center word from the network data after filtering, the hot spot mining subsystem for the number of statistical center words, the number of words appear in the center of network hotspot. The invention has the advantages that the realization of the network hot spot mining.
【技术实现步骤摘要】
一种高效的网络热点挖掘系统
本专利技术涉及网络热点挖掘
,具体涉及一种高效的网络热点挖掘系统。
技术介绍
随着互联网技术的发展,如何快速从互联网海量信息中获取网络热点,对于了解社会发展形势、掌握舆论动态起到指导性作用。现有热点挖掘技术存在挖掘效率低等问题。
技术实现思路
针对上述问题,本专利技术旨在提供一种高效的网络热点挖掘系统。本专利技术的目的采用以下技术方案来实现:提供了一种高效的网络热点挖掘系统,包括推荐子系统、存储子系统、过滤子系统和热点挖掘子系统,所述推荐子系统采用微博用户进行网络数据推荐,所述存储子系统对微博用户推荐的网络数据进行存储,所述过滤子系统根据过滤规则对所述网络数据进行过滤,并从过滤后的网络数据中提取中心词,所述热点挖掘子系统用于统计中心词的出现次数,出现次数多的中心词为网络热点。本专利技术的有益效果为:实现了网络热点高效挖掘。附图说明利用附图对本专利技术作进一步说明,但附图中的实施例不构成对本专利技术的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。图1是本专利技术的结构示意图;附图标记: ...
【技术保护点】
一种高效的网络热点挖掘系统,其特征在于,包括推荐子系统、存储子系统、过滤子系统和热点挖掘子系统,所述推荐子系统采用微博用户进行网络数据推荐,所述存储子系统对微博用户推荐的网络数据进行存储,所述过滤子系统根据过滤规则对所述网络数据进行过滤,并从过滤后的网络数据中提取中心词,所述热点挖掘子系统用于统计中心词的出现次数,出现次数多的中心词为网络热点。
【技术特征摘要】
1.一种高效的网络热点挖掘系统,其特征在于,包括推荐子系统、存储子系统、过滤子系统和热点挖掘子系统,所述推荐子系统采用微博用户进行网络数据推荐,所述存储子系统对微博用户推荐的网络数据进行存储,所述过滤子系统根据过滤规则对所述网络数据进行过滤,并从过滤后的网络数据中提取中心词,所述热点挖掘子系统用于统计中心词的出现次数,出现次数多的中心词为网络热点。2.根据权利要求1所述的高效的网络热点挖掘系统,其特征在于,所述网络数据包括文本标题、与文本标题对应的文本内容和文本的发布时间。3.根据权利要求2所述的高效的网络热点挖掘系统,其特征在于,所述过滤规则为:对文本标题不符合字数和发布时间不符合规定的网络数据进行剔除。4.根据权利要求3所述的高效的网络热点挖掘系统,其特征在于,所述推荐子系统包括垃圾用户发现模块、垃圾用户剔除模块和推荐模块,所述垃圾用户发现模块用于确定微博垃圾用户,所述垃圾用户剔除模块用于对垃圾用户进行剔除,所述推荐模块采用剔除垃圾用户后的微博用户进行网络数据推荐,所述垃圾用户发现模块包括第一建模子模块、第二用户分类子模块和第三垃圾用户确定子模块,所述第一建模子模块用于建立微博用户网络模型,所述第二用户分类子模块基于微博用户网络模型对微博用户进行分类,所述第三垃圾用户确定子模块基于用户分类确定微博用户中的垃圾用户;所述微博用户网络模型基于用户关注关系建立,具体为:将微博中用户关注关系形成的有向图H=(W,B)作为微博用户网络模型,其中,B为边集,如果用户存在关注关系,则用户之间存在边,W为微博用户集合。5.根据权利要求4所述的高效的网络热点挖掘系统,其特征在于,所述第二用户分类子模块包括第一分类特征确定单元和第二分类单元,所述第一分类特征确定单元用于确定用于分类的特征,所述第二分类单元用于根据分类特征确定用户类别;所述第一分类特征确定单元包括第一垃圾用户分类特征确定子单元和第二正常用户分类特征确定子单元,所述第一垃圾用户分类特征确定子单元用于确定判定垃圾用户的特征,所述第二正常用户分类特征确定子单元用于确定判定正常用户的特征;所述判定垃圾用户的特征包括第一垃圾用户特征EH1和第二垃圾用户特征EH2;采用以下方式确定所述第一垃圾用户特征:计算用户的第一垃圾用户特征指数:上述式子中,p(xi)表示将用户的时间序列划分为m个子序列,第xi个子序列发表消息数目占总时间序列的比值,若YW1≥CS1,则该用户满足第一...
【专利技术属性】
技术研发人员:孟玲,
申请(专利权)人:深圳源广安智能科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。