一种弱信号事件挖掘生成系统及方法技术方案

技术编号:32464403 阅读:12 留言:0更新日期:2022-02-26 08:59
本发明专利技术公开了一种弱信号事件挖掘生成系统,包括敏感事件定义模块、数据库、信息采集模块、分类筛选模块、报告生成模块,敏感事件定义模块用于定义敏感事件,分为判断热度单元以及判断敏感单元,形成敏感事件信号特征,并发送至数据库,信息采集模块用于对符合计算时长窗口的全量内容信息做机器聚类和相应计算时长窗口的媒体类内容信息做机器聚类,形成一类聚类排序清单、二类聚类排序清单,并发送给数据库。本发明专利技术通过大数据的收集和分类筛选的方法更利于弱信号的敏感事件发现,及早挖掘尚未成为热点的敏感事件,为预警和处置提供更多时间与机会。与机会。与机会。

【技术实现步骤摘要】
一种弱信号事件挖掘生成系统及方法


[0001]本专利技术属于分析处理领域,尤其涉及一种弱信号事件挖掘生成系统。

技术介绍

[0002]热点事件很难进行预测,这决定了热点事件往往是一个“事后诸葛亮”的产物,一个热点事件从刚开始出现之时并没有带有成为热点的性质。究其本质而言,是因为这些事件本身就存在着高度传播性和敏感性,往往伴随着灾难性的后果,并且这种特性是一定的,只要发生了,就会成为焦点,原有更多偏向热点事件生成。为了提前预测事件的发生,得到警示和防范,我们对此做出改进,提出一种弱信号事件挖掘生成系统。

技术实现思路

[0003]本专利技术的目的在于克服现有技术存在的以上问题,提供一种弱信号事件挖掘生成系统,通过大数据的收集和分类筛选的方法更利于弱信号的敏感事件发现,及早挖掘尚未成为热点的敏感事件,为预警和处置提供更多时间与机会。
[0004]为实现上述技术目的,达到上述技术效果,本专利技术通过以下技术方案实现:一种弱信号事件挖掘生成系统,包括敏感事件定义模块、数据库、信息采集模块、分类筛选模块、报告生成模块;所述敏感事件定义模块用于定义敏感事件,分为判断热度单元以及判断敏感单元,形成敏感事件信号特征,并发送至数据库;所述信息采集模块用于对符合计算时长窗口的全量内容信息做机器聚类和相应计算时长窗口的媒体类内容信息做机器聚类,形成一类聚类排序清单、二类聚类排序清单,并发送给数据库;所述筛选模块用于将敏感特征信号、一类排序清单、二类排序清单从数据库中提取,产生敏感弱信号事件集并将最终结果发送给报告生成模块;所述报告生成模块用于将最终结果生成报告展示。
[0005]进一步地,所述筛选模块将一类排序清单与二类排序清单进行对比,分析判断一类排序清单信息是否和二类排序清单信息相重合,若不重合则生成使用集,再将使用集与敏感特征信号匹配筛选,产生最终集,若重合,则删除重合部分。
[0006]一种弱信号事件挖掘生成方法:A、敏感事件定义模块定义敏感事件,根据历史、专家知识形成敏感事件信号特征,包括从非实时交互数据中挖掘、从实时的交互数据中挖掘,对主流搜索引擎数据进行采集,对热度榜单数据进行筛选,制定热度浏览线,高于热度浏览线的进入敏感判断,根据人工判断、热度信息是否属于敏感信息,分出敏感信息和非敏感信息,再将敏感信息发送至数据库;B、信息采集模块对符合计算时长窗口的全量内容信息做机器聚类,确保信息扫描完整,信息内容不丢失,保证信息采集的全面性,形成一类聚类排序清单,并发送给数据库,
再对相应计算时长窗口的媒体类内容信息做机器聚类,对从论坛、微博、电子报、网络电视的媒体类型站点已经出现热点敏感事件的信息做标记,形成二类聚类排序清单,并发送给数据库;D、分类筛选模块从数据库中提取一类聚类排序清单、二类聚类排序清单、敏感特征信号,通过对比一类排序清单和二类聚类排序清单,判断信息是否重合,若重合则删除,若不重合则提取集合,使用敏感特征信号匹配筛选,并将结果发送至报告生存模块;E、根据分类筛选得出的最终集合得出最终结果,改结果则为预测的热点敏感事件。
[0007]本专利技术的有益效果是:该种一种弱信号事件挖掘生成系统,通过大数据的收集和分类筛选的方法更利于弱信号的敏感事件发现,及早挖掘尚未成为热点的敏感事件,为预警和处置提供更多时间与机会。
附图说明
[0008]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术的流程示意图;图2是本专利技术的分类筛选流模块程示意图。
具体实施方式
[0009]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0010]在本专利技术的描述中,需要理解的是,术语“开孔”、“上”、“下”、“厚度”、“顶”、“中”、“长度”、“内”、“四周”等指示方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的组件或元件必须具有特定的方位,以特定的方位构造和操作,因此不能理解为对本专利技术的限制。
[0011]如图1所示的一种弱信号事件挖掘生成系统,包括敏感事件定义模块、数据库、信息采集模块、分类筛选模块、报告生成模块,敏感事件定义模块用于定义敏感事件,分为判断热度单元以及判断敏感单元,形成敏感事件信号特征,并发送至数据库,信息采集模块用于对符合计算时长窗口的全量内容信息做机器聚类和相应计算时长窗口的媒体类内容信息做机器聚类,形成一类聚类排序清单、二类聚类排序清单,并发送给数据库,筛选模块用于将敏感特征信号、一类排序清单、二类排序清单从数据库中提取,产生敏感弱信号事件集并将最终结果发送给报告生成模块,报告生成模块用于将最终结果生成报告展示。
[0012]如图2所示,筛选模块将一类排序清单与二类排序清单进行对比,分析判断一类排序清单信息是否和二类排序清单信息相重合,若不重合则生成使用集,再将使用集与敏感特征信号匹配筛选,产生最终集,若重合,则删除重合部分。
[0013]一种弱信号事件挖掘生成方法:A、敏感事件定义模块定义敏感事件,根据历史、专家知识形成敏感事件信号特征,
包括从非实时交互数据中挖掘、从实时的交互数据中挖掘,对主流搜索引擎数据进行采集,对热度榜单数据进行筛选,制定热度浏览线,高于热度浏览线的进入敏感判断,根据人工判断、热度信息是否属于敏感信息,分出敏感信息和非敏感信息,再将敏感信息发送至数据库;B、信息采集模块对符合计算时长窗口的全量内容信息做机器聚类,确保信息扫描完整,信息内容不丢失,保证信息采集的全面性,形成一类聚类排序清单,并发送给数据库,再对相应计算时长窗口的媒体类内容信息做机器聚类,对从论坛、微博、电子报、网络电视的媒体类型站点已经出现热点敏感事件的信息做标记,形成二类聚类排序清单,并发送给数据库;D、分类筛选模块从数据库中提取一类聚类排序清单、二类聚类排序清单、敏感特征信号,通过对比一类排序清单和二类聚类排序清单,判断信息是否重合,若重合则删除,若不重合则提取集合,使用敏感特征信号匹配筛选,并将结果发送至报告生存模块;E、根据分类筛选得出的最终集合得出最终结果,改结果则为预测的热点敏感事件。
[0014]在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本专利技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0015]以上显示和描述了本专利技术的基本原理、主要特征和本专利技术的优点。本行业的技术人员应该了解,本专利技术不受上述实施例的限制,上述实施例和说明书中描述的只是说明本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种弱信号事件挖掘生成系统,其特征在于,包括敏感事件定义模块、数据库、信息采集模块、分类筛选模块、报告生成模块;所述敏感事件定义模块用于定义敏感事件,分为判断热度单元以及判断敏感单元,形成敏感事件信号特征,并发送至数据库;所述信息采集模块用于对符合计算时长窗口的全量内容信息做机器聚类和相应计算时长窗口的媒体类内容信息做机器聚类,形成一类聚类排序清单、二类聚类排序清单,并发送给数据库;所述筛选模块用于将敏感特征信号、一类排序清单、二类排序清单从数据库中提取,产生敏感弱信号事件集并将最终结果发送给报告生成模块;所述报告生成模块用于将最终结果生成报告展示。2.根据权利要求1所述的一种弱信号事件挖掘生成系统,其特征在于,所述筛选模块将一类排序清单与二类排序清单进行对比,分析判断一类排序清单信息是否和二类排序清单信息相重合,若不重合则生成使用集,再将使用集与敏感特征信号匹配筛选,产生最终集,若重合,则删除重合部分。3.根据权利要求1所述的一种弱信号事件挖掘生成方法,其特征在于,所述方法包括以下步骤:A、敏感事件定义模块定...

【专利技术属性】
技术研发人员:朱旭琪王欢韩启红李祖希
申请(专利权)人:北京清博智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1