热点事件确定方法及装置、计算机设备及存储介质制造方法及图纸

技术编号:21140951 阅读:29 留言:0更新日期:2019-05-18 05:07
一种热点事件确定方法、装置、设备及存储介质,一个实施例的方法包括:获取历史事件数据库中的各事件序列,任意一个事件序列包括各事件及各事件的发生次数;对任意一个事件序列,根据该事件序列中的各事件的发生次数,确定该事件序列中的各事件的事件价值参数值;还确定该事件序列中的各事件在该事件序列中的事件近期有效性参数值;对任意一个事件,根据该事件在各事件序列中的事件价值参数值,确定该事件的事件价值参数总值,并根据该事件在各事件序列中的事件近期有效性参数值,确定该事件的事件近期有效性总值;根据各事件的事件价值参数总值和事件近期有效性总值确定热点事件。本实施例提高了热点事件预测的准确性和性能。

【技术实现步骤摘要】
热点事件确定方法及装置、计算机设备及存储介质
本专利技术涉及数字挖掘
,特别是涉及一种热点事件确定方法、一种热点事件确定装置、一种计算机设备以及一种计算机存储介质。
技术介绍
网络热点事件一般具有突发性和阶段性,网络热点事件的发现(NetworkHotEventsMining,NHEM)也可以称为话题检测与跟踪(Topicdetectionandtracking,简称TDT),目前对网络热点事件的发现和挖掘,一般使用各种各样的聚类算法进行数据挖掘。在目前的数据挖掘机制中,其实现简单,但基于不同类型的聚类技术计算量庞大,聚类结果好坏与新文档的添加顺序有关,敏感性大,在运用到热点事件的确定时会导致热点事件挖掘结果的不准确。
技术实现思路
基于此,有必要提供一种热点事件确定方法、一种热点事件确定装置、一种计算机设备以及一种计算机存储介质,以提高挖掘确定热点事件的准确度。据此,一个实施例中采用以下技术方案:一种热点事件确定方法,包括步骤:获取历史事件数据库中的各事件序列,任意一个事件序列包括具有时间前后关系的各事件以及各事件的发生次数;对任意一个事件序列,根据该事件序列中的各事件的发生次数,确定该事件序列中的各事件在该事件序列中的事件价值参数值;还根据该事件序列在该历史事件数据库中的序列顺序,确定该事件序列的序列近期有效性参数值,并根据该事件序列的序列近期有效性参数值,确定该事件序列中的各事件在该事件序列中的事件近期有效性参数值;对任意一个事件,根据该事件在各事件序列中的事件价值参数值,确定该事件的事件价值参数总值,并根据该事件在各事件序列中的事件近期有效性参数值,确定该事件的事件近期有效性总值;根据各事件的事件价值参数总值和事件近期有效性总值,从各事件中确定热点事件。一种热点事件确定装置,包括:获取模块,用于获取历史事件数据库中的各事件序列,任意一个事件序列包括具有时间前后关系的各事件以及各事件的发生次数;价值确定模块,用于对任意一个事件序列,确定该事件序列中的各事件的事件价值参数值;还用于对任意一个事件,根据该事件在各事件序列中的事件价值参数值,确定该事件的事件价值参数总值;近期有效性确定模块,用于对任意一个事件序列,确定该事件序列的序列近期有效性参数值,并确定该事件序列中的各事件在该事件序列中的事件近期有效性参数值;还用于对任意一个事件,根据该事件在各事件序列中的事件近期有效性参数值,确定该事件的事件近期有效性总值;热点事件确定模块,用于根据各事件的事件价值参数总值和事件近期有效性总值,从各事件中确定热点事件。一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述的方法的步骤。一种计算机存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如上所述的方法的步骤。基于如上所述的实施例的方案,其基于历史事件数据库中的具有时间前后关系的各事件以及各事件的发生次数的事件序列,通过确定事件序列中的各事件的事件价值参数值,并据此确定各事件的事件价值参数总值,并通过确定各事件序列的序列近期有效性参数值,据此确定各事件的事件近期有效性总值,从而基于各事件的事件价值参数总值和事件近期有效性总值确定出热点事件,从而通过基于时序特征的事件序列来对热点事件进行挖掘确定,突破了不能进行蕴含时序特征的热点事件预测的局限,提高了热点事件预测的准确性和性能。附图说明图1是一个本实施例方案的工作环境的示意图;图2是一个实施例的终端/服务器的组成结构的示意图;图3是一个实施例中的热点事件确定方法的流程示意图;图4是一个应用示例中插入第一个事件序列的序列树、反向索引表及查找表的示意图;图5是一个应用示例中插入第二个事件序列的序列树、反向索引表及查找表的示意图;图6是一个应用示例中插入第三个事件序列的序列树、反向索引表及查找表的示意图;图7是一个应用示例中插入第四个事件序列的序列树、反向索引表及查找表的示意图;图8是一个应用示例中插入第五个事件序列的序列树、反向索引表及查找表的示意图;图9是一个应用示例中压缩频繁子序列后的序列树的示意图;图10是一个应用示例中合并一个子序列分支之后的序列树的示意图;图11是一个应用示例中合并第二个子序列分支之后的序列树的示意图;图12是一个应用示例中合并第三个子序列分支之后的序列树的示意图;图13是一个应用示例中压缩频繁子序列并合并子序列分支后的序列树的示意图;图14是一个实施例中的热点事件确定装置的结构示意图。具体实施方式为了便于理解本专利技术,下面将参照相关附图对本专利技术进行更全面的描述。附图中给出了本专利技术的较佳的实施例。但是,本专利技术可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本专利技术的公开内容的理解更加透彻全面。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。本文所使用的术语“或/及”包括一个或多个相关的所列项目的任意的和所有的组合。图1示出了本专利技术一个实施例中的工作环境示意图,如图1所示,其工作环境涉及终端/服务器101以及服务器102,终端/服务器101与服务器102之间可以通过网络进行通信。终端/服务器101可以从各服务器102获得各种历史已发生的事件的信息,并存于历史事件数据库中,该历史事件数据库可以设置在终端/服务器101上,或者是设置在终端/服务器101之外的数据库服务器上。终端/服务器101从服务器102获取的,可以是具有时间前后关系的各事件以及各事件的发生次数的事件序列,也可以是从服务器102获取已发生的各事件后,再形成具有时间前后关系的各事件以及各事件的发生次数的事件序列。本专利技术实施例涉及的是终端/服务器101挖掘确定出热点事件的方案。终端/服务器101在一个实施例中的组成结构示意图如图2所示,其包括通过系统总线连接的处理器、供电模块、存储介质、内存和通信接口。其中,该处理器用于提供计算和控制能力,支撑整个终端/服务器的运行。该存储介质存储有操作系统、数据库和一种热点事件确定装置的计算机应用程序,该热点事件确定装置被处理器执行时实现一种热点事件确定方法。该内存为存储介质中的计算机应用程序的运行提供环境,通信接口用于进行网络通信。本领域技术人员可以理解,图2中示出的结构,仅仅是与实施例方案相关的部分结构的框图,并不构成对本实施例方案所应用于其上的终端/服务器的限定,具体的终端/服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。图3示出了一个实施例中的热点事件确定方法的流程示意图,如图3所示,该实施例中的热点事件确定方法包括步骤S301至步骤S304。步骤S301:获取历史事件数据库中的各事件序列,任意一个事件序列包括具有时间前后关系的各事件以及各事件的发生次数。一个事件序列组成了一个完整的信息流,在一个事件序列中,包含有两个以上的事件,各事件在具体应用中也可以称之为项目,一个事件包含有具体的事件名称,同时可以携带有时间戳标识或者是用以表示时间先后顺序的标识(例如事件号),以标识一个事件序列中的本文档来自技高网
...

【技术保护点】
1.一种热点事件确定方法,其特征在于,包括步骤:获取历史事件数据库中的各事件序列,任意一个事件序列包括具有时间前后关系的各事件以及各事件的发生次数;对任意一个事件序列,根据该事件序列中的各事件的发生次数,确定该事件序列中的各事件在该事件序列中的事件价值参数值;还根据该事件序列在该历史事件数据库中的序列顺序,确定该事件序列的序列近期有效性参数值,并根据该事件序列的序列近期有效性参数值,确定该事件序列中的各事件在该事件序列中的事件近期有效性参数值;对任意一个事件,根据该事件在各事件序列中的事件价值参数值,确定该事件的事件价值参数总值,并根据该事件在各事件序列中的事件近期有效性参数值,确定该事件的事件近期有效性总值;根据各事件的事件价值参数总值和事件近期有效性总值,从各事件中确定热点事件。

【技术特征摘要】
1.一种热点事件确定方法,其特征在于,包括步骤:获取历史事件数据库中的各事件序列,任意一个事件序列包括具有时间前后关系的各事件以及各事件的发生次数;对任意一个事件序列,根据该事件序列中的各事件的发生次数,确定该事件序列中的各事件在该事件序列中的事件价值参数值;还根据该事件序列在该历史事件数据库中的序列顺序,确定该事件序列的序列近期有效性参数值,并根据该事件序列的序列近期有效性参数值,确定该事件序列中的各事件在该事件序列中的事件近期有效性参数值;对任意一个事件,根据该事件在各事件序列中的事件价值参数值,确定该事件的事件价值参数总值,并根据该事件在各事件序列中的事件近期有效性参数值,确定该事件的事件近期有效性总值;根据各事件的事件价值参数总值和事件近期有效性总值,从各事件中确定热点事件。2.根据权利要求1所述的热点事件确定方法,其特征在于,包括下述两项中的至少一项:对任意一个事件序列,根据该事件序列中的各事件的事件价值单位值,以及该事件序列中的各事件在该事件序列中的发生次数,确定各事件在该事件序列中的事件价值参数值;对任意一个事件序列,根据时间衰减因子、历史事件数据库中的事件序列数目、以及该事件序列在该历史事件数据库中的序列顺序,确定该事件序列的序列近期有效性参数值。3.根据权利要求1所述的热点事件确定方法,其特征在于,事件为包含至少一个子事件的子序列,在所述热点事件为子序列时,将所述子序列中时间在后的子事件确定为预测的将要发生的热点事件。4.根据权利要求1至3任意一项所述的热点事件确定方法,其特征在于,在获取历史事件数据库中的各事件序列之后,还包括步骤:生成事件序列树、反向索引表以及查找表;根据历史事件数据库中的各事件序列的序列顺序,对任何一个事件序列,执行下述过程:以事件作为节点,将各事件序列中的各事件的信息存储在所述序列树,事件的信息包括:事件所在节点的节点名称、事件所在节点的父节点、事件所在节点的子节点、事件的事件价值参数值以及事件近期有效性参数值;在反向索引表中添加事件序列的标识以及该事件序列中的各事件的索引信息;在查找表中添加事件序列的标识,并将该事件序列的标识指向该事件序列中的各事件在序列树中的最后一个节点。5.根据权利要求4所述的热点事件确定方法,其特征在于,还包括步骤:识别所述序列树中只有一个叶子节点的分支,并将各只有一个叶子节点的分支分别合并表示为一个树节点。6.一种热点事件...

【专利技术属性】
技术研发人员:林浚玮陆克中毛一帆
申请(专利权)人:腾讯科技深圳有限公司哈尔滨工业大学深圳研究生院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1