【技术实现步骤摘要】
异常事件检测方法以及装置
本公开涉及互联网领域,具体而言,涉及一种异常事件检测方法、装置、电子设备以及计算机可读存储介质。
技术介绍
随着互联网技术的发展,人们可以通过互联网获取到各种类型的信息,比如新闻舆情、行业动态、企业信息等。当用户需要查看某一特定事件类型或主体的信息时,由于信息持续性的大量涌入,且对于同一事件类型或主体的信息在发布来源和发布时间上有较高的离散性,导致用户无法进行直观的判别和理解。特别是在舆情分析时,难以准确得知近期或者某一天该事件类型或主体有无真正重要的异常事件发生。因此,需要一种或多种方法解决上述问题。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种异常事件检测方法、装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。根据本公开的一个方面,提供一种异常事件检测方法,包括:获取第一预 ...
【技术保护点】
1.一种异常事件检测方法,其特征在于,所述方法包括:/n获取第一预设周期内主体相关事件的事件信息;/n从所述第一预设周期内获取第二预设周期的主体相关事件,根据第二预设周期的主体相关事件数量计算第二预设周期的事件发生数据;/n将所述事件发生数据输入预设峰值数据模型中,计算并判断所述第二预设周期是否为峰值周期,若是,确定所述峰值周期存在异常事件。/n
【技术特征摘要】
1.一种异常事件检测方法,其特征在于,所述方法包括:
获取第一预设周期内主体相关事件的事件信息;
从所述第一预设周期内获取第二预设周期的主体相关事件,根据第二预设周期的主体相关事件数量计算第二预设周期的事件发生数据;
将所述事件发生数据输入预设峰值数据模型中,计算并判断所述第二预设周期是否为峰值周期,若是,确定所述峰值周期存在异常事件。
2.如权利要求1所述的方法,其特征在于,根据第二预设周期的主体相关事件数量计算第二预设周期的事件发生数据,包括:
分别将第二预设周期内的各主体相关事件作为基准事件;
计算所述基准事件与其他事件的相似度,将相似度大于预设相似度阈值的事件作为相似事件;
将具有相似事件的主体相关事件总数量作为所述事件发生数据。
3.如权利要求1所述的方法,其特征在于,根据第二预设周期的主体相关事件数量计算第二预设周期的事件发生数据,包括以下任意一种方式:
计算第二预设周期内的所述主体相关事件的总量,将所述主体相关事件的总量作为所述事件发生数据;或者,
所述事件信息包括事件来源,获取主体相关事件的事件来源数量,将所述事件来源数量作为所述事件发生数据;或者,
计算第二预设周期内的所述主体相关事件对应主体在其他事件中的被提及总量,将所述主体的被提及总量作为所述事件发生数据。
4.如权利要求1所述的方法,其特征在于,计算并判断所述第二预设周期是否为峰值周期,包括:
分别将各个第二预设周期的所述事件发生数据与其相邻周期的事件发生数据进行比对;
判断比对结果是否满足预设峰值周期条件;
若满足,则确定当前第二预设周期为峰值周期。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据预设热度算法计算第二预设周期内的主体相关事件的热度指标;
将所述峰值周期内热度指标最高的预设数量的主体相关事件作为热度事件;
确定所述热度事件为所述异常事件。
6.如权利要求5所述的方法,其特征在于,所述事件信息包括事件来源,所述根据预设热度算法计算第二预设周期内的主体相关事件的热度指标,包括:
分别将第二预设周期内的各主体相关事件作为基准事件;
计算所述基准事件与其他事件的相似度,将相似度大于预设相似度阈值的事件作为所述基准事件的相似事件;
判断所述基准事件的相似事件数量是否小于预设相似阈值;
若所述基准事件的相似事件数量小于预设相似阈值,获取与所基准事件中的事件来源对应的权重值,将所述事件来源对应的权重值作为所述基准事件的热度指标。
7.如权利要求6所述的方法,其特征在于,判断所述基准事件的相似事件数量是否小于预设相似阈值后,所述方法还包括:
若所述基准事件的相似事件数量大于或等于预设相似阈值,则获取所述基准事件及其相似事件的事件来源对应的权重值;
将所述基准事件及其相似事件的事件来源对应的权重值和值作为所述基准事件的热度指标。
8.如权利要求6所述的方法,其特征在于,所述事件信息包括事件标题,计算所述基准事件与其他事件的相似度,包括:
计算所述基准事件与其他事件的事件标题的交集长度;
根据所述基准事件与其他事件的事件标题的交集长度计算两者的相似度。
9.如权利要求6所述的方法,其特征在于,所述事件信息包括事件内容,计算所述基准事件与其他事件的相似度,包括:
获取所述事件内容中包含预设主体信息的段落;
计算所述基准事件与其他事件的事件内容中包含预设主体信息的段落的哈希值,并进行哈希值对比;
根据哈...
【专利技术属性】
技术研发人员:王晓岚,黄文瀚,柳超,
申请(专利权)人:北京金堤科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。