【技术实现步骤摘要】
本专利技术涉及数据挖掘的计算机应用
,特别涉及一种热点事件分类方法及 装置。
技术介绍
互联网在最近十多年经历了一个飞速发展的时期,并成为超越报纸、广播和电视 三大传统媒体的新媒体。互联网的开放性使其成为人们获取信息的重要渠道,然而互联网 每天都会产生海量的信息数据,如何从这些海量数据中提取有用的关键信息已经成为近年 来研究的热点。 网络由于其开放性、实时性和便捷性而成为新媒体的核心。然而,网络用户量庞 大,每天会产生数以亿计的数据,其中充斥着广告、炒作等虚假信息,从这些数据中发现热 点事件,并将热点事件分类,既能方便人们获取重要信息,同时也能帮助政府进行舆论监控 和突发事件检测。 而现有技术中,缺少一种热点事件分类的方法。
技术实现思路
本专利技术实施例的目的是提供一种热点事件分类方法及装置,实现对热点事件的分 类。 为达到上述目的,本专利技术实施例公开了一种热点事件分类方法,包括: 接收待分类的热点事件; 确定该待分类的热点事件与每个聚类的中心点对应的热点事件的距离; 将所述待分类的热点事件划分到该距离的最小值对应的聚类中,其中根据以下方 ...
【技术保护点】
一种热点事件分类方法,其特征在于,所述方法包括步骤:接收待分类的热点事件;确定该待分类的热点事件与每个聚类的中心点对应的热点事件的距离;将所述待分类的热点事件划分到该距离的最小值对应的聚类中,其中根据以下方法,确定每个聚类的中心点对应的热点事件:采集每个热点事件,并获取该热点事件对应的设定时间长度内的转发数量或评论数量;根据每个热点事件对应的设定时间长度内的转发数量或评论数量,对热点事件进行聚类,将每个热点事件划分到不同的聚类中;在每个聚类中,针对该聚类中包含的每个热点事件,确定该聚类的中心点对应的热点事件。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。