网络话题内容演化分析装置及分析方法制造方法及图纸

技术编号:3837362 阅读:210 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供的是一种网络话题内容演化分析装置及分析方法。网络话题内容演化分析装置由网络事件数据收集装置、网络事件数据预处理装置、话题内容演化分析装置和输出装置构成。本发明专利技术的网络话题内容演化分析方法包括网络事件数据收集、网络事件预处理、相似度计算、话题多中心建立、话题中心更新和输出步骤。通过本发明专利技术可以发现与话题相关的多个内容侧面,采用多中心结构建立相应的话题模型,更为准确、全面地描述话题;通过话题多中心的建立和更新,可以展现话题内容的动态演化发展过程,即话题的产生、发展、高潮直至消亡的全过程。本发明专利技术提出的方法不依赖于报道的处理顺序,能够适用于侧重点不同的新闻报道的交叉出现情况。

【技术实现步骤摘要】

【技术保护点】
一种网络话题内容演化分析装置,其构成包括依次连接的网络事件数据收集装置、网络事件数据预处理装置、话题内容演化分析装置和输出装置;其特征是:网络事件数据收集装置实时、主动地从互联网获取描述网络话题相关事件的原始数据,并进行存储;网络事件数据预处理装置对网络事件数据收集装置存储下来的网络事件描述原始数据,经过解析过滤掉其中的噪音,提取出真正与网络事件相关的核心数据,对核心数据进行特征定义和提取,表示为向量空间模型方式;经过数据预处理后输入话题演化分析装置,将与话题相关的事件进行聚类,并分析在话题内部事件的动态发展及演化过程;输出装置输出系统的话题演化分析结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:王巍杨武苘大鹏
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:93[中国|哈尔滨]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1