【技术实现步骤摘要】
一种热门话题舆情分析方法
本专利技术涉及计算机领域,尤其涉及一种热门话题舆情分析方法。
技术介绍
在数据分析领域,经常需要对数据进行分析。在常见互动性网站中,比如知乎,百度贴吧存在大量的用户互评类数据,这类数据能够反应用户的个人偏好,也能够用于研究时事热点和社会现象,存在较多的社会信息,能够被广泛的应用于广告目标用户研究,热点问题研究,舆情监督等各个领域。但是现有技术中缺乏对于这类数据的数据处理方法,也难以从这类数据中提取出有效的数据源和舆情分析结果以用作后续的数据分析之用。
技术实现思路
为了解决上述技术问题,本专利技术提出了一种热门话题舆情分析方法。本专利技术具体是以如下技术方案实现的:一种热门话题舆情分析方法,包括:获取数据集合,所述数据集合包括一类数据和二类数据;所述一类数据为直接发布的数据,所述二类数据为针对一类数据的评论数据;按照一类数据的发布时间进行数据分组,得到分组数据集,所述分组数据集中包括一类数据和与所述一类数据相关的二类数据;对每个分组数据集进行预处理,得到所述分组数据集对应的数据网络集合;对于每个分组数据集,计算其对应的话题向量集;基于所述话题 ...
【技术保护点】
1.一种热门话题舆情分析方法,其特征在于,包括:获取数据集合,所述数据集合包括一类数据和二类数据;所述一类数据为直接发布的数据,所述二类数据为针对一类数据的评论数据;按照一类数据的发布时间进行数据分组,得到分组数据集,所述分组数据集中包括一类数据和与所述一类数据相关的二类数据;对每个分组数据集进行预处理,得到所述分组数据集对应的数据网络集合;对于每个分组数据集,计算其对应的话题向量集;基于所述话题向量集得到所述分组数据集中的热点数据网络集合;对所述热点数据网络集合进行舆情分析。
【技术特征摘要】
1.一种热门话题舆情分析方法,其特征在于,包括:获取数据集合,所述数据集合包括一类数据和二类数据;所述一类数据为直接发布的数据,所述二类数据为针对一类数据的评论数据;按照一类数据的发布时间进行数据分组,得到分组数据集,所述分组数据集中包括一类数据和与所述一类数据相关的二类数据;对每个分组数据集进行预处理,得到所述分组数据集对应的数据网络集合;对于每个分组数据集,计算其对应的话题向量集;基于所述话题向量集得到所述分组数据集中的热点数据网络集合;对所述热点数据网络集合进行舆情分析。2.根据权利要求1所述的方法,其特征在于,所述基于所述话题向量集得到所述分组数据集中的热点数据网络集合包括:获取每个数据网络的热度属性;根据所述热度属性提取疑似热点数据网络;获取疑似热点数据网络的相关度矩阵;获取所述相关度矩阵中数值大于预设相关度阈值的元素;若所述元素总数大于预设的热度阈值,则所述疑似热点数据网络被判定为热点数据网络,构成热点数据网络集合。3.根据权利要求1所述的方法,其特征在于,所述对...
【专利技术属性】
技术研发人员:徐承迪,
申请(专利权)人:杭州翼兔网络科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。