基于人工智能的互联网热点数据挖掘系统及方法技术方案

技术编号:46569995 阅读:2 留言:0更新日期:2025-10-10 21:17
本发明专利技术涉及互联网技术领域,且公开了基于人工智能的互联网热点数据挖掘系统及方法,所述系统包括:数据采集模块、语义理解模块、动态聚类模块、热度评估模块、可视化输出模块及反馈优化模块;通过设置多源校准单元,在进行跨平台热点数据采集时,通过建立动态语义特征库以及针对不同数据平台配置自适应权重参数,保证多源异构数据采集的标准化处理;同时通过实时监测采集数据的语义偏移量,能够检测并消除跨平台数据采集时产生的表征偏差,保障热点聚类相似度计算的准确性,降低热点识别误差,通过部署语义追踪引擎,在进行热点事件传播分析时,通过构建时空特征向量计算事件核心要素的偏离度,实时判断话题语义是否发生迁移。

【技术实现步骤摘要】

本专利技术涉及互联网,具体为基于人工智能的互联网热点数据挖掘系统及方法


技术介绍

1、互联网,又称国际网络,是由众多计算机网络互联而成的全球性网络基础设施,以一组通用协议相连,形成逻辑上的单一网络,随着信息网络的快速发展,互联网这一高度开放的“第四媒体”带给传统媒体几乎颠覆性的变革,成为社会影响力日益增强的新信息媒介,越来越多的社会民众通过网络进行帖子、文章的发布和评论来表达自己的态度观点、意见、要求,从而互联网能够更快速、更直接、更尖锐、更真实地映射出社情民意,网络舆情涉及的范围十分广,但对社会热点问题的关注非常集中,一般称这些引起集中性关注的事件为话题。

2、目前,在互联网热点数据挖掘过程中存在多种数据源复杂性,在进行多平台热点实时监测时,采用的分布式爬虫系统采集的异构数据流,无法实时识别跨平台数据采集时产生的语义表征偏差,当不同来源的同事件数据出现特征漂移,会造成热点聚类时的相似度计算误差增大,无法保障热点识别的准确性;同时,在进行热点事件追踪时,无法实时检测事件传播过程中的核心语义要素是否发生偏移,会造成热点演化路径识别偏离实际传播轨本文档来自技高网...

【技术保护点】

1.基于人工智能的互联网热点数据挖掘方法,其特征在于:所述方法包括以下步骤:

2.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤S1具体包括:

3.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤S2的文本预处理包括:

4.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤S3的深度学习模型处理包括:

5.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤S4的相似度计算采用:

6.根据权利要求1所述的基于人工智...

【技术特征摘要】

1.基于人工智能的互联网热点数据挖掘方法,其特征在于:所述方法包括以下步骤:

2.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤s1具体包括:

3.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤s2的文本预处理包括:

4.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤s3的深度学习模型处理包括:

5.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤s4的相似度计算采用:...

【专利技术属性】
技术研发人员:刘朝勇崔迎九李亮
申请(专利权)人:晟盾科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1