【技术实现步骤摘要】
本专利技术涉及互联网,具体为基于人工智能的互联网热点数据挖掘系统及方法。
技术介绍
1、互联网,又称国际网络,是由众多计算机网络互联而成的全球性网络基础设施,以一组通用协议相连,形成逻辑上的单一网络,随着信息网络的快速发展,互联网这一高度开放的“第四媒体”带给传统媒体几乎颠覆性的变革,成为社会影响力日益增强的新信息媒介,越来越多的社会民众通过网络进行帖子、文章的发布和评论来表达自己的态度观点、意见、要求,从而互联网能够更快速、更直接、更尖锐、更真实地映射出社情民意,网络舆情涉及的范围十分广,但对社会热点问题的关注非常集中,一般称这些引起集中性关注的事件为话题。
2、目前,在互联网热点数据挖掘过程中存在多种数据源复杂性,在进行多平台热点实时监测时,采用的分布式爬虫系统采集的异构数据流,无法实时识别跨平台数据采集时产生的语义表征偏差,当不同来源的同事件数据出现特征漂移,会造成热点聚类时的相似度计算误差增大,无法保障热点识别的准确性;同时,在进行热点事件追踪时,无法实时检测事件传播过程中的核心语义要素是否发生偏移,会造成热点演化路
...【技术保护点】
1.基于人工智能的互联网热点数据挖掘方法,其特征在于:所述方法包括以下步骤:
2.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤S1具体包括:
3.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤S2的文本预处理包括:
4.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤S3的深度学习模型处理包括:
5.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤S4的相似度计算采用:
6.根据权利要
...【技术特征摘要】
1.基于人工智能的互联网热点数据挖掘方法,其特征在于:所述方法包括以下步骤:
2.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤s1具体包括:
3.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤s2的文本预处理包括:
4.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤s3的深度学习模型处理包括:
5.根据权利要求1所述的基于人工智能的互联网热点数据挖掘方法,其特征在于:所述步骤s4的相似度计算采用:...
【专利技术属性】
技术研发人员:刘朝勇,崔迎九,李亮,
申请(专利权)人:晟盾科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。