基于大数据的互动话题场景分析方法、服务器及介质技术

技术编号:29401512 阅读:18 留言:0更新日期:2021-07-23 22:39
本申请涉及基于大数据的互动话题场景分析方法、服务器及介质,通过获取与话题互动客户端对应的舆情评论文本,并按照对话题互动客户端的设定分类方式,将属于相同分类的话题互动客户端所对应的舆情评论文本归类至相同文本集,从而可以通过获取分类的第一情绪极性信息,以及与分类对应的文本集中每一舆情评论文本的第二情绪极性信息,将获取的第一情绪极性信息和第二情绪极性信息进行关联分析,能够基于分类下的话题互动客户端实现对主题检测场景的舆情风向检测,通过关联分类下的话题互动客户端改善单一话题互动客户端容易受到误操作、评论干扰、话题群主引导等因素影响的问题,进而能够提高舆情风向检测的精准度和舆情风向情况的时效性。

【技术实现步骤摘要】
基于大数据的互动话题场景分析方法、服务器及介质
本申请实施例涉及舆情分析和大数据
,具体涉及一种基于大数据的互动话题场景分析方法、服务器及介质。
技术介绍
互联网的快速进步促进了很多新媒体的发展,不论是流量明星还是普通用户,都可以通过智能电子设备在微博、朋友圈或者互动点评平台上发表各类话题并分享所见所想。相应的,无论是热点新闻还是娱乐八卦,传播速度远超想象。比如,一些热门的、关注度较高的互动话题可以在极短时间内(比如几分钟内),累计几十万次转发或者几百万的阅读量。鉴于上述内容,如此海量的信息可以得到爆炸式的传播,如何能够实时的把握互动话题舆情并作出对应的应对措施对很多互联网企业来说是至关重要的。因此,需要对相关的互动话题场景进行用户评论舆情分析。然而相关的舆情分析技术存在精准度低下且时效性差的问题。
技术实现思路
有鉴于此,本申请实施例提供了一种基于大数据的互动话题场景分析方法、服务器及介质。本申请实施例提供了一种基于大数据的互动话题场景分析方法,应用于互动话题场景分析服务器,包括:获取与话题互本文档来自技高网...

【技术保护点】
1.一种基于大数据的互动话题场景分析方法,其特征在于,应用于互动话题场景分析服务器,所述方法包括:/n获取与话题互动客户端对应的舆情评论文本,其中,所述舆情评论文本是对所述话题互动客户端收集的主题检测结果进行舆情分析而得到的;/n按照对所述话题互动客户端的设定分类方式,将属于相同分类的所述话题互动客户端所对应的舆情评论文本归类至相同文本集;/n获取所述分类的第一情绪极性信息,以及与所述分类对应的所述文本集中每一所述舆情评论文本的第二情绪极性信息;/n将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况。/n

【技术特征摘要】
1.一种基于大数据的互动话题场景分析方法,其特征在于,应用于互动话题场景分析服务器,所述方法包括:
获取与话题互动客户端对应的舆情评论文本,其中,所述舆情评论文本是对所述话题互动客户端收集的主题检测结果进行舆情分析而得到的;
按照对所述话题互动客户端的设定分类方式,将属于相同分类的所述话题互动客户端所对应的舆情评论文本归类至相同文本集;
获取所述分类的第一情绪极性信息,以及与所述分类对应的所述文本集中每一所述舆情评论文本的第二情绪极性信息;
将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况。


2.根据权利要求1所述的基于大数据的互动话题场景分析方法,其特征在于,所述将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况包括:
从与所述分类对应的所述文本集中挑选所述第二情绪极性信息符合设定挑选条件的所述舆情评论文本,并归类至待分析文本集;
基于所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息,确定所述主题检测场景是否存在舆情;
若存在舆情,则将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况。


3.根据权利要求2所述的基于大数据的互动话题场景分析方法,其特征在于,所述第一情绪极性信息包括所述分类的舆情观点类别分布,所述第二情绪极性信息包括所述舆情评论文本的舆情观点类别,所述设定挑选条件包括:所述舆情评论文本的所述舆情观点类别包含于所述分类的所述舆情观点类别分布内。


4.根据权利要求2所述的基于大数据的互动话题场景分析方法,其特征在于,所述第一情绪极性信息包括所述分类下的所述话题互动客户端之间的社交状态关系;所述基于所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息,确定所述主题检测场景是否存在舆情包括:
判断所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息是否符合以下条件:所述分类下所述话题互动客户端之间的社交状态关系为语义融合和/或社交成员群融合,且所述待分析文本集中所有所述舆情评论文本对应的话题互动客户端相同;若不符合,则确定所述主题检测场景内存在舆情;若符合,则确定所述主题检测场景内不存在舆情;
相应的,所述第一情绪极性信息还包括所述分类的信息融合标签,所述信息融合标签用于表示是否需要进行信息融合;所述将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况之前,所述方法还包括:
判断所述分类下的所述话题互动客户端之间的社交状态关系和所述信息融合标签是否符合以下条件:所述分类下的所述话题互动客户端之间的社交状态关系为间接融合,且所述信息融合标签表示需要进行信息融合;若符合,则执行所述将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况的步骤。


5.根据权利要求2所述的基于大数据的互动话题场景分析方法,其特征在于,所述第二情绪极性信息包括舆情观点中的舆情事件的自然语言特征;所述将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况包括:
基于所述舆情评论文本的自然语言特征,确定所述待分析文本集中的所述舆情评论文本所属的舆情事件;
分别通过属于相同所述舆情事件的所述舆情评论文本的第二情绪极性信息进行信息融合,获取不同所述舆情事件的舆情倾向变化信息;
相应的,所述基于所述舆情评论文本的自然语言特征,确定所述待分析文本集中的所述舆情评论文本所属的舆情事件包括:
统计所述待分析文本集中所有所述舆情评论文本之间的所述自然语言特征的特征相关性;
若所述舆情评论文本之间的所述特征相关性大于一设定相关性阈值,则确定所述舆情评论文本属于相同所述舆情事件;
相应的,所述第二情绪极性信息还包括所述舆情事件的若干热点描述的特征内容,以及所述自然语言特征的可信系数;所述分别通过属于相同所述舆情事件的所述舆情评论文本的第二情绪极性信息进行信息融合,获取不同所述舆情事件的舆情倾向变化信息包括:
分别从不...

【专利技术属性】
技术研发人员:付立才张磊
申请(专利权)人:广州力进科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1