【技术实现步骤摘要】
基于社交网络平台的舆情分析方法及系统
[0001]本申请涉及舆情分析
,尤其涉及一种基于社交网络平台的舆情分析方法及系统。
技术介绍
[0002]信息技术的飞速发展增强了网络與情的可扩散性与不确定性,网络空间的复杂特征赋予了网络與情极强的不可控性。
[0003]CN104484359B,一种基于社交图谱的舆情分析方法及装置,公开了利用网络数据采集工具,从互联网中抓取社交网络信息,通过数据处理获取社交图谱基础数据;获取社交中心点,将所述社交中心点的数量与预设舆情中心点阈值比较;在社交中心点数量小于预设舆情中心点阈值的社交图谱中,判断是否有舆情中心点行为;获取核心节点,将所述的核心节点的子节点数量与预设核心节点的子节点阈值比较,比较结果作为舆情状况的评估标准;根据获取的舆情话题与舆情状况的评估结果,进行舆情预警。
[0004]CN106649578A,一种基于社交网络平台的舆情分析方法及系统,公开了S1:统计分析用户的搜索词及搜索频率,获得数据集;S2:过滤掉重复的内容;S3:进行聚类后将每类数据合为一个文 ...
【技术保护点】
【技术特征摘要】
1.一种基于社交网络平台的舆情分析方法,其特征在于,包括:基于所获取的网络舆情信息,确定所述网络舆情信息中各个评论文本的出现频次以及空间位置分布,基于所述各个评论文本的出现频次以及空间位置分布提取所述网络舆情信息的舆情特征,根据所述舆情特征通过组合聚类算法确定所述网络舆情信息对应的舆情主题;基于所述舆情主题下各个舆情特征,通过预先构建的情感提取模型,确定各个舆情特征对应的情感属性,其中,所述情感提取模型基于多种模型融合而成,用于提取舆情特征对应的情感属性;根据所述网络舆情信息对应的所述舆情特征以及所述情感特征,确定所述网络舆情信息的信息熵和情感极性,并根据所述信息熵和所述情感极性确定所述网络舆情信息的扩散度。2.根据权利要求1所述的方法,其特征在于,所述基于所述各个评论文本的出现频次以及空间位置分布提取所述网络舆情信息的舆情特征如下公式所示:;其中,NP表示所述网络舆情信息对应的舆情特征,表示所获取的任意一条网络舆情信息中某一个评论文本所出现的频次,D表示所述网络舆情信息的总数量,表示网络舆情信息i中第p条评论文本的空间位置分布,表示网络舆情信息i在样本空间中的分布分散信息,表示所获取的网络舆情信息存在的语义类别数量。3.根据权利要求1所述的方法,其特征在于,所述根据所述舆情特征通过组合聚类算法确定所述网络舆情信息对应的舆情主题包括:根据预设的主题识别模型对所述舆情特征进行主题分配,基于预设的邻域半径和最小点数阈值,分别确定每一个舆情特征的领域半径范围内舆情特征的数量,若领域半径范围内舆情特征的数量大于等于所述最小点数阈值,则将该舆情特征作为核心特征,对所述核心特征以及所述核心特征的领域半径范围内所有的舆情特征进行聚类,确定多个第一聚类结果;分别确定所述多个第一聚类结果中相邻聚类结果的核心特征的欧式距离,将欧式距离最近的相邻聚类结果进行合并,得到第二聚类结果,确定所述第二聚类结果中各个舆情特征的舆情主题。4.根据权利要求1所述的方法,其特征在于,所述情感提取模型包括输入层、特征提取层和输出层,所述输入层中设置有第一子模型,所述特征提取层中设置有第二子模型,所述基于所述舆情主题下各个舆情特征,通过预先构建的情感提取模型,确定各个舆情特征对应的情感属性包括:将所述舆情主题下各个舆情特征经过映射得到由实值向量构成的矩阵;在所述特征提取层利用第二子模型对所述矩阵进行卷积和池化,得到第一特征向量,所述第一特征向量包括所述舆情特征的全局语义信息和局部语义信息;在所述输出层利用自注意力机制确定所述第一特征向量的权重,利用sigmoid函数基
于所述第一特征向量和对应的权重进行激活,确定各个舆情特征对应的情感属性。5.根据权利要求4所述的方法,其特征在于,所述第二子模型包括BiGRU模型和CNN模型,所述在所述特征提取层利用第二...
【专利技术属性】
技术研发人员:李志杰,郭晋,姜波清,于瑞清,刀国羚,
申请(专利权)人:乐麦信息技术杭州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。