【技术实现步骤摘要】
基于深度学习的网络信息传播指标体系构建及量化评估方法及系统
[0001]本专利技术属于网络信息传播
,具体涉及一种基于深度学习的网络信息传播指标体 系构建及量化评估方法及系统。
技术介绍
[0002]目前在舆情态势评估方面的研究一方面集中在定性评估上,包括对网络舆情、事件的扩 散范围、聚集效应、网民对事件的倾向性等方面的评估;另一方面集中在定量研究上,主要 使用德尔菲法和层次分析法确定指标权重,最后在指标体系实时量化的计算方面,现有的方 法主要集中在贝叶斯网络、svm等机器学习方法上。
[0003][0004]但现有的信息传播指标体系的构建,从指标体系设计过程来看,主要集中在某一个特定 领域和方面,缺少整体的把握与全面的分析,不能够彻底、客观、全面地分析某个舆情事件 在传播中的影响程度;从指标体系权重计算过程来看,主要是使用层次分析法或者德尔菲法 来确立指标的权重值,存在一定的主观性与局限性;从指标体系评估过程来看,现有技术主 要是使用加权平均等计算方法,不能客观、准确地给出某一舆情事件在传播过程中的影响程 度 ...
【技术保护点】
【技术特征摘要】
1.基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,包括下述步骤:获取网络平台的数据组成数据集,利用德尔菲法确定信息传播态势指标体系的三层指标,并通过主成分分析法,分析不同指标间的相关度,构建多层次多粒度多维度的信息传播态势评估指标体系;所述三层指标分别为一级指标、二级指标及三级指标,每个一级指标包括多个二级指标,每个二级指标包括多个三级指标;获取数据集中的事件数据,采用区间赋值法对三级指标中的定性指标进行量化表述,采用数据归一化对三级指标中的定量指标进行量化处理,得到相应三级指标的指标值;将每个事件的指标拼成二维矩阵作为卷积神经网络的输入进行模型训练,得到宣传态势评估模型;将待测试数据输入所述宣传态势评估模型,得到预测结果和宣传态势等级。2.根据权利要求1所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述信息传播态势评估指标体系从舆情事件、传播媒介、舆情受众三个大层次进行分析,涉及演化阶段特征、发帖内容特征、信息维度特征、网络结构特征、受众情感倾向、用户身份特征、媒体参与度传播热度及地区分布。3.根据权利要求1所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述一级指标包含舆情事件、舆情受众及传播媒介;所述一级指标的舆情事件是从舆情事件本身角度分析,用于对舆情所处传播阶段的判断,从而分析传播趋势,所述舆情事件包括二级指标演化阶段特征、发帖内容特征、信息维度特征及网络结构特征;所述一级指标的舆情受众是从参与某一舆情事件的用户角度分析,用于反映受众规模、结构及心理状况,是舆情传播的重要构成,舆情受众包括二级指标受众情感倾向以及用户身份特征;所述一级指标的传播媒介是从舆情事件的传播媒介角度分析,是衡量舆情事件传播范围的重要标准,所述传播媒介包括二级指标媒体参与度、传播热度以及地区分布;二级指标的演化阶段特征包括三级指标传播时间跨度、演化阶段和传播速率;二级指标的发帖内容特征包括三级指标转发比例、图片比例、音频比例、视频比例、话题比例和“@”他人数量;二级指标的信息维度特征包括三级指标帖子标题长度、博文字符长度、博文向量化特征和博文平均TF
‑
IDF;二级指标的网络特征包括三级指标网络密度、聚集系数和连接强度;二级指标的受众情感倾向包括三级指标正向情感词频、中立情感词频、反向情感词频、情绪强度分级、正向情感比例、中立情感比例和反向情感比例;二级指标的用户身份特征包括三级指标性别比例、身份认证比例、账号注册时长、用户年龄分布、受教育水平分布、政治面貌分布、是否有用户名和是否上传头像;二级指标的媒体参与度包括三级指标报道新闻媒体数、新闻报道总数、媒体新闻转发量和媒体关注人数;二级指标的传播热度包括三级指标帖子数、转发数、评论数、点赞数、参与平台数、覆盖
用户数和帖子原创比例;二级指标的地区分布包括三级指标地区覆盖度、境外帖子比例、域名分布和境内帖子比例。4.根据权利要求1所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述采用区间赋值法对三级指标中的定性指标进行量化表述,具体为:对于演化阶段这一定性指标,共有5个取值,分别为:平息阶段、消退阶段、上升阶段、稳定阶段和形成阶段,使用如下五个取值范围来对演化阶段这一定性指标进行量化赋值:[0,0.2)表示该三级指标处于形成阶段;[0.2,0.4)表示该三级指标处于稳定阶段;[0.4,0.6)表示该三级指标处于上升阶段;[0.6,0.8)表示该三级指标处于消退阶段;[0.8,1]表示该三级指标处于平息阶段;对于传播速率这一定性指标,共有5个取值,分别为:快速、较快、适中、较慢和停滞,使用如下五个取值范围来对传播速率这一定性指标进行量化赋值:[0,0.2)表示该三级指标表示停滞;[0.2,0.4)表示该三级指标表示较慢;[0.4,0.6)表示该三级指标表示适中;[0.6,0.8)表示该三级指标表示较快;[0.8,1]表示该三级指标处于表示快速;对于情绪强度分级、地区覆盖度和地区聚集度这些定性指标,共有5个取值,分别为:高、较高、适中、较低和低,使用如下五个取值范围来对这些定性指标进行量化赋值:[0,0.2)表示该三级指标表示程度低;[0.2,0.4)表示该三级指标表示程度较低;[0.4,0.6)表示该三级指标表示程度适中;[0.6,0.8)表示该三级指标表示程度较高;[0.8,1]表示该三级指标表示程高。5.根据权利要求4所述的基于深度学习的网络信息传播指标体系构建及量化评估方法,其特征在于,所述数据归一化是指对获取的事件数据进行计算,消除不同格式数据的运算困难,并通过数据映射,得到一定范围内的新数据,具体计算方法为:极值法,对原始数据的线性变换,使结果值映射到0
‑
1之间,适用于三级指标中最大值最小值已知的情况,转换函数为:和其中,x,y分别表示归一化之前的数值和归一化之后的结果值,MaxValu...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。