【技术实现步骤摘要】
一种社会事件网络文本的舆情计算与推演方法及系统
本专利技术涉及网络文本处理
,特别是涉及一种社会事件网络文本的舆情计算与推演方法及系统。
技术介绍
随着互联网与网络媒体的发展,越来越多应急管理决策人员与学者关注到社会事件网络信息所引起情感的复杂性,并注意到社会事件网络信息处置不当而造成的后续不良后果,因此越来越多的管理人员与学者对社会事件的舆情分析进行研究。当新事件发生时,若能借鉴历史上发生的事件处置过程,则可提高当前事件处置的可靠性,即通过历史案例的处置方法获取新事件的处置线索。基于监督学习的社会事件网络文本信息舆情计算旨在总结历史相关事件的规律,推测待分析社会事件文本的舆情走势,基于已有的历史事件信息理解当前事件。该方法旨在对具有参考信息的新事件进行有效的情感计算,以促进与帮助决策者对于社会现象的理解与引导。传统的社会事件网络文本信息舆情计算方法假定文本信息中包含情感是单一的。但在实际工程应用中,情感表达者发表的言论所携带的情感往往表现出多样性。
技术实现思路
本专利技术的目的是提供一种 ...
【技术保护点】
1.一种社会事件网络文本的舆情计算与推演方法,其特征在于,包括:/n获取社会事件网络文本;/n对所述社会事件网络文本进行预处理,得到网络社会事件文本字特征、网络社会事件文本词特征和网络社会事件文本隐式特征;/n将所述网络社会事件文本字特征、所述网络社会事件文本词特征和所述网络社会事件文本隐式特征分别输入训练好的社会情感计算模型和训练好的文本情感计算模型预测,得到社会事件网络文本的六种情感概率;/n根据所述社会事件网络文本的六种情感概率,采用投票机制方法确定社会事件网络文本的情感取向。/n
【技术特征摘要】
1.一种社会事件网络文本的舆情计算与推演方法,其特征在于,包括:
获取社会事件网络文本;
对所述社会事件网络文本进行预处理,得到网络社会事件文本字特征、网络社会事件文本词特征和网络社会事件文本隐式特征;
将所述网络社会事件文本字特征、所述网络社会事件文本词特征和所述网络社会事件文本隐式特征分别输入训练好的社会情感计算模型和训练好的文本情感计算模型预测,得到社会事件网络文本的六种情感概率;
根据所述社会事件网络文本的六种情感概率,采用投票机制方法确定社会事件网络文本的情感取向。
2.根据权利要求1所述的社会事件网络文本的舆情计算与推演方法,其特征在于,所述训练好的社会情感计算模型,具体训练过程包括:
获取待训练的网络社会事件文本初始特征;所述待训练的网络社会事件文本初始特征包括网络社会事件文本初始字特征、网络社会事件文本初始词特征和网络社会事件文本初始隐式特征;
将所述待训练的网络社会事件文本初始特征输入CNN-LSTM模型的词嵌入向量层,得到密文词嵌入形式的网络社会事件文本初始特征;具体公式如下:
其中,表示独热向量,所述独热向量表示所述待训练的网络社会事件文本中第j个样本的第i个初始特征;表示词向量,所述词向量为所述密文词嵌入形式的网络社会事件文本初始特征;
根据滑动窗口和所述密文词嵌入形式的网络社会事件文本初始特征确定滑动窗口内的词向量;
将所述滑动窗口内的词向量输入所述CNN-LSTM模型的CNN卷积层,确定文本特征向量;具体公式如下:
其中,表示经过卷积层处理之后得到的文本特征向量,[vi-2,vi-1,vi,vi+1,vi+2]表示第i个滑动窗口内的词向量,[·]表示向量拼接;
将所述文本特征向量输入所述CNN-LSTM模型的ReLU激活层,得到ReLU激活层的输出结果;具体公式如下:
其中,表示ReLU激活层的输出结果;
将所述ReLU激活层的输出结果输入所述CNN-LSTM模型的LSTM层,得到LSTM层的输出结果;具体公式如下:
其中,表示第一层LSTM层的输出结果,表示第二层LSTM层的输出结果;
将所述LSTM层的输出结果进行dropout操作,得到dropout操作的输出结果;具体公式如下:
其中,表示dropout操作的输出结果;
将所述dropout操作的输出结果进行均值池化操作,确定有效数据;具体公式如下:
其中,为有效数据,为有效参数,所述有效参数的取值根据当前滑动窗口中数据是否有效确定,N表示网络社会事件文本使用缺省值补齐之后的长度;
将所述有效数据输入所述CNN-LSTM模型的全连接层,得到所述全连接层的输出结果,将所述全连接层的输出结果进行softmax分类,确定所述网络社会事件文本的六种情感概率;具体公式如下:
其中,表示全连接层的输出结果,WT表示全连接层中的权重参数的转置,b表示全连接层中的偏执,表示第j个样本在第l个情感维度上的取值,为网络社会事件文本中第j个样本被预测为第l个情感的概率;
根据所述网络社会事件文本的六种情感概率采用公式确定损失函数;其中,L表示损失函数,表示网络社会事件文本中第j个样本在第l个情感维度上的真实取值;
以最小化所述损失函数为目标对所述CNN-LSTM模型中的参数进行优化,得到训练好的社会情感计算模型。
3.根据权利要求1所述的社会事件网络文本的舆情计算与推演方法,其特征在于,所述训练好的文本情感计算模型,具体训练过程包括:
获取待训练的网络社会事件文本初始特征;所述待训练的网络社会事件文本初始特征包括网络社会事件文本初始字特征、网络社会事件文本初始词特征和网络社会事件文本初始隐式特征;
将所述待训练的网络社会事件文本初始特征输入CNN-LSTM-STACK模型的词嵌入向量层,得到密文词嵌入形式的网络社会事件文本初始特征;具体公式如下:
其中,表示独热向量,所述独热向量表示所述待训练的网络社会事件文本中第j个样本的第i个初始特征;表示词向量,所述词向量为所述密文词嵌入形式的网络社会事件文本初始特征;
根据滑动窗口和所述密文词嵌入形式的网络社会事件文本初始特征确定滑动窗口内的词向量;
将所述滑动窗口内的词向量输入所述CNN-LSTM-STACK模型的CNN卷积层,确定文本特征向量;具体公式如下:
其中,表示经过卷积层处理之后得到的文本特征向量,[vi-2,vi-1,vi,vi+1,vi+2]表示第i个滑动窗口内的词向量;
将所述文本特征向量输入所述CNN-LSTM-STACK模型的ReLU激活层,得到ReLU激活层的输出结果;具体公式如下:
其中,表示ReLU激活层的输出结果;
将所述ReLU激活层的输出结果输入所述CNN-LSTM-STACK模型的LSTM层,得到LSTM层的输出结果;具体公式如下:
其中,表示第一层LSTM层的输出结果,表示第二层LSTM层的输出结果;
将所述LSTM层的输出结果进行dropout操作,得到dropout操作的输出结果;具体公式如下:
其中,表示dropout操作的输出结果;
将所述密文词嵌入形式的网络社会事件文本初始特征输入所述CNN-LSTM-STACK模型的原始特征注意力机制的全连接层,得到所述原始特征注意力机制全连接层的输出结果;将所述原始特征注意力机制全连接层的输出结果进行sigmoid激活,确定原始特征注意力机制的输出结果;具体公式如下:
其中,表示所述原始特征注意力机制全连接层的输出结果,表示所述原始特征注意力机制的输出结果;
将所述dropout操作的输出结果和所述原始特征注意力机制的输出结果进行均值池化操作,确定有效数据;具体公式如下:
其中,为有效数据,为有效参数,所述有效参数的取值根据当前滑动窗口中数据是否有效确定,N表示网络社会事件文本使用缺省值补齐之后的长度;
将所述有效数据输入所述CNN-LSTM-STACK模型的全连接层,得到所述全连接层的输出结果,将所述全连接层的输出结果进行softmax分类,确定所述网络社会事件文本的六种情感概率;具体公式如下:
其中,表示全连接层的输出结果,WT表示全连接层中的权重参数的转置,b表示全连接层中的偏执,表示第j个样本在第l个情感维度上的取值,为网络社会事件文本中第j个样本被预测为第l个情感的概率;
根据所述网络社会事件文本的六种情感概率采用公式确定损失函数;其中,L表示损失函数,表示网络社会事件文本中第j个样本在第l个情感维度上的真实取值;
以最小化所述损失函数为目标对所述CNN-LSTM-STACK模型中的参数进行优化,得到训练好的文本情感计算模型。
4.根据权利要求1所述的社会事件网络文本的舆情计算与推演方法,其特征在于,所述根据所述社会事件网络文本的六种情感概率,采用投票机制方法确定社会事件网络文本的情感取向,具体包括:
获取所述社会事件网络文本的六种情感概率;
获取所述社会事件网络文本的六种情感概率大于有效误判阈值的个数;
根据所述个数采用阈值比较法确定社会事件网络文本的情感取向。
5.一种社会事件网络文本的舆情计算与推演系统,其特征在于,包括:
文本获取模块,用于获取社会事件网络文本;
预处理模块,用于对所述社会事件网络文本进行预处理,得到网络社会事件文本字特征、网络社会事件文本词特征和网络社会事件文本隐式特征;
预测模块,用于将所述网络社会事件文本字特征、所述网络社会事件...
【专利技术属性】
技术研发人员:王欣芝,彭艳,骆祥峰,刘杨,罗均,谢少荣,张丹,
申请(专利权)人:上海大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。