一种舆情监控方法及存储介质技术

技术编号:35818328 阅读:12 留言:0更新日期:2022-12-03 13:42
一种舆情监控方法及存储介质,其中方法包括如下步骤,S1、建设预处理的文本语料库;S2、搭建构建分类网络模型,包括以下结构:词嵌入层,将输入的半结构化语料进行词嵌入训练,将语料转化为结构化向量;第一转换层,所述第一转换层用于获取词向量的上下文信息并传入下一层;第二转换层,所述第二转换层用于获取所述第一转换层的输出,并对所述第一转换层的输出进行self

【技术实现步骤摘要】
一种舆情监控方法及存储介质


[0001]本专利技术涉及语义识别处理领域,尤其涉及一种人工智能自动进行舆情监控的方法及装置。

技术介绍

[0002]舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕事件的发生、发展和变化,群众对其产生和持有的社会态度。网络舆情是社会舆情在互联网空间的映射,是社会舆情的直接反映。网络舆情主要以网络为载体,事件为核心,是广大网民情感、态度、意见、观点的表达。
[0003]随着互联网信息量的不断增大,搭建舆情数据中台对网民舆情的提取、归纳也成为了高效处理互联网信息的重要方案手段。网络传媒作为一种新的信息传播方式,深入人们的日常生活。网民的言论活跃已达到很高的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过网络来表达观点、传播思想,进而形成舆论压力,对任何部门、机构都是无法忽视的。舆情数据中台系统针对互联网类新兴媒体,通过中台分析系统,相关部门可以及时了解网络舆情动态,关注网络舆情的状态,从而产生舆情预警,及时纠正或引导网络上的负面舆情影响,或是得到舆情的整体状况,从而根据舆情状况修改决策。

技术实现思路

[0004]为此,需要提供一种能够进行舆情监控的方法,从而更好地进行大数据过程中语义识别的技术效果。
[0005]为实现上述目的,专利技术人提供了一种舆情监控方法,包括如下步骤,
[0006]S1、建设预处理的文本语料库;
[0007]S2、搭建构建分类网络模型,包括以下结构:
[0008]词嵌入层,将输入的半结构化语料进行词嵌入训练,将语料转化为结构化向量;
[0009]第一转换层,所述第一转换层用于获取词向量的上下文信息并传入下一层;
[0010]第二转换层,所述第二转换层用于获取所述第一转换层的输出,并对所述第一转换层的输出进行self

attention计算后传入下一层;
[0011]双向LSTM层,用于获得词向量的上下文信息并输出;
[0012]向量跳远连接层,用于将所述第一转换层和所述第二转换层的输出与双向LSTM网络的输出进行拼接,使用可训练的权重进行加权融合;
[0013]单向LSTM层,接收加权融合后的向量;
[0014]最大池化层,使用最大池化方式对矩阵向量降维;
[0015]Softmax层,输出分类结果;
[0016]S3、将所述构建好的文本语料库送入所述分类网络模型,对所述分类网络模型进行训练和优化;
[0017]S4、基于训练完成的所述分类网络模型,对所述舆情数据进行计算分析,输出其文
本情感、态度、分类标签。
[0018]在一些具体的实施例中,所述词嵌入层的输入为(64,100,1)的训练数据,将每个分词表征为128维的词向量,该层输出为(64,128,128)的向量。
[0019]在一些具体的实施例中,所述第一转换层的输入为(64,128,128)的向量,参数设置为:encoder:数量为6,head:数量设为8,特征数量为128,该层输出为(64,128,128)的向量。
[0020]在一些具体的实施例中,所述第二转换层的输入为(64,128,128)的向量,参数设置为:encoder:数量为6,head:数量设为8,特征数量为128,该层输出为(64,128,128)的向量。
[0021]在一些具体的实施例中,所述向量跳远连接层用于将所述双向LSTM输出与所述第一转换层的输出和所述第二转换层的输出进行拼接,输出为(64,128,512)的向量。
[0022]一种舆情监控存储介质,存储有计算机程序,所述计算机程序在被运行时将执行包括如下步骤,
[0023]S1、建设预处理的文本语料库;
[0024]S2、搭建构建分类网络模型,包括以下结构:
[0025]词嵌入层,将输入的半结构化语料进行词嵌入训练,将语料转化为结构化向量;
[0026]第一转换层,所述第一转换层用于获取词向量的上下文信息并传入下一层;
[0027]第二转换层,所述第二转换层用于获取所述第一转换层的输出,并对所述第一转换层的输出进行self

attention计算后传入下一层;
[0028]双向LSTM层,用于获得词向量的上下文信息并输出;
[0029]向量跳远连接层,用于将所述第一转换层和所述第二转换层的输出与双向LSTM网络的输出进行拼接,使用可训练的权重进行加权融合;
[0030]单向LSTM层,接收加权融合后的向量;
[0031]最大池化层,使用最大池化方式对矩阵向量降维;
[0032]Softmax层,输出分类结果;
[0033]S3、将所述构建好的文本语料库送入所述分类网络模型,对所述分类网络模型进行训练和优化;
[0034]S4、基于训练完成的所述分类网络模型,对所述舆情数据进行计算分析,输出其文本情感、态度、分类标签。
[0035]在一些具体的实施例中,所述词嵌入层的输入为(64,100,1)的训练数据,将每个分词表征为128维的词向量,该层输出为(64,128,128)的向量。
[0036]在一些具体的实施例中,所述第一转换层的输入为(64,128,128)的向量,参数设置为:encoder:数量为6,head:数量设为8,特征数量为128,该层输出为(64,128,128)的向量。
[0037]在一些具体的实施例中,所述第二转换层的输入为(64,128,128)的向量,参数设置为:encoder:数量为6,head:数量设为8,特征数量为128,该层输出为(64,128,128)的向量。
[0038]在一些具体的实施例中,所述向量跳远连接层用于将所述双向LSTM输出与所述第一转换层的输出和所述第二转换层的输出进行拼接,输出为(64,128,512)的向量。
[0039]通过上述方案,利用设计的双向LSTM输出、第一转换层和第二转换层配合使用,进行自注意力算法能够让模型学习跨层的信息,能够让文本获取到更丰富的特征,最终达到针对舆情内容进行更好地处理的分析系统。
附图说明
[0040]图1为本专利技术一实施方式所述的舆情分析方法流程图;
[0041]图2为本专利技术一实施方式所述的舆情分析方法图;
[0042]图3为本专利技术一实施方式所述的舆情分析存储介质;
[0043]图4为本专利技术一实施方式所述的舆情分析中台系统;
[0044]图5为本专利技术一实施方式所述的改进算法结果对比图。
具体实施方式
[0045]为详细说明本申请可能的应用场景,技术原理,可实施的具体方案,能实现目的与效果等,以下结合所列举的具体实施例并配合附图详予说明。本文所记载的实施例仅用于更加清楚地说明本申请的技术方案,因此只作为示例,而不能以此来限制本申请的保护范围。
[0046]在本文中提及“实施例”意味着,结合实施例描述的特定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种舆情监控方法,其特征在于,包括如下步骤,S1、建设预处理的文本语料库;S2、搭建构建分类网络模型,包括以下结构:词嵌入层,将输入的半结构化语料进行词嵌入训练,将语料转化为结构化向量;第一转换层,所述第一转换层用于获取词向量的上下文信息并传入下一层;第二转换层,所述第二转换层用于获取所述第一转换层的输出,并对所述第一转换层的输出进行self

attention计算后传入下一层;双向LSTM层,用于获得词向量的上下文信息并输出;向量跳远连接层,用于将所述第一转换层和所述第二转换层的输出与双向LSTM网络的输出进行拼接,使用可训练的权重进行加权融合;单向LSTM层,接收加权融合后的向量;最大池化层,使用最大池化方式对矩阵向量降维;Softmax层,输出分类结果;S3、将所述构建好的文本语料库送入所述分类网络模型,对所述分类网络模型进行训练和优化;S4、基于训练完成的所述分类网络模型,对所述舆情数据进行计算分析,输出其文本情感、态度、分类标签。2.根据权利要求1所述的舆情监控方法,其特征在于,所述词嵌入层的输入为(64,100,1)的训练数据,将每个分词表征为128维的词向量,该层输出为(64,128,128)的向量。3.根据权利要求1所述的舆情监控方法,其特征在于,所述第一转换层的输入为(64,128,128)的向量,参数设置为:encoder:数量为6,head:数量设为8,特征数量为128,该层输出为(64,128,128)的向量。4.根据权利要求1所述的舆情监控方法,其特征在于,所述第二转换层的输入为(64,128,128)的向量,参数设置为:encoder:数量为6,head:数量设为8,特征数量为128,该层输出为(64,128,128)的向量。5.根据权利要求1所述的舆情监控方法,其特征在于,所述向量跳远连接层用于将所述双向LSTM输出与所述第一转换层的输出和所述第二转换侧给的输出进行拼接,输出为(64,128,512)的向量。6.一种舆情监控存储介质,其特征在于,存储有计算...

【专利技术属性】
技术研发人员:林榕韬赖大进何健黄灵萱黄羽薇
申请(专利权)人:福建省邮电规划设计院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1