舆情文本情感分析方法、装置、计算机设备及介质制造方法及图纸

技术编号:37888456 阅读:7 留言:0更新日期:2023-06-18 11:52
本发明专利技术实施例涉及人工智能技术领域,公开了一种舆情文本情感分析方法,该方法包括:获取舆情文本数据,对所述舆情文本数据进行预处理,得到处理后的舆情文本数据;通过双流自注意力机制对所述处理后的舆情文本数据进行特征向量标记,并提取带标记的特征向量,得到舆情文本情感特征矩阵;根据所述舆情文本情感特征矩阵及预先构建好的情感胶囊网络分析模型进行情感类别分类,得到舆情文本情感分类结果。通过上述方式,本发明专利技术实施例实现了对舆情文本的准确分类。文本的准确分类。文本的准确分类。

【技术实现步骤摘要】
舆情文本情感分析方法、装置、计算机设备及介质


[0001]本专利技术实施例涉及人工智能
,具体涉及一种舆情文本情感分析方法、舆情文本情感分析装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]目前,随着互联网技术的普及,全民参与互联网环境建设的时代正在到来。当前各大主流媒体平台都为网民提供了评论发声的渠道,人们可以在微博、公众号等公共平台发布对事实的看法,发表情感倾向。对新闻热点时间的评论进行情感分析,可以帮助政府掌握民意,预防舆论险情的产生;针对商品与服务的评论分析,能够为商家提供更深层次的用户喜好指导。因此,对互联网上的文本情感分析,能够挖掘巨大的信息资源。
[0003]文本情感分析的一般步骤可以概括为原始数据的获取、文本特征提取、经分类器对文本进行情感分类,最后输出情感类别。在已有数据量充足的情况下,可以利用测试数据对特征提取方法与分类器进行训练,达到更高的情感判断准确率。然而本申请的专利技术人发现,现有的基于情感词典的舆情情感分析方法大多采用人工构造的情感词典,注定了该方案会耗费大量人力,若使用已有情感词典,往往又很难适配使用场景,无法达到深层的匹配精准度,情感分析准确度低。

技术实现思路

[0004]鉴于上述问题,本专利技术实施例提供了一种舆情文本情感分析方法、舆情文本情感分析装置、计算机设备及计算机可读存储介质,用于解决现有技术中存在的情感分析准确度低的问题。
[0005]根据本专利技术实施例的一个方面,提供了一种舆情文本情感分析方法,所述方法包括:
>[0006]获取舆情文本数据,对所述舆情文本数据进行预处理,得到处理后的舆情文本数据;
[0007]通过双流自注意力机制对所述处理后的舆情文本数据进行特征向量标记,并提取带标记的特征向量,得到舆情文本情感特征矩阵;
[0008]根据所述舆情文本情感特征矩阵及预先构建好的情感胶囊网络分析模型进行情感类别分类,得到舆情文本情感分类结果。
[0009]在一种可选的方式中,所述获取舆情文本数据,对所述舆情文本数据进行预处理,进一步包括:
[0010]编写网络爬虫脚本,通过所述网络爬虫脚本获取舆情文本数据;
[0011]根据预定的处理规则对所述舆情文本数据进行预处理,得到处理后的舆情文本数据。
[0012]在一种可选的方式中,所述通过双流自注意力机制对所述处理后的舆情文本数据进行特征向量标记,并提取带标记的特征向量,得到舆情文本情感特征矩阵,包括:
[0013]将所述处理后的舆情文本数据输入双流自注意力机制中,得到带标记的特征向量;其中,带标记的特征向量包括各个词汇的内容状态及查询状态;
[0014]根据所述带标记的特征向量中各个词汇的内容状态及查询状态进行特征提取,得到舆情文本情感特征矩阵。
[0015]在一种可选的方式中,所述根据所述带标记的特征向量中各个词汇的内容状态及查询状态进行特征提取,得到舆情文本情感特征矩阵,进一步包括:
[0016]根据所述带标记的特征向量中各个词汇的内容状态及查询状态,采用双向门控循环单元进行特征提取,得到舆情文本情感特征矩阵。
[0017]在一种可选的方式中,所述根据所述舆情文本情感特征矩阵及预先构建好的情感胶囊网络分析模型进行情感类别分类,得到舆情文本情感分类结果,进一步包括:
[0018]将舆情文本情感特征矩阵输入预先构建好的情感胶囊网络分析模型中,舆情文本情感特征矩阵得到情感类别分类;
[0019]根据所述情感类别分类得到舆情文本情感分类结果。
[0020]在一种可选的方式中,所述情感胶囊网络分析模型包括表示单元、概率单元及重构单元;所述将舆情文本情感特征矩阵输入预先构建好的情感胶囊网络分析模型中,得到情感类别分类,包括:
[0021]通过所述表示单元基于注意力函数计算得到所述舆情文本情感特征矩阵的胶囊特征向量;
[0022]通过所述概率单元基于Sigmoid函数计算得到所述舆情文本情感特征矩阵的胶囊唤醒概率;
[0023]通过所述重构单元计算所述胶囊特征向量与所述胶囊唤醒概率的累乘值,得到各个胶囊的重构特征向量;
[0024]根据所述重构特征向量进行情感类别分类,得到情感类别分类。
[0025]根据本专利技术实施例的另一方面,提供了一种舆情文本情感分析装置,包括:
[0026]获取模块,用于获取舆情文本数据,对所述舆情文本数据进行预处理,得到处理后的舆情文本数据;
[0027]情感特征提取模块,用于通过双流自注意力机制对所述处理后的舆情文本数据进行特征向量标记,并提取带标记的特征向量,得到舆情文本情感特征矩阵;
[0028]情感分类模块,用于根据所述舆情文本情感特征矩阵及预先构建好的情感胶囊网络分析模型进行情感类别分类,得到舆情文本情感分类结果。
[0029]根据本专利技术实施例的另一方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
[0030]所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行所述的舆情文本情感分析方法的步骤。
[0031]根据本专利技术实施例的又一方面,提供了一种计算机可读存储介质,所述计算机存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行根据所述的舆情文本情感分析方法的步骤。
[0032]本专利技术实施例通过获取舆情文本数据,对所述舆情文本数据进行预处理,得到处
理后的舆情文本数据,再通过双流自注意力机制对所述处理后的舆情文本数据进行特征向量标记,并提取带标记的特征向量,得到舆情文本情感特征矩阵,最后根据所述舆情文本情感特征矩阵及预先构建好的情感胶囊网络分析模型进行情感类别分类,得到舆情文本情感分类结果,能够有效提高情感分析的准确度。
[0033]上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0034]附图仅用于示出实施方式,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0035]图1示出了现有技术中情感分析的方法流程示意图;
[0036]图2本专利技术实施例提供的舆情文本情感分析方法的流程示意图;
[0037]图3示出了本专利技术实施例舆情文本情感分析方法的架构示意图;
[0038]图4示出了本专利技术实施例提供的舆情文本情感分析装置的结构示意图;
[0039]图5示出了本专利技术实施例提供的计算机设备的结构示意图。
具体实施方式
[0040]下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种舆情文本情感分析方法,其特征在于,所述方法包括:获取舆情文本数据,对所述舆情文本数据进行预处理,得到处理后的舆情文本数据;通过双流自注意力机制对所述处理后的舆情文本数据进行特征向量标记,并提取带标记的特征向量,得到舆情文本情感特征矩阵;根据所述舆情文本情感特征矩阵及预先构建好的情感胶囊网络分析模型进行情感类别分类,得到舆情文本情感分类结果。2.根据权利要求1所述的方法,其特征在于,所述获取舆情文本数据,对所述舆情文本数据进行预处理,进一步包括:编写网络爬虫脚本,通过所述网络爬虫脚本获取舆情文本数据;根据预定的处理规则对所述舆情文本数据进行预处理,得到处理后的舆情文本数据。3.根据权利要求1所述的方法,其特征在于,所述通过双流自注意力机制对所述处理后的舆情文本数据进行特征向量标记,并提取带标记的特征向量,得到舆情文本情感特征矩阵,包括:将所述处理后的舆情文本数据输入双流自注意力机制中,得到带标记的特征向量;其中,带标记的特征向量包括各个词汇的内容状态及查询状态;根据所述带标记的特征向量中各个词汇的内容状态及查询状态进行特征提取,得到舆情文本情感特征矩阵。4.根据权利要求3所述的方法,其特征在于,所述根据所述带标记的特征向量中各个词汇的内容状态及查询状态进行特征提取,得到舆情文本情感特征矩阵,进一步包括:根据所述带标记的特征向量中各个词汇的内容状态及查询状态,采用双向门控循环单元进行特征提取,得到舆情文本情感特征矩阵。5.根据权利要求1所述的方法,其特征在于,所述根据所述舆情文本情感特征矩阵及预先构建好的情感胶囊网络分析模型进行情感类别分类,得到舆情文本情感分类结果,进一步包括:将舆情文本情感特征矩阵输入预先构建好的情感胶囊网络分析模型中,舆情文本情感...

【专利技术属性】
技术研发人员:吴忆松
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1