文本数据的舆情分析方法及装置、电子设备和存储介质制造方法及图纸

技术编号：33032265 阅读：58 留言：0更新日期：2022-04-15 09:09

本申请实施例提供了一种文本数据的舆情分析方法及装置、电子设备和存储介质，所述方法包括：从待分析的第一文本数据中获取第二文本数据；对所述第二文本数据进行句向量特征的提取，并基于所述句向量特征对所述第二文本数据进行话题分析；对所述第二文本进行词向量特征的提取，并基于所述词向量特征对所述第二文本数据进行情感分析；以及结合话题分析的结果和情感分析的结果对所述第一文本数据进行舆情分析。上述方案解决了现有技术中只进行单一的情感分析或者话题分析，导致分析不够全面的问题。问题。问题。

全部详细技术资料下载

【技术实现步骤摘要】
文本数据的舆情分析方法及装置、电子设备和存储介质

[0001]本申请涉及数据处理
，特别是涉及一种文本数据的舆情分析方法及装置、电子设备和存储介质。

技术介绍

[0002]进入互联网时代后，网上每天产生大量的文本数据，像微博、游戏聊天等社交平台，因其操作简捷、内容短小随意、实时性强而吸引了越来越多的用户。海量信息为人们带来巨大信息量的同时,也带来了信息爆炸的负面影响。如何利用这些实时文本迅速有效掌握信息,了解舆论导向,成为了近年来的热点研究方向之一。
[0003]目前，主要的舆情分析方法以情感分析或话题分析为主，其中，情感分析采用有监督学习进行分类，话题分析采用有监督学习、无监督学习。但目前都是只进行单一的情感分析或者话题分析，导致分析不够全面，例如话题分析准确率低且用时长，并且还需要提前指定聚类簇数，导致存在一定的局限性。

技术实现思路

[0004]本申请实施例的目的在于提供一种文本数据的舆情分析方法及装置、电子设备和存储介质，以解决现有技术中只进行单一的情感分析或者话题分析，导致分析不够全面的问题，具体技术方案如下：
[0005]在本申请实施的第一方面，首先提供了一种文本数据的舆情分析方法，包括：从待分析的第一文本数据中获取第二文本数据；对所述第二文本数据进行句向量特征的提取，并基于所述句向量特征对所述第二文本数据进行话题分析；对所述第二文本进行词向量特征的提取，并基于所述词向量特征对所述第二文本数据进行情感分析；以及结合话题分析的结果和情感分析的结果对所述第一文本数据进行舆...

【技术保护点】

【技术特征摘要】
1.一种文本数据的舆情分析方法，其特征在于，包括：从待分析的第一文本数据中获取第二文本数据；对所述第二文本数据进行句向量特征的提取，并基于所述句向量特征对所述第二文本数据进行话题分析；对所述第二文本进行词向量特征的提取，并基于所述词向量特征对所述第二文本数据进行情感分析；以及结合话题分析的结果和情感分析的结果对所述第一文本数据进行舆情分析。2.根据权利要求1所述的方法，其特征在于，所述对所述第二文本数据进行句向量特征的提取，并基于所述句向量特征对所述第二文本数据进行话题分析，包括：对所述第二文本数据进行数据提取，得到句向量特征；对所述句向量特征进行聚类处理，得到聚类结果；过滤掉所述聚类结果中簇内文本数量少于第一预设阈值的簇；以及对过滤后的所述聚类结果进行话题分析。3.根据权利要求2所述的方法，其特征在于，所述对所述第二文本数据进行数据提取，得到句向量特征包括：对所述第二文本数据进行处理，得到所述第二文本数据的词向量特征；对所述词向量特征进行平均池化操作，得到前置句向量特征；以及对所述前置句向量特征进行主成分分析，得到所述句向量特征。4.根据权利要求2所述的方法，其特征在于，所述对所述句向量特征进行聚类处理，得到聚类结果包括：在当前存在簇中心的情况下，确定所述句向量特征与已存在的各簇中心的多个第一相似度，并从所述多个第一相似度中选择最大相似度；在所述最大相似度大于第二预设阈值的情况下，确定所述句向量特征与所述簇中心对应的簇中的最后一个句向量特征的第二相似度；以及在所述第二相似度大于第三预设阈值的情况下，将所述句向量特征放入与所述簇中心对应的簇中。5.根据权利要求4所述的方法，其特征在于，所述方法还包括：在所述第二相似度小于或等于所述第三预设阈值的情况下，确定当前簇数是否大于或等于第四预设阈值；在所述当前簇数大于或等于所述第四预设阈值的情况下，删除所述句向量特征；以及在所述当前簇数小于所述第四预设阈值的情况下，将所述句向量特征确定为新的簇的簇中心；其中，所述聚类结果包括一个或多个所述簇。6.根据权利要求2所述的方法，其特征在于，对所述第二文本进行词向量特征的提取，并基于所述词向量特征对所述第二文本数据进行情感分析包括：对所述第二文本进行分词处理；提取分词处理后所述第二文本中各词对应的词向量特征；以及基于所述词向量特征确定所述第二文本进行...

【专利技术属性】
技术研发人员：张浩静，刘炎，覃建策，陈邦忠，
申请(专利权)人：完美世界控股集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人