一种舆情信息的智能化处理方法、设备、存储介质技术

技术编号:32465692 阅读:32 留言:0更新日期:2022-02-26 09:03
本申请公开了一种舆情信息的智能化处理方法,属于信息处理领域,该方法包括:采集指定平台的第一热点话题;获取第一热点话题的全部待分析文本,对待分析文本进行句子拆解,将与预先搭建的分词词典中的词语进行匹配成功的词语从句子中切分出来;从切分后得到的词语中抽取样本词语,确定每个词语的词频;确定每个词语的权重;根据每个词语的词频和每个词语的权重计算每个词语的词频指数TF

【技术实现步骤摘要】
一种舆情信息的智能化处理方法、设备、存储介质


[0001]本申请涉及信息处理领域,尤其涉及一种舆情信息的智能化处理方法、设备、存储介质。

技术介绍

[0002]随着科技的发展,网络成为了人们表达言论的重要渠道。有言论的地方往往也会伴随着舆论的发生,积极正面的舆论有利于形成良好的社会风气,引领人们建立良好的社会秩序,推动社会和谐发展。但消极负面的舆论往往会放大网民的负面情绪,刺激人们做出极端的行为,造成不良后果。
[0003]为了应对网络中的负面舆论,比如造谣、煽动负面情绪等,国家也在积极的完善立法,加大打击力度。但通过法律手段往往要在舆论事件发生之后才能够执行,所以目前仅仅依靠立法并不能快速、全面的发挥舆论导向的作用。
[0004]由此,在人工智能等技术快速发展的今天,识别网民发表的不当言论并以能够缓和情绪的语言进行回复,以正确引导舆论方向成为社会的需要。

技术实现思路

[0005]本申请提供了一种舆情信息的智能化处理方法,解决了难以对网络舆论进行快速的监控、分析、处理的技术问题。
[0006]一种舆情信本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种舆情信息的智能化处理方法,其特征在于,包括:采集指定平台的第一热点话题,确定所述第一热点话题的热度值;获取所述第一热点话题的全部待分析文本,对所述待分析文本进行句子拆解,以句子为最小分析单元,将所述句子与预先搭建的分词词典中的词语进行匹配,若匹配成功,则将所述词语从所述句子中切分出来;从切分后得到的词语中抽取样本词语,通过计算所述样本词语每个词语的最大似然估计值,确定每个词语在所述待分析文本包含的所有词语中的词频;确定待分析文本的总数和每个词语出现的待分析文本数,根据所述待分析文本的总数和所述每个词语出现的待分析文本数,确定所述每个词语的权重;根据每个词语的词频和每个词语的权重计算每个词语的词频指数TF

IDF值;根据每个词语的TF

IDF值提取所述待分析文本的特征属性;根据待分析文本包含的特征属性的概率确定所述待分析文本的情感倾向;所述情感倾向包括正面情感类型和负面情感类型;从所述第一热点话题中获取热度值达到第一预设阈值的第二热点话题,获取所述第二热点话题待分析文本;所述待分析文本包括评论文本、主体事件文本;通过自然语言处理对所述主体事件文本进行逻辑分析,确定事件脉络;根据所述评论文本的情感倾向以及所述事件脉络生成针对所述评论文本的回复文本。2.根据权利要求1所述的方法,其特征在于,在针对所述评论文本发送所述回复文本后,所述方法还包括:在经过第二预设时间后判断评论文本的情感倾向是否为正面情感;若未在所述第二预设时间后确定所述待分析文本的情感倾向为正面情感,则根据所述第二热点话题的待分析文本生成文本特征矩阵,对所述特征矩阵进行降维处理,计算所述特征矩阵在降维处理后的第一特征向量;根据历史话题的待分析文本生成特征矩阵,计算所述历史话题的特征矩阵与所述热点话题的特征矩阵在同一维度进行降维后的第二特征向量;计算所述第一特征向量与所述第二特征向量的夹角的余弦值;在所述余弦值大于预设阈值的情况下,确定所述第二热点话题与所述历史话题为相似话题;获取所述第二热点话题的相似话题对应的历史话题的处理流程,根据该历史话题的处理流程生成当前第二热点话题的处理流程。3.根据权利要求1所述的方法,其特征在于,所述通过自然语言处理对所述主体事件文本进行逻辑分析,确定事件脉络,具体包括:将所述句子与预先搭建的分词词典中的词语进行匹配,若匹配成功,则将所述词语从所述句子中切分出来;在进行分词处理后对得到的词语进行词性标注;确定每个词语在句子中所属的句子成分;基于情感词典对所述词语进行情感标记,根据所述情感标记的分值确定对应词语的情感权重;获取所述主体事件中的时间节点,根据所述进行分词处理后对得到的词语的词性标
注、句子成分、情感权重,根据中文语法生成对应所述时间节点的文本摘要;所述文本摘要按照时间、人物、地点的要素生成;将所述文本摘要按照时间节点的顺序进行排序,确定事件脉络。4.根据权利要求1所述的方法,其特征在于,所述根据待分析文本包含的特征属性的概率确定所述待分析文本的情感倾向,具体包括:确定待分析文本的特征属性,并得到包括所述特征属性的训练样本;其中,各个特征属性之间相互独立;通过所述训练样本,对朴素贝叶斯模型进行训练,具体包括:计算每个类别概率;在每个特征属性发生的条件下,计算每个类别的条件概率;在一个或多个特征属性发生的条件下,确定概率最大的类别为情感倾向;得到训练完成的朴素贝叶斯模型;将待分析文本输入到所述训练完成的朴素贝叶斯模型中进行分类预测,确定所述待分析文本的情感倾向。5.根据权利要求1所述的方法,其特征在于,所述采集指定平台的第一热点话题后,所述方法还包括:确定所述第一热点话题的情感倾向;根据所述情感倾向生成第一级类别的数据库;所述第一级类别包括正面情感和负面情感;在所述第一级类别的数据库中,生成第二级类别的子数据库;所述第二级类别中正面情感包括高兴、从容、安静、骄傲,负面情感包括失落、愤怒、伤心、厌恶;对所述第一热点话题进行判别分析,根据所述判别分析结果将所述第一热点话题存储进对应的第二级类别的子数据库中。6.根据权利要求1所述的方法,其特征在于,在获取所述第一热点话题的全部待分析文本后,所述方法还包括:获取每个发布所述待分析文本的用户信息;根据所述用户信息进行数据整合,生成结构化数据;对所述结构化数据中用户信息进行筛选,根据筛选出的用户信息对所述待分析文本进行分类;对分出的每个类别的待分析文本进行情...

【专利技术属性】
技术研发人员:陈敏
申请(专利权)人:杭银消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1