一种基于传播链路的舆情分级预警方法及系统技术方案

技术编号：40949372 阅读：32 留言：0更新日期：2024-04-18 20:23

本发明专利技术公开了一种基于传播链路的舆情分级预警方法及系统，涉及信息处理技术领域，包括以下步骤：数据采集模块采集初始数据及相关联的评论内容数据，并进行数据预处理；通过分级预警模型对采集到的数据进行数据的情感层次判定，获得负面舆情数据；根据建立的企业画像，判定负面舆情数据的对象；根据传播模型进行数据分析，获得负面舆情数据的传播链路，并进行影响力分值计算；根据传播模型进行数据分析，获得负面舆情数据的传播链路，并进行影响力分值计算；本方案根据舆情影响力对舆情进行分级预警，提高用户的体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息处理，具体涉及一种基于传播链路的舆情分级预警方法及系统。

技术介绍

1、目前对负面网络舆情的预警能力已经十分普遍，通常是根据情感向性关键词库，对数据进行情感分析，然后进行舆情的预警通知。但是对于预警信息进行分级提醒还很少。提供的预警通知因为只是简单的进行关键词和指标触发，导致用户会收到大量的提醒消息，实际使用体验较差。

2、如中国专利cn110347830a，公开日2019年10月18日，本专利技术提供一种舆情预警的实现方法，包括：从舆情信息源获取待判定舆情数据；将待判定舆情数据输入训练后的任务模型，根据训练后任务模型的输出确定是否发出预警；所述任务模型为分类模型，其输入为文本，输出包括对是否发生舆情的预测；所述任务模型按照完成预训练的语言模型进行初始化，采用有标记的样本舆情数据进行训练；所述语言模型与任务模型除归一化softmax层以外具有相同的结构，其输出为对输入文本的下文的预测；所述语言模型采用无标记文本数据进行预训练。该方法未对舆情进行分级，所有舆情采取统一的方式进行通知，提醒消息众多，并且用户无法...

【技术保护点】

1.一种基于传播链路的舆情分级预警方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于传播链路的舆情分级预警方法，其特征在于，对历史数据进行训练构建所述分级预警模型，所述分级预警模型构建过程如下所示：搭建NLP平台；采用中文评论情感分析语料和中文评价对象级情感分析语料作为情感分析数据集；将数据集加载到NLP平台；利用NLP平台内的预训练模型对数据集进行训练，形成分级预警模型。

3.根据权利要求2所述的一种基于传播链路的舆情分级预警方法，其特征在于，负面舆情数据的判断包括以下内容：搭建NLP平台；将行业收集的所有正负面词汇加载到NLP平台；通过Toke...

【技术特征摘要】

1.一种基于传播链路的舆情分级预警方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于传播链路的舆情分级预警方法，其特征在于，对历史数据进行训练构建所述分级预警模型，所述分级预警模型构建过程如下所示：搭建nlp平台；采用中文评论情感分析语料和中文评价对象级情感分析语料作为情感分析数据集；将数据集加载到nlp平台；利用nlp平台内的预训练模型对数据集进行训练，形成分级预警模型。

3.根据权利要求2所述的一种基于传播链路的舆情分级预警方法，其特征在于，负面舆情数据的判断包括以下内容：搭建nlp平台；将行业收集的所有正负面词汇加载到nlp平台；通过tokenizer引擎对加载的正负面词汇进行权重值确认，形成预训练模型并训练；根据预训练模型进行正负面结果参数计算；计算公式为：正负面结果参数=数量num*权重weights；根据正负面结果参数判断采集到的数据是否为负面舆情数据，若正负面结果参数大于阈值，则判定采集到的数据为负面舆情数据。

4.根据权利要求1或2所述的一种基于传播链路的舆情分级预警方法，其特征在于，所述步骤s4中的数据分析包括相似度计算，具体过程如下所示：通过大数据flink流式处理引擎对采集到的数据进行切割，提取文本数据前300个文字；通过jieba分词器对切割后的数据进行分词，获取频率最高的20个词汇和它们出现的次数；通过simhash算法计算分词结果的hash值，统计计算结果的hanming距离；将距离小于0.3的标记为相似，...

【专利技术属性】
技术研发人员：章超，夏立典，李晨，胡修宇，王丽乃，蔡国伟，张贺鑫，周诗苇，赖慧钤，蔡怡航，王永平，钟万栋，宋学翔，孟立成，
申请(专利权)人：浙江华云信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人