舆情数据的风险识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:30789514 阅读:12 留言:0更新日期:2021-11-16 07:52
本申请涉及数据监控领域,揭示了一种舆情数据的风险识别方法、装置、计算机设备及存储介质,方法包括:获取从平台收集的舆情数据;识别所述舆情数据,提取所述舆情数据的特征信息;从基于大数据预采集的特征数据库中获取各项特征信息的等级划分,根据各项特征信息的等级划分匹配所述特征信息对应的评分值;获取各项所述特征信息的影响权重,所述特征信息的影响权重基于历史舆情数据与所述历史舆情数据的风险标记,并通过机器学习算法进行训练而得到;根据所述特征信息的影响权重与对应的评分值,计算得到所述舆情数据的负面风险等级;输出所述舆情数据的负面风险等级。本申请能够对舆情数据进行精准定位,提高舆情数据风险识别的效率与准确率。的效率与准确率。的效率与准确率。

【技术实现步骤摘要】
舆情数据的风险识别方法、装置、计算机设备及存储介质


[0001]本申请涉及到数据监控领域,特别是涉及到一种舆情数据的风险识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]当前互联网高速发展,互联网上发生热门事件或热点事情,会在短时间内产生大量的舆情数据,目前,对于舆情数据的风险判定主要依靠人工经验来判别,需要耗费较大的人工,成本较高,且存在一定的滞后性,无法准确、高效地管理舆情数据。

技术实现思路

[0003]本申请的主要目的为提供一种舆情数据的风险识别方法、装置、计算机设备及存储介质,旨在解决目前无法准确、高效地识别舆情数据风险的问题。
[0004]为了实现上述专利技术目的,本申请提出一种舆情数据的风险识别方法,包括:
[0005]获取从平台收集的舆情数据;
[0006]识别所述舆情数据,提取所述舆情数据的特征信息;
[0007]从基于大数据预采集的特征数据库中获取各项特征信息的等级划分,根据各项特征信息的等级划分匹配所述特征信息对应的评分值;所述特征数据库包含各项特征信息对应的等级划分及各等级的评分值的对应关系;
[0008]获取各项所述特征信息的影响权重,所述特征信息的影响权重基于历史舆情数据与所述历史舆情数据的风险标记,并通过机器学习算法进行训练而得到;
[0009]根据所述特征信息的影响权重与对应的评分值,计算得到所述舆情数据的负面风险等级;
[0010]输出所述舆情数据的负面风险等级。
[0011]进一步地,所述识别所述舆情数据,提取所述舆情数据的特征信息,包括:
[0012]获取所述平台的文本发布模板;
[0013]基于所述文本发布模板识别对应平台的舆情数据,提取所述舆情数据的特征信息。
[0014]进一步地,所述获取从平台收集的舆情数据之前,还包括:
[0015]向平台发送授权请求;
[0016]接收所述平台基于所述授权请求返回的授权信息;
[0017]根据所述授权信息爬取所述平台的舆情数据。
[0018]进一步地,所述获取从平台收集的舆情数据之后,还包括:
[0019]获取平台的标识信息;
[0020]建立所述舆情数据与所述标识信息的关联;
[0021]将关联后的所述舆情数据与平台的标识信息存储至预设舆情数据库。
[0022]进一步地,所述特征信息包括曝光媒介;所述识别所述舆情数据,获取所述舆情数
据的特征信息,包括:
[0023]识别所述舆情数据,获取所述舆情数据的发布者名称;
[0024]根据预设建立的媒介清单数据库匹配所述发布者名称,确定所述发布者名称对应的曝光媒介及所述曝光媒介的运营等级。
[0025]进一步地,所述输出所述舆情数据的负面风险等级之后,还包括:
[0026]若所述负面风险等级高于预警级别,根据所述曝光媒介的运营等级匹配所述舆情数据的运营措施;
[0027]根据所述运营措施对所述舆情数据进行处理。
[0028]进一步地,,所述根据所述运营措施对所述舆情数据进行处理,包括:
[0029]获取发布所述舆情数据的平台;
[0030]将所述运营措施推送至所述平台,控制所述平台将所述运营措施应用至对应的舆情数据,以对所述舆情数据进行处理。
[0031]本申请还提供一种舆情数据的风险识别装置,包括:
[0032]数据获取模块,用于获取从平台收集的舆情数据;
[0033]特征识别模块,用于识别所述舆情数据,提取所述舆情数据的特征信息;
[0034]特征评分模块,用于从基于大数据预采集的特征数据库中获取各项特征信息的等级划分,根据各项特征信息的等级划分匹配所述特征信息对应的评分值;所述特征数据库包含各项特征信息对应的等级划分及各等级的评分值的对应关系;
[0035]权重获取模块,用于获取各项所述特征信息的影响权重,所述特征信息的影响权重基于历史舆情数据与所述历史舆情数据的风险标记,并通过机器学习算法进行训练而得到;
[0036]风险计算模块,用于根据所述特征信息的影响权重与对应的评分值,计算得到所述舆情数据的负面风险等级;
[0037]风险输出模块,用于输出所述舆情数据的负面风险等级。
[0038]本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述舆情数据的风险识别方法的步骤。
[0039]本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述舆情数据的风险识别方法的步骤。
[0040]本申请例提供了一种舆情数据的风险识别方法,互联网上的平台均存在舆情数据,通过获取互联网上平台的舆情数据,然后对所述舆情数据进行识别,提取所述舆情数据包含的特征信息,从不同的维度监测所述舆情数据,再从基于大数据预采集的特征数据库中获取各项特征信息的等级划分,根据各项特征信息的等级划分匹配所述特征信息对应的评分值;所述特征数据库包含各项特征信息对应的等级划分及各等级的评分值的对应关系,从而对所述特征信息进行等级量化与等级评分,然后获取各项所述特征信息的影响权重,所述特征信息的影响权重基于历史舆情数据与所述历史舆情数据的风险标记,并通过机器学习算法进行训练而得到,根据所述特征信息的影响权重与对应的评分值,计算得到所述舆情数据的负面风险等级,然后输出所述舆情数据的负面风险等级,通过不同的维度监测所述舆情数据,对所述舆情数据进行不同维度的量化与评分,从而对所述舆情数据进
行精准定位,准确识别舆情数据存在的风险,提高舆情数据风险的防范能力,提高舆情数据风险识别的效率与准确率。
附图说明
[0041]图1为本申请舆情数据的风险识别方法的一实施例流程示意图;
[0042]图2为本申请舆情数据的风险识别装置的一实施例结构示意图;
[0043]图3为本申请计算机设备的一实施例结构示意框图。
[0044]本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0045]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0046]参照图1,本申请实施例提供一种舆情数据的风险识别方法,包括步骤S10

S60,对于所述舆情数据的风险识别方法的各个步骤的详细阐述如下。
[0047]S10、获取从平台收集的舆情数据。
[0048]本实施例应用于舆情监控的场景,在互联网平台上,不同的用户、不同的媒介会发布各式各样不同的信息,通过监控平台发布的舆情数据,然后将所述舆情数据进行统筹,从而获取不同平台监控到的舆情数据。所述平台可以包含若干个不同的平台,从不同的平台上收集舆情数据;所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种舆情数据的风险识别方法,其特征在于,包括:获取从平台收集的舆情数据;识别所述舆情数据,提取所述舆情数据的特征信息;从基于大数据预采集的特征数据库中获取各项特征信息的等级划分,根据各项特征信息的等级划分匹配所述特征信息对应的评分值;所述特征数据库包含各项特征信息对应的等级划分及各等级的评分值的对应关系;获取各项所述特征信息的影响权重,所述特征信息的影响权重基于历史舆情数据与所述历史舆情数据的风险标记,并通过机器学习算法进行训练而得到;根据所述特征信息的影响权重与对应的评分值,计算得到所述舆情数据的负面风险等级;输出所述舆情数据的负面风险等级。2.根据权利要求1所述的舆情数据的风险识别方法,其特征在于,所述识别所述舆情数据,提取所述舆情数据的特征信息,包括:获取所述平台的文本发布模板;基于所述文本发布模板识别对应平台的舆情数据,提取所述舆情数据的特征信息。3.根据权利要求1所述的舆情数据的风险识别方法,其特征在于,所述获取从平台收集的舆情数据之前,还包括:向平台发送授权请求;接收所述平台基于所述授权请求返回的授权信息;根据所述授权信息爬取所述平台的舆情数据。4.根据权利要求1所述的舆情数据的风险识别方法,其特征在于,所述获取从平台收集的舆情数据之后,还包括:获取平台的标识信息;建立所述舆情数据与所述标识信息的关联;将关联后的所述舆情数据与平台的标识信息存储至预设舆情数据库。5.根据权利要求1所述的舆情数据的风险识别方法,其特征在于,所述特征信息包括曝光媒介;所述识别所述舆情数据,获取所述舆情数据的特征信息,包括:识别所述舆情数据,获取所述舆情数据的发布者名称;根据预设建立的媒介清单数据库匹配所述发布者名称,确定所述发布者名称对应的曝光媒介及所述曝光媒介的运营等级...

【专利技术属性】
技术研发人员:何丽英
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1