一种负面舆情判断方法和装置制造方法及图纸

技术编号:20842519 阅读:23 留言:0更新日期:2019-04-13 08:44
本申请实施例公开了一种负面舆情判断方法和装置,首先通过处理设备确定待识别舆情中出现的负面关键词和每个负面关键词的出现次数,根据所述负面关键词和所述每个负面关键词的出现次数可以确定出所述待识别舆情的负面评分,若所述待识别舆情的负面评分大于或等于预设阈值,将所述待识别舆情判断为负面舆情。从而实现了通过负面关键词匹配的方式自动识别舆情是否为负面舆情,避免了人为因素的影响,提高了识别效率和稳定性。

【技术实现步骤摘要】
一种负面舆情判断方法和装置
本申请涉及数据处理领域,特别是涉及一种负面舆情判断方法和装置。
技术介绍
舆情,是“舆论情况”的简称,是民众对某一企业、个人、社会机构等组织围绕着某一社会事件所表达的态度、意见、言论的总和。随着互联网的发展,网民对某一事件的观点表达通过网络媒体传播形成了网络舆情,由于网络信息的发布成本极低,传播渠道多、传播速度快、传播范围广,并伴随着谣言与非理性的声音,网络舆情已成为舆情的主流模式,一旦未有效处理,容易形成强大的意见声势,成为引发公司或政府的公众事件的导火索。金融行业本质上经营的是“信任”,相比较于其他行业,打造良好的企业形象对于金融行业从业者及公司机构而言更加重要。然而一些金融企业会通过散布“正面舆情”误导用户以此获利,例如很多P2P机构在暴雷前会有组织的通过网络媒体制造“正面舆情”,如散布某某平台经营业绩增长,未来发展势头良好等新闻,并组织大量媒体转载,吸引投资者投资后卷款跑路,最终引发了群体性事件。故此,舆情是金融监管机构信息获取的核心要素,需要对网络上的舆情进行准确的判断识别,尤其是需要判断出负面舆情,从而可以通过负面舆情准确的识别金融企业的实际运营状况,并以此判断舆情传播渠道中是否散布针对金融企业的虚假消息,在确定时第一时间干预辟谣,有效避免风险的进一步恶化。当前主流的判断舆情的手段主要以人工检查为主,即由专人负责,以人工的方式定期查看相关的新闻信息,结合业务的理解人工判断负面舆情。随着网络媒体特别是自媒体的快速发展,现有舆情监测手段难以满足业务需求。具体体现在:人工效率较低,缺乏对舆情的全面评估。以人工查看为主需要人工逐一浏览每一媒体上的舆情,判断是否为负面舆情,这首先需要投入大量的人力资源;其次受限于每一个人的行业经验差异,每个人对舆情的影响力、传播度的判断衡量标准有差异,影响到对舆情的综合分析;第三人工统计舆情数据也增加了操作风险,如遗漏某个重要的舆情。
技术实现思路
为了解决上述技术问题,本申请提供了本申请实施例公开了如下技术方案:第一方面,本申请实施例提供了一种负面舆情判断方法,所述方法包括:确定待识别舆情中出现的负面关键词和每个负面关键词的出现次数;根据所述负面关键词和所述每个负面关键词的出现次数确定所述待识别舆情的负面评分;若所述待识别舆情的负面评分大于或等于预设阈值,将所述待识别舆情判断为负面舆情。可选的,针对所述负面关键词中任意一个目标关键词,所述根据所述负面关键词和所述出现次数确定所述待识别舆情的负面评分,包括:根据所述目标关键词的负面权重分和所述目标关键词的出现次数确定所述目标关键词对所述待识别舆情的子负面评分;根据每个负面关键词的子负面评分计算所述待识别舆情的负面评分。可选的,所述目标关键词的负面权重分根据如下方式确定:根据所述目标关键词与第一样本集进行匹配,所述第一样本集包括已识别的多个负面舆情和多个非负舆情;根据所述第一样本集中出现了所述目标关键词的负面舆情的后验条件概率,以及所述第一样本集中负面舆情的先验概率确定所述目标关键词的负面权重分。可选的,所述预设阈值根据如下方式确定:获取第二样本集,所述第二样本集包括已识别的多个负面舆情和多个非负舆情,以及所述多个负面舆情和多个非负舆情的负面评分;根据标注模型,采用不同的识别阈值对第二样本集中的舆情进行负面舆情的识别;若目标识别阈值下的识别结果与所述第二样本集的实际结果间的符合度满足预设条件,将目标识别阈值作为所述预设阈值。可选的,在所述确定待识别舆情中出现的负面关键词和每个负面关键词的出现次数之前,所述方法还包括:获取包括多个待定舆情的舆情集合;根据所述多个待定舆情的标题对所述舆情集合进行舆情过滤;将过滤后的任意一个待定舆情作为所述待识别舆情。可选的,针对所述负面关键词中任意一个目标关键词,所述确定待识别舆情中出现的负面关键词和每个负面关键词的出现次数,包括:根据所述目标关键词在所述待识别舆情中匹配到文本位置,确定包括所述目标关键词的上下文信息;识别所述上下文信息的语义表达倾向;若所述语义表达倾向为正向,确定在所述文本位置未匹配到所述目标关键词。第二方面,本申请实施例提供了一种负面舆情判断装置,所述装置包括确定单元、计算单元和判断单元:所述确定单元,用于确定待识别舆情中出现的负面关键词和每个负面关键词的出现次数;所述计算单元,用于根据所述负面关键词和所述每个负面关键词的出现次数确定所述待识别舆情的负面评分;所述判断单元,用于若所述待识别舆情的负面评分大于或等于预设阈值,将所述待识别舆情判断为负面舆情。可选的,针对所述负面关键词中任意一个目标关键词,所述计算单元还用于:根据所述目标关键词的负面权重分和所述目标关键词的出现次数确定所述目标关键词对所述待识别舆情的子负面评分;根据每个负面关键词的子负面评分计算所述待识别舆情的负面评分。可选的,所述计算单元还用于根据如下方式确定所述目标关键词的负面权重分:根据所述目标关键词与第一样本集进行匹配,所述第一样本集包括已识别的多个负面舆情和多个非负舆情;根据所述第一样本集中出现了所述目标关键词的负面舆情的后验条件概率,以及所述第一样本集中负面舆情的先验概率确定所述目标关键词的负面权重分。可选的,所述计算单元还用于根据如下方式确定所述预设阈值:获取第二样本集,所述第二样本集包括已识别的多个负面舆情和多个非负舆情,以及所述多个负面舆情和多个非负舆情的负面评分;根据标注模型,采用不同的识别阈值对第二样本集中的舆情进行负面舆情的识别;若目标识别阈值下的识别结果与所述第二样本集的实际结果间的符合度满足预设条件,将目标识别阈值作为所述预设阈值。可选的,所述装置还包括过滤单元,所述过滤单元用于:获取包括多个待定舆情的舆情集合;根据所述多个待定舆情的标题对所述舆情集合进行舆情过滤;将过滤后的任意一个待定舆情作为所述待识别舆情。可选的,针对所述负面关键词中任意一个目标关键词,所述确定单元还用于:根据所述目标关键词在所述待识别舆情中匹配到文本位置,确定包括所述目标关键词的上下文信息;识别所述上下文信息的语义表达倾向;若所述语义表达倾向为正向,确定在所述文本位置未匹配到所述目标关键词。由上述技术方案可以看出,首先通过处理设备确定待识别舆情中出现的负面关键词和每个负面关键词的出现次数,根据所述负面关键词和所述每个负面关键词的出现次数可以确定出所述待识别舆情的负面评分,若所述待识别舆情的负面评分大于或等于预设阈值,将所述待识别舆情判断为负面舆情。从而实现了通过负面关键词匹配的方式自动识别舆情是否为负面舆情,避免了人为因素的影响,提高了识别效率和稳定性。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种负面舆情判断方法的方法流程图;图2为本申请实施例提供的一种负面舆情判断装置的装置结构图。具体实施方式下面结合附图,对本申请的实施例进行描述。目前网络舆情是金融监管机构信息获取的核心要素,以2018年以来诸多P2P暴雷为例,很多P2P机本文档来自技高网
...

【技术保护点】
1.一种负面舆情判断方法,其特征在于,所述方法包括:确定待识别舆情中出现的负面关键词和每个负面关键词的出现次数;根据所述负面关键词和所述每个负面关键词的出现次数确定所述待识别舆情的负面评分;若所述待识别舆情的负面评分大于或等于预设阈值,将所述待识别舆情判断为负面舆情。

【技术特征摘要】
1.一种负面舆情判断方法,其特征在于,所述方法包括:确定待识别舆情中出现的负面关键词和每个负面关键词的出现次数;根据所述负面关键词和所述每个负面关键词的出现次数确定所述待识别舆情的负面评分;若所述待识别舆情的负面评分大于或等于预设阈值,将所述待识别舆情判断为负面舆情。2.根据权利要求1所述的方法,其特征在于,针对所述负面关键词中任意一个目标关键词,所述根据所述负面关键词和所述出现次数确定所述待识别舆情的负面评分,包括:根据所述目标关键词的负面权重分和所述目标关键词的出现次数确定所述目标关键词对所述待识别舆情的子负面评分;根据每个负面关键词的子负面评分计算所述待识别舆情的负面评分。3.根据权利要求2所述的方法,其特征在于,所述目标关键词的负面权重分根据如下方式确定:根据所述目标关键词与第一样本集进行匹配,所述第一样本集包括已识别的多个负面舆情和多个非负舆情;根据所述第一样本集中出现了所述目标关键词的负面舆情的后验条件概率,以及所述第一样本集中负面舆情的先验概率确定所述目标关键词的负面权重分。4.根据权利要求1所述的方法,其特征在于,所述预设阈值根据如下方式确定:获取第二样本集,所述第二样本集包括已识别的多个负面舆情和多个非负舆情,以及所述多个负面舆情和多个非负舆情的负面评分;根据标注模型,采用不同的识别阈值对第二样本集中的舆情进行负面舆情的识别;若目标识别阈值下的识别结果与所述第二样本集的实际结果间的符合度满足预设条件,将目标识别阈值作为所述预设阈值。5.根据权利要求1-4任意一项所述的方法,其特征在于,在所述确定待识别舆情中出现的负面关键词和每个负面关键词的出现次数之前,所述方法还包括:获取包括多个待定舆情的舆情集合;根据所述多个待定舆情的标题对所述舆情集合进行舆情过滤;将过滤后的任意一个待定舆情作为所述待识别舆情。6.根据权利要求1-4任意一项所述的方法,其特征在于,针对所述负面关键词中...

【专利技术属性】
技术研发人员:耿琦苏谦余训培
申请(专利权)人:上海优扬新媒信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1