【技术实现步骤摘要】
一种用于负面新闻预警的方法和装置
本申请涉及计算机
,尤其涉及一种用于负面新闻预警的技术方案。
技术介绍
随着自媒体时代的到来,网络新闻成为信息传递的一种重要载体,具有实时发布、传播速度快、影响面广、渠道多等特点,通过新闻往往能够在第一时间获得数据,例如,投资新闻是获取投资公司运营状况的第一手数据。一则网络新闻对于其关注者来说,可能是正面的也可能是负面的,能否及时获知负面新闻可能会影响机构的一些重大决策,因此如何进行负面新闻预警成为亟需解决的问题。然而,网络新闻的数量非常巨大,新闻数据又属于非结构化数据,因此很难通过简单的规则去准确判定网络新闻的正负面,现有技术中,通常通过一些关键词匹配或者简单机器学习的方法来判别负面新闻,但是该方案的准确率较低,并且人工维护成本高,且现有的新闻风险预警主要是针对新闻的正文部分来进行复杂的提取,操作过程非常复杂。
技术实现思路
本申请的目的是提供一种用于负面新闻预警的技术方案,从而能够通过对新闻信息进行监控获得第一手的负面新闻,并精准的推送负面新闻对应的预警信息。< ...
【技术保护点】
1.一种用于负面新闻预警的方法,其中,所述方法包括:/n获得新闻信息,对所述新闻信息进行预处理,得到所述新闻信息对应的主题信息;/n根据所述主题信息,判断所述新闻信息是否为负面新闻;/n若所述新闻信息为负面新闻,识别所述新闻信息对应的关键实体;/n针对所述关键实体,利用构建的知识图谱进行检索,得到所述新闻信息对应的预警对象;/n确定所述新闻信息对应的预警信息,并将所述预警信息发送给所述预警对象。/n
【技术特征摘要】
1.一种用于负面新闻预警的方法,其中,所述方法包括:
获得新闻信息,对所述新闻信息进行预处理,得到所述新闻信息对应的主题信息;
根据所述主题信息,判断所述新闻信息是否为负面新闻;
若所述新闻信息为负面新闻,识别所述新闻信息对应的关键实体;
针对所述关键实体,利用构建的知识图谱进行检索,得到所述新闻信息对应的预警对象;
确定所述新闻信息对应的预警信息,并将所述预警信息发送给所述预警对象。
2.根据权利要求1所述的方法,其中,所述获得新闻信息,对所述新闻信息进行预处理,得到所述新闻信息对应的主题信息,包括:
获得新闻信息,通过对所述新闻信息进行预处理来获得所述新闻信息对应的标题信息和摘要信息;
将所述标题信息和所述摘要信息进行拼接,得到所述新闻信息对应的主题信息。
3.根据权利要求2所述的方法,其中,所述获得新闻信息,通过对所述新闻信息进行预处理来获得所述新闻信息对应的标题信息和摘要信息,包括:
获得新闻信息,提取所述新闻信息中的标题信息;
检测所述新闻信息中是否存在摘要信息,若存在,提取所述新闻信息中摘要信息,否则,利用抽取式摘要生成算法来生成所述新闻信息对应的摘要信息。
4.根据权利要求1至3中任一项所述的方法,其中,所述根据所述主题信息,判断所述新闻信息是否为负面新闻,包括:
将所述主题信息输入至训练好的情感分析模型,得到所述情感分析模型输出的判定结果,其中,若所述判定结果大于或等于预定阈值,则所述新闻信息为负面新闻,若所述判断结果小于预定阈值,则所述新闻信息为正面新闻。
5.根据权利要求4所述的方法,其中,所述方法还包括:
根据已标注有正负面标签的多项新闻样本数据,构建第一训练集合和第一测试集合;
根据所述第一训练集合和第一测试集合,并利用BERT预训练模型进行微调,来得到所述情感分析模型。
6.根据权利要求1至4中任一项所述的方法,其中,所述若所述新闻信息为负面新闻,识别所述新闻信息对应的关键实体,包括:
若所述新闻信息为负面新闻,将所述主题信息输入至训练好的命名实体识别模型,获得所述命名实体识别模型输出的、所述新闻信息对应的关键实体。
7.根据权利要求6所述的方法,其中,所述方法还包括:
根据已标注有识别对象的多项新闻样本数据,构建第二训练集合和第二测试集合;
根据所述第二训练集合和第二测试集合,并利用BERT预训练模型进行微调,来得到所述命名实体识别模型。
8.根据权利要求1至7中任一项所述的方法,其中,所述针对所述关键实体,利用构...
【专利技术属性】
技术研发人员:吴高升,尹大胐,王咏刚,
申请(专利权)人:创新工场北京企业管理股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。