一种新闻情感影响预测方法技术

技术编号:37291032 阅读:37 留言:0更新日期:2023-04-21 03:20
本发明专利技术公开了一种面向领域专家的实时新闻情感影响预测的方法;方法包括实时新闻数据形成第一数据流并对该第一数据流进行预处理形成第二数据流;实时金融数据形成第三数据流、第二数据流依据用户预先定义的事件模式进行复杂事件处理,形成第四数据流;第四数据流输入机器学习模型输出预测结果,该预测结果人为标记事件模式并并入第二数据流与第三数据流,循环上述步骤。本发明专利技术将情感分析、复杂事件处理和自动机器学习有机结合,CEP通过事件模式匹配为机器学习的训练、验证、测试等数据集进行了实时准备,形成机器学习数据集,驱动实时新闻情感影响预测;本发明专利技术方法支持面向滑动时间窗口连续学习,AutoML可以随着实时事件数据的持续流入,连续学习,持续改进模型,不断提升预测效果。升预测效果。升预测效果。

【技术实现步骤摘要】
一种新闻情感影响预测方法


[0001]本专利技术属于实时大数据分析领域,特别涉及一种面向领域专家的实时新闻情感影响预测方法。

技术介绍

[0002]同一时间段内连续发生的一系列相关媒体信息,会对产业或经济社会产生“放大”了的影响。例如,接连发布的关于“XX疫苗”的好消息,可能会正面地影响某些医药企业或者整个医药行业。因此,准确而及时地依据新闻情感预估这样的影响,可以帮助相关政府部门、相关产业或企业以及投资人提前决策、及时调整规划和部署。文本情感分析模型(Sentiment Analysis model,SA模型)是指利用自然语言处理和文本挖掘技术,对带有情感色彩的主观性文本进行分析、处理和抽取的过程。
[0003]国内外对于新闻情感对产业的影响的研究主要分为两种:一是研究专注于产业数据的建模和评估,通常使用“基于字典”的情感词标记算法来确定情绪值,然后使用回归测试等传统的统计学分析方法判断新闻情感对产业的影响。如CN104573003B,该专利技术公开了一种基于新闻主题信息检索的金融时间序列预测方法。首先对原始新闻数据提取词汇组合特征(本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种新闻情感影响预测方法,其特征在于,所述方法包括如下步骤:实时新闻数据形成第一数据流并对该第一数据流进行预处理形成第二数据流;实时金融数据形成第三数据流与第二数据流依据用户预先定义的事件模式进行复杂事件处理形成第四数据流;第四数据流输入机器学习模型输出预测结果,该预测结果人为标记事件模式并并入第二数据流与第三数据流,循环上述步骤。2.根据权利要求1所述的一种新闻情感影响预测方法,其特征在于:实时新闻数据形成第一数据流并对该第一数据流进行预处理形成第二数据流的步骤具体包括:预先设置至少一个SA模型;该至少一个SA模型预处理第一数据流生成包含关键词及情感分数的第二数据流,并将该第二数据流存入新闻和情感数据库。3.根据权利要求1或2所述的一种新闻情感影响预测方法,其特征在于:所述实时金融数据形成第三数据流与第二数据流依据用户预先定义的事件模式进行复杂事件处理形成第四数据流的步骤具体包括:预先设置至少一个复杂事件处理模块;该至少一个复杂事件处理模块对第三数据流、第二数据流以及已有的事件模式进行预处理形成第四数据流。4.根据权利要求1所述的一种新闻情感影响预测方法,其特征在于:所述第四数据流输入机器学习模型输出预测结果,该预测结果人为标记事件模式并并入第二数据流与第三数据流,循环上述步骤的步骤具体包括:预先设置至少一个机器学习模型;该至少一个机器学习模型对第四数据流进行连续训练并实时预测生成预测结果;该预测结果人为标注后与第三数据流、第二数据流依据用户预先定义的事件模式进行复杂事件处理形成新一轮的第四数据流继续输入至少一个机器学习模型进行训练、学习。5.一种新闻情感影响预测系统,其特征在于,所述系统包括:情感分析服务模块:实时新闻数...

【专利技术属性】
技术研发人员:陈伟思肖伟东刘斌张旭
申请(专利权)人:厦门理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1