【技术实现步骤摘要】
一种基于新闻舆情的时间序列预测方法
本专利技术属于时间序列预测
,更具体地,涉及一种基于新闻舆情的时间序列预测方法。
技术介绍
时间序列是随着时间变化的某种现象的数字序列,如物品的销量序列、价格变动序列、某支股票价格的变化、某地降雨量变化等。时间序列预测是对这一数字序列进行处理,分析,并发现其变化规律,时间序列预测对国计民生具有重要的意义,如对电影的票房预测使得影院能够更好的排片,对地区的经济情况进行预测,为公司、国家的投资提供支持等等。传统的时间序列预测方法以统计学方法为主,其中差分自回归移动平均模型(AutoregressiveIntegratedMovingAverageModel,ARIMA)是统计学方法中最广泛使用的用于时间序列预测的模型之一,该方法实现简单,训练速度快,但是ARIMA模型具有很大的局限性,它要求时序数据是稳定的,这在实际应用中基本是不存在的。近年来,神经网络技术的研究取得了实质的进展,神经网络模拟人类神经元的结构,以多层感知机(Multi-LayerPerception,MLP)为基础而构建,利用反向传播(BackPropagat ...
【技术保护点】
1.一种基于新闻舆情的时间序列预测方法,其特征在于,包括:(1)根据时间序列数据的时间片信息获取包含目标关键词的新闻,并计算每个时间片对应新闻的舆情向量;(2)所述时间序列数据和计算得到的舆情向量构成新数据集,利用卷积神经网络获取所述新数据集的历史长期依赖特征和历史短期依赖特征;(3)将所述新数据集和获取到的历史长期依赖特征、历史短期依赖特征作为训练集,输入搭建好的LSTM网络中进行训练,训练完成后得到时间序列预测模型;(4)将待预测的时间序列数据和对应的新闻输入到所述时间序列预测模型中进行预测,得到预测的目标信息。
【技术特征摘要】
1.一种基于新闻舆情的时间序列预测方法,其特征在于,包括:(1)根据时间序列数据的时间片信息获取包含目标关键词的新闻,并计算每个时间片对应新闻的舆情向量;(2)所述时间序列数据和计算得到的舆情向量构成新数据集,利用卷积神经网络获取所述新数据集的历史长期依赖特征和历史短期依赖特征;(3)将所述新数据集和获取到的历史长期依赖特征、历史短期依赖特征作为训练集,输入搭建好的LSTM网络中进行训练,训练完成后得到时间序列预测模型;(4)将待预测的时间序列数据和对应的新闻输入到所述时间序列预测模型中进行预测,得到预测的目标信息。2.根据权利要求1所述的一种基于新闻舆情的时间序列预测方法,其特征在于,步骤(1)中所述计算每个时间片对应新闻的舆情向量,具体包括:(1.1)对获取的所有新闻进行分词处理,并去掉停用词;(1.2)对去除停用词后的所有新闻进行向量表示,并对同一时间片对应的新闻向量求平均,得到每个时间片对应的平均向量;(1.3)将每个时间片对应的平均向量输入LSTM网络,得到每个时间片的新闻表示矩阵;(1.4)对每个时间片的新闻表示矩阵进行非线性变换,并对非线性变换后的新闻表示矩阵中的每一行向量进行归一化,得到多个注意力表示向量组成的矩阵;(1.5)根据每个时间片的新闻表示矩阵和多个注意力表示向量组成的矩阵,得到每个时间片对应...
【专利技术属性】
技术研发人员:李玉华,赵军豪,李瑞轩,辜希武,袁佳丽,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。