一种基于新闻特征抽取和循环神经网络的股票涨跌预测方法技术

技术编号：22308946 阅读：358 留言：0更新日期：2019-10-16 09:01

本发明专利技术公开了一种基于新闻特征抽取和循环神经网络的股票涨跌预测方法，其步骤包括：1)准备大量与股票相关的文档集合D，根据D生成一单词表V；2)设置利好种子集和利空种子集，并在D上计算得到最优标准集P

A method of stock up and down prediction based on news feature extraction and recurrent neural network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于新闻特征抽取和循环神经网络的股票涨跌预测方法
本专利技术涉及一种股票相关数据处理与价格涨跌预测的方法，尤其涉及一种基于新闻特征抽取和循环神经网络的股票涨跌预测方法，属于计算机领域。
技术介绍
股票价格的预测在商业和金融领域具有重要的意义。股票市场的预测在商业界和学术界都受到了广泛的关注。Fama于1965年提出了有效市场假说(EfficientMarketHypothesis)，他认为，股票市场是一个“有效信息”市场，股票价格充分反映了已经发生的事件，以及那些尚未发生但市场预期会发生的事件对股票价格的影响。这一假设为之后的股票预测工作提供了依据(FamaEF.Thebehaviorofstock-marketprices[J].ThejournalofBusiness,1965,38(1):34-105)。然而，预测股票价格依然十分困难，因为股票价格受到众多因素的影响。对于单个股票而言，除了国家的货币政策，行业的景气状况等宏观因素，股票上市公司的相关事件等微观因素也会对股票价格产生影响。因此，除了股票自身的价格信息，许多相关工作中都将股票相关的新闻信息作为预测股票价格的重要依据(LiQ,JiangLL,LiP,etal.Tensor-BasedLearningforPredictingStockMovements[C]//AAAI.2015:1784-1790；SchumakerRP,ChenH.Aquantitativestockpredictionsystembasedonfinancialnews[J].InformationProcessi...

【技术保护点】
1.一种基于新闻特征抽取和循环神经网络的股票涨跌预测方法，其步骤包括：1)准备大量与股票相关的文档集合D，根据文档集合D生成一单词表V；2)设置利好种子集Pseed和利空种子集Nseed，并在文档集合D上进行计算得到最优标准集P

【技术特征摘要】
1.一种基于新闻特征抽取和循环神经网络的股票涨跌预测方法，其步骤包括：1)准备大量与股票相关的文档集合D，根据文档集合D生成一单词表V；2)设置利好种子集Pseed和利空种子集Nseed，并在文档集合D上进行计算得到最优标准集P*和N*；3)对文档集合D进行查询，得到所有包含待预测股票名称的文档集合，其中，该文档集合中第i个交易日的文档doci为一个单词序列为文档doci中第ni个单词；4)利用最优标准集P*和N*计算该单词表V中每一单词w的利好极性polar(w)；然后根据各文档中单词的利好极性生成对应文档的新闻特征；其中，文档doci的新闻特征为f(doci)；5)根据该待预测股票在过去连续一段交易日内的价格序列生成一差分序列；6)将步骤4)得到的各文档的新闻特征和步骤5)得到的差分序列输入循环神经网络，训练得到一预测模型；7)利用训练好的该预测模型预测该待预测股票的涨跌。2.如权利要求1所述的方法，其特征在于，所述利好极性其中，P*为最优标准利好集，N*为最优标准利空集，pmi(w,v)为单词w和单词v之间的点互信息，最优标准利好集P*和最优标准利空集N*的单词总数分别为K和J。3.如权利要求2所述的方法，其特征在于，获取最优标准利好集P*和最优标准利空集N*的方法为：首先定义标准利好集P和标准利空集N，以及单词w在P和N上的利好极性polar(w)；其中，Pstd＝{wp1,wp2,…,wpK}，Nstd＝{wn1,wn2,…,wnJ}，Pstd为一组数量为K的未知的利好标准单词，Nstd为一组数量为J的未知的利空标准单词；然后根据公式s.t.|Pstd|＝K,|Nstd|＝J，求解得到最优标准集P*和N*。4.如权利要求3所述的方法，其特征在于，求解得到最优标准集P*和N*的方法为：定义单词在种子集合上的极性为通过求解公式s.t.|Pstd|＝K,|Nstd|＝J得到单词表V中的任意单词w的利好...

【专利技术属性】
技术研发人员：黄丽明，闫宏飞，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人