基于新闻信息的股票价格涨跌预测方法技术

技术编号:30146784 阅读:11 留言:0更新日期:2021-09-25 14:52
本发明专利技术公开了基于新闻信息的股票价格涨跌预测方法,涉及金融科学技术以及计算机人工智能领域。本发明专利技术包括S1、新闻内容信息转换成词向量,通过训练词向量,将分词后的词信息通过Word2vec转换成词向量表示;S2、通过LSTM进行新闻内容情感特征提取;S3、利用LSTM神经网络进行股票技术指标特征提取;S4、模型预测:将生成的情感特征值与训练得到的技术指标数据特征输入到BP神经网络中进行预测并根据预测结果生成交易指令。本发明专利技术是将新闻信息与技术指标结合,利用神经网络模型,对股票价格涨跌进行预测,利用文本分析法从中提取情感特征并与技术分析结合,提高对股票价格方向预测的准确性,给予投资者正确的引导。给予投资者正确的引导。给予投资者正确的引导。

【技术实现步骤摘要】
基于新闻信息的股票价格涨跌预测方法


[0001]本专利技术属于金融科学技术以及计算机人工智能领域,特别是涉及基于 新闻信息的股票价格涨跌预测方法。

技术介绍

[0002]股票价格的预测在商业和金融领域具有重要的意义。股票市场的预测 在商业界和学术界都受到了广泛的关注。Fama于1965年提出了有效市场假 说(Efficient Market Hypothesis),他认为,股票市场是一个“有效信息
”ꢀ
市场,股票价格充分反映了已经发生的事件,以及那些尚未发生但市场预 期会发生的事件对股票价格的影响。这一假设为之后的股票价格预测工作 提供了依据。
[0003]然而,预测股票价格依然十分困难,因为股票价格受到众多因素的影 响。对于单个股票而言,除了国家的货币政策,行业的景气状况等宏观因 素,股票上市公司的相关事件等微观因素也会对股票价格产生影响。因此, 除了股票自身的价格信息,许多相关研究都将股票相关的新闻信息作为预 测股票价格的重要依据。
[0004]由股票市场的复杂性可以看出,只将股票市场的技术指标作为预测的 考虑因素,即使利用机器学习或深度学习的方法来进行预测,得到的结果 并不理想。本专利技术在考虑股票技术指标的前提下,融入新闻信息的情感分 析特征进行股票价格涨跌预测。本专利技术采用循环神经网络方法对新闻信息 进行情感极性特征的提取,将情感分析的结果和技术指标作为股票价格方 向预测的特征值,采用BP神经网络方法进行预测。

技术实现思路

[0005]本专利技术提供了基于新闻信息的股票价格涨跌预测方法,解决了以上问 题。
[0006]为解决上述技术问题,本专利技术是通过以下技术方案实现的:
[0007]本专利技术的基于新闻信息的股票价格涨跌预测方法,包括如下步骤:
[0008]S1、新闻内容信息转换成词向量:将预处理后的文本数据利用结巴分 词工具和自建情感词典对文本数据进行分词处理;运用Word2vec工具训练 词向量,将分词后的词信息通过Word2vec转换成词向量表示;
[0009]S2、新闻内容情感特征提取:将词向量依照文本内的顺序依次输入到 LSTM中,LSTM将变长的输入转换成定长的输出,取LSTM最后时刻的输出 作为情感特征;
[0010]S3、股票技术指标特征提取:针对输入的技术指标数据采用LSTM神经 网络去捕捉股票技术指标的时间序列特征,利用技术指标构成的向量作为 循环神经网络每一时刻的输入;
[0011]S4、模型预测:将生成的情感特征值与训练得到的技术指标数据特征 输入到BP神经网络中进行预测,最后输出预测结果,根据预测结果生成交 易指令。
[0012]进一步地,所述步骤S1具体包括:
[0013]S11、获取历史新闻舆情信息和市场历史技术指标数据;
[0014]S12、对文本数据进行预处理,将预处理后的文本数据,利用结巴分词 工具,结合自建的情感词典对文本数据进行分词处理,获得词信息;
[0015]S13、运用Word2vec工具训练词信息,将分词后的词信息通过Word2vec 转换成词向量表示。
[0016]进一步地,所述步骤S3具体包括:
[0017]S31、对技术指标进行数据清洗,包括检查数据一致性、处理无效值和 缺失值等工作,对清理后的数据进行数据预处理;
[0018]S32、用LSTM捕捉预处理后的技术指标数据的时间序列特征;
[0019]S33、提取最后一次训练结果作为预测模型的训练特征。
[0020]进一步地,所述步骤S4具体包括:
[0021]S41、将情感分析特征和技术指标特征进行标准化处理,消除股票交易 数据和情绪数据间的量纲关系;
[0022]S42、建立基于BP神经网络的对未来股价涨跌的预测模型;
[0023]S43、获得实时股票市场新闻信息文本和技术指标数据,提取新闻内容 情感特征和股票技术指标特征,进行标准化处理;
[0024]S44、将标准化处理后的情感特征和技术指标特征输入预测模型,输出 预测结果;
[0025]S45、基于预测结果构建股票池;
[0026]S46、对股票池中的股票再次进行预测,得到交易信号;
[0027]S47、根据股票的持仓情况构建交易指令;
[0028]S48、执行交易指令。
[0029]进一步地,所述S11步骤中获取历史新闻舆情信息和市场历史技术指 标数据具体时使用python抓取关注度高的新闻网站和论坛的信息;通过编 写清洗规则剔除不能表达投资者情绪的新闻或主题贴,清洗规则包括无文 字的图片、无文字的链接、无意思表达的乱符和系统自动生成的实盘组合 这四种相关类型。
[0030]进一步地,所述步骤S3中的技术指标数据包括大盘的股票指数、收盘 价、开盘价、涨跌幅、成交量、指数平滑异同平均线MACD、随机指标KDJ、 相对强弱指标RSI和变动率指标ROC。
[0031]本专利技术相对于现有技术包括有以下有益效果:
[0032]1、本专利技术是将新闻信息与技术指标结合,利用神经网络模型,对股票 价格涨跌进行预测;传统预测股票价格走势的方法——技术分析和基础分 析——的边际效益逐渐降低,而新闻舆情作为一种有效的投资信息,利用 文本分析法,可以从中提取情感特征,作为增量信息,并将其与技术分析 结合,能够很大程度上提高对股票价格方向预测的准确性,给予投资者正 确的引导。
[0033]2、本专利技术选择循环神经网络方法对收集的新闻内容文本数据进行情感 分析,原因在于循环神经网络适用于大数据量,具有记忆性、参数共享性 的特点,而且它是一类以序列数据为输入,在序列的演进方向进行递归时, 所有的循环单元按链式连接形成闭合回路的递归神经网络。同时,自然语 言数据是典型的序列数据,循环神经网络处理序列数据具备内在的优势, 而且LSTM可以提取到更复杂的语义特征信息,在情感分析的任务上具有很 好的表现。
[0034]当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有 优点。
附图说明
[0035]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动 的前提下,还可以根据这些附图获得其他的附图。
[0036]图1为本专利技术的基于新闻信息的股票价格涨跌预测方法的流程示意图;
[0037]图2为本专利技术基于图1的流程对应的具体实施例的流程步骤图;
[0038]图3为基于本专利技术方法的新闻内容的情感特征提取的流程示意图;
[0039]图4为本专利技术的LSTM神经网络原理示意图。
具体实施方式
[0040]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进 行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例, 而不是全部的实施例。基于本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于新闻信息的股票价格涨跌预测方法,其特征在于,包括如下步骤:S1、新闻内容信息转换成词向量:将预处理后的文本数据利用结巴分词工具和自建情感词典对文本数据进行分词处理;运用Word2vec工具训练词向量,将分词后的词信息通过Word2vec转换成词向量表示;S2、新闻内容情感特征提取:将词向量依照文本内的顺序依次输入到LSTM中,LSTM将变长的输入转换成定长的输出,取LSTM最后时刻的输出作为情感特征;S3、股票技术指标特征提取:针对输入的技术指标数据采用LSTM神经网络去捕捉股票技术指标的时间序列特征,利用技术指标构成的向量作为循环神经网络每一时刻的输入;S4、模型预测:将生成的情感特征值与训练得到的技术指标数据特征输入到BP神经网络中进行预测,最后输出预测结果,根据预测结果生成交易指令。2.根据权利要求1所述的基于新闻信息的股票价格涨跌预测方法,其特征在于,所述步骤S1具体包括:S11、获取历史新闻舆情信息和市场历史技术指标数据;S12、对文本数据进行预处理,将预处理后的文本数据,利用结巴分词工具,结合自建的情感词典对文本数据进行分词处理,获得词信息;S13、运用Word2vec工具训练词信息,将分词后的词信息通过Word2vec转换成词向量表示。3.根据权利要求1所述的基于新闻信息的股票价格涨跌预测方法,其特征在于,所述步骤S3具体包括:S31、对技术指标进行数据清洗,包括检查数据一致性、处理无效值和缺失值等工作,对清理后的数据进行数据预处理;S...

【专利技术属性】
技术研发人员:陆洋李宜桐金基东
申请(专利权)人:上海卡方信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1