The invention relates to a combination of financial news deep learning stock prediction method, mainly includes the following steps: S1: according to the financial news, the use of web crawler technology, the relevant financial information from Sina Financial News and NetEase financial news crawls the corresponding stock corresponding, stored in the local database, the formation of financial news document database. S2: deal with financial news information, news emotional analysis. S3: RNN deep learning network based on LSTM. S4: training feature extraction. S5: model training and prediction. The invention utilizes the news sentiment analysis technology, the depth of RNN LSTM learning based on the prediction, while the invention combines the financial market investors most commonly used technical indexes as feature vector prediction, played a very good effect.
【技术实现步骤摘要】
本专利技术涉及深度学习预测领域,特别涉及一种结合财经新闻的深度学习股市预测方法。
技术介绍
证券市场与金融投资在现代社会中占有重要的地位。股票市场的建模和预测研究对我国的经济发展和金融建设具有重要意义,一直为人们所关注,股市行情受国家政策、经济形势、公司发展状况以及投资者心理等诸多因素的影响。常见的股市预测方法包括证券投资分析方法、时间序列预测分析法、非线性预测法。证券投资分析法包括基本分析法和技术分析法。基本分析法主要包括宏观经济分析和产业周期分析等,技术分析法是根据股市行情变化进行分析的方法。时间序列预测分析法是根据股市行情的历史数据来预测股票价格未来的发展趋势和特点。非线性预测法包括基于统计学理论的预测方法、神经网络方法、模糊逻辑预测法等等,但是这些方法往往对于过去的拟合效果非常好,但是对于未来实时的股票价格预测却不准,因为股票的价格受实时新闻以及公司公告影响,所以根据过去数据训练出来的模型并不能很好的适用于实时的股票价格。随着互联网技术的迅速发展和广发普及,普通投资者有越来越多的渠道获得更多的互联网信息。越来越多的财经网站每天都会推送大量的有关于各个公司的财经新闻以及很多媒体或者专家对于各个公司近来状况的解读,所以投资者会受到来自各个方面新闻信息的影响,这些新闻信息会影响投资者的判断。文本情感分析是指用自然语言处理、文本挖掘以及计算机语言学等方法来识别和提取原素材中的主观信息。现有的文本情感分析的途径大致可以集合成三类:关键词识别、词汇关联、统计方法。关键词识别是利用文本中出现的清楚定义的影响词,例如“开心”、“难过”、“伤心”等等,来影响分类; ...
【技术保护点】
一种结合财经新闻的深度学习股市预测方法,其特征在于包括以下步骤:S1:针对财经新闻,利用网络爬虫技术,从财经新闻中爬取相应股票对应的相关财经信息,形成财经新闻文档数据库;S2:处理财经新闻信息,进行新闻情绪分析;S3:构建基于LSTM的RNN深度学习网络;S4:训练特征提取;S5:模型训练以及预测。
【技术特征摘要】
1.一种结合财经新闻的深度学习股市预测方法,其特征在于包括以下步骤:S1:针对财经新闻,利用网络爬虫技术,从财经新闻中爬取相应股票对应的相关财经信息,形成财经新闻文档数据库;S2:处理财经新闻信息,进行新闻情绪分析;S3:构建基于LSTM的RNN深度学习网络;S4:训练特征提取;S5:模型训练以及预测。2.根据权利要求1所述的方法,其特征在于步骤S1中新闻来源端可以是新浪财经新闻或者网易财经新闻,并将所述财经新闻文档数据库存储在本地数据库中。3.根据权利要求1所述的方法,其特征在于步骤S2具体包括以下步骤:采用积极词频与消极词频比例的方式得到新闻所代表的乐观与悲观情绪,一个新闻情绪的量化计算方法如下:senti=log1+ΣPos1+ΣNeg]]>其中∑Pos代表新闻中词性为积极词汇的个数,∑Neg代表新闻中词性为消极词汇的个数,sentiment代表新闻文本的情绪倾向,sentiment越大,代表表面上该财经新闻信息看好未来金融市场或者相关股票的发展,认为股价会上涨,反之,则看衰未来金融市场或者金融股票的发展,认为股价会下跌。4.根据权利要求3所述的方法,其特征在于步骤S2中获取每一个新闻的情绪后,针对于股票市场中的每一支股票,依据如下公式,可以获得当日财经新闻对于这只股票的总的情绪倾向:sentiments=ΣsentiiΣnewsi]]>其中sentiments代表当日有关于股票s的财经新闻对于股票s的总的情绪倾向,∑newsi代表关于当前股票s的所有新闻的个数。其中总的情绪影响sentiments越大并且为正则说明有关财经新闻对于未来股票s的发展持积极情绪,认为股价会上涨,越小而且为负则说明有关财经新闻对于未来股票s的发展持消极情绪,认为股价会下跌。5.根据权利要求1所述的方法,其特征在于步骤S4具体包括以下步骤:包括8个输入信号以及1个输出信号,其中8个输入信号为x1表示当天的收盘、x2表示当天的成交额、x3表示当天的成交量、x4表示当天的涨跌、x5表示当天的换手率,以上输入信号通过爬虫或者证券资讯网站直接爬取得到,另外结合市场上普...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。