一种基于近邻传播的股票预测方法、系统、装置和介质制造方法及图纸

技术编号:22330767 阅读:34 留言:0更新日期:2019-10-19 12:24
本发明专利技术涉及一种基于近邻传播的股票预测方法、系统、装置和介质,包括获取多只股票的历史交易数据,对任一只股票的历史交易数据进行处理得到该股票的目标特征向量集合;根据该股票的目标特征向量集合直接获取其他剩余股票的目标特征向量集合;采用近邻传播方法,根据所有目标特征向量集合对所有历史交易数据进行近邻传播聚类分析得到聚类结果;根据聚类结果在待预测股票所属簇群内选取预设数量的样本股票,并基于支持向量机训练方法,根据目标特征向量集合和样本股票对应的历史交易数据得到股票趋势预测模型;根据股票趋势预测模型对待预测股票进行预测得到预测结果。本发明专利技术运算量较低,运算时间较短,占用内存小,可并行性高,预测准确率高。

【技术实现步骤摘要】
一种基于近邻传播的股票预测方法、系统、装置和介质
本专利技术涉及特定时间段的股票涨跌趋势预测
,尤其涉及一种基于近邻传播的股票预测方法、系统、装置和介质。
技术介绍
股市是资本资源优化配置的一个重要场所,掌握其变化规律不仅是投资者梦寐以求的事,也对宏观国民经济的研究和管理有着重要的现实意义。由于影响股价的因素包括企业内部因素、经济因素、制度因素和人们的心理因素等等,各种因素的影响程度和方式各不相同,因此股价的准确预测难度很大。目前,股价的预测主要是对股票涨跌趋势进行预测。随着互联网技术和计算机技术的发展,越来越多的基于神经网络算法的预测方法应用在股票涨跌趋势预测中。常用到的算法有:BP神经网络算法、RNN循环神经网络算法和LSTM神经网络算法等,其中,BP神经网络算法具有很强的非线性映射能力和自学习能力,但是学习速度慢,容易出现“过拟合”现象;RNN循环神经网络算法不仅会学习当前时刻的信息,也会依赖之前的序列信息,但是当距离增加时,RNN变得无法连接相关信息;LSTM神经网络算法中神经元拥有特殊的门结构,能够学习长距离依赖关系,但是占用内存大,不能够并行处理。
技术实现思路
本专利技术所要解决的技术问题是针对上述现有技术的不足,提供一种基于近邻传播的股票预测方法、系统、装置和介质,克服了传统的基于神经网络算法来预测股票涨跌趋势的缺陷,明显提高了分析和预测股票涨跌趋势的准确率。本专利技术解决上述技术问题的技术方案如下:一种基于近邻传播的股票预测方法,包括以下步骤:步骤1:获取多只股票在预设时间内的多个历史交易数据,对任一只所述股票的所述历史交易数据中的特征向量集合进行处理,得到对应的一只所述股票的目标特征向量集合;步骤2:根据步骤1中得到的对应的一只所述股票的所述目标特征向量集合,直接获取与步骤1中其他剩余所述股票一一对应的多个所述目标特征向量集合;步骤3:采用近邻传播方法,根据所有所述目标特征向量集合对所有所述股票对应的所述历史交易数据进行近邻传播聚类分析,得到聚类结果;步骤4:根据聚类结果在待预测股票所属簇群内,选取预设数量的样本股票,并基于支持向量机训练方法,根据所述目标特征向量集合和所述样本股票对应的所述历史交易数据,得到股票趋势预测模型;步骤5:根据所述股票趋势预测模型对所述待预测股票进行预测,得到预测结果。本专利技术的有益效果是:由于任一只股票的历史交易数据中的特征向量集合中包含多个特征向量,各个特征向量之间均具有相关性,且相关性有强有弱,因此通过对任一只股票的历史交易数据中的特征向量集合进行处理,可以分析出相关性较弱的目标特征向量集合,从而得到该任一只股票对应的目标特征向量集合,通过该任一只对应的目标特征向量集合可以直接获取其他剩余股票一一对应的目标特征向量集合;通过每一只股票对应的目标特征向量集合既可以表示出每一只股票所有的特征向量之间的关系,还可以降低整个股票涨跌趋势预测过程运算量和运算时间,同时还可以提高后续根据所有股票对应的所有目标特征向量集合进行支持向量机训练的速度,占用内存小,从而便于提高整个股票涨跌趋势预测过程的效率;近邻传播方法(AffinityPropagation,AP)是一种新的聚类算法,根据N个数据点之间的相似度进行聚类,因此本专利技术通过近邻传播方法对所有股票进行近邻传播聚类分析,可以将相似度较大的股票,即具有相同波动性的股票聚类在同一个簇群里,便于后续根据聚类结果进行支持向量机训练,可并行性高,即可使得得到的股票趋势预测模型能准确预测出待预测股票的涨跌趋势,且明显提高了预测准确率;其中,待预测股票可以是步骤1中的多只股票中的任一只股票,也可以是与该多只股票中的其中一只属于同一类型的股票;其中,预设时间可以根据实际情况选择。在上述技术方案的基础上,本专利技术还可以做如下改进:进一步:所述特征向量集合包括六个特征向量,分别为开盘价、收盘价、最高价、最低价、成交量和成交额;在所述步骤1中,得到所述目标特征向量集合的具体步骤包括:步骤1.1:对六个所述特征向量分别进行相关性分析,计算得到六个所述特征向量两两之间的多个相关系数;计算第i个所述特征向量和第j个所述特征向量之间的所述相关系数的具体公式为:其中,vi为第i个所述特征向量,vj为第j个所述特征向量,nij为第i个所述特征向量和第j个所述特征向量之间的所述相关系数,ui为第i个所述特征向量的期望值,uj为第j个所述特征向量的期望值,D(vi)为第i个所述特征向量的方差,D(vj)为第j个所述特征向量的方差,E(·)为求数学期望运算;步骤1.2:将所有所述相关系数从小到大排序,得到相关系数序列,并从所述相关系数序列的前端开始确定所述目标特征向量集合;其中,所述目标特征向量集合包括第一目标特征向量和第二目标特征向量。上述进一步方案的有益效果是:通过公式(1)可以计算出特征向量集合中六个特征向量两两之间的相关系数,对相关系数按照从小到达排序即可准确判断出相关性较弱的特征向量,从而得到目标特征向量集合,具体地,可以从相关系数序列的前端开始选取两个对应的目标特征向量,即第一目标特征向量和第二目标特征向量,便于根据该第一目标特征向量和该第二目标特征向量来表示其他几个分别与二者具有较强相关性的特性向量,同时大大降低运算量、运算时间和占用内存,提高整个股票涨跌趋势预测的效率;其中,根据相关系数的大小选取目标特征向量集合,目标特征向量集合中的向量个数可根据实际情况而定。进一步:在所述步骤3之前还包括:步骤3.0:对所有所述历史交易数据中的停牌数据分别进行填充处理后,得到多个处理历史交易数据。上述进一步方案的有益效果是:由于历史交易数据中存在停牌数据,可以将停牌时间较短的停牌数据进行填充,有效防止了扩大数据规模,可以避免影响后续的近邻传播聚类分析,从而影响预测结果。进一步:在所述步骤3中,得到所述聚类结果的具体步骤包括:步骤3.1:对所有所述目标特征向量集合中的所有所述第一目标特征向量分别进行二范数归一化处理,得到多个第一处理特征向量,和/或,对所有所述目标特征向量集合中的所有所述第二目标特征向量进行二范数归一化处理,得到多个第二处理特征向量;第x只所述股票和第y只所述股票分别在第t个交易日的所述第一处理特征向量分别为:其中,为第x只所述股票在第t个交易日的所述第一处理特征向量,xt_1为第x只所述股票在第t个交易日的所述第一目标特征向量,为第y只所述股票在第t个交易日的所述第一处理特征向量,yt_1为第y只所述股票在第t个交易日的所述第一目标特征向量,T为交易日的总天数;第x只所述股票和第y只所述股票分别在第t个交易日的所述第二处理特征向量分别为:其中,为第x只所述股票在第t个交易日的所述第二处理特征向量,xt_2为第x只所述股票在第t个交易日的所述第二目标特征向量,为第y只所述股票在第t个交易日的所述第二处理特征向量,yt_2为第y只所述股票在第t个交易日的所述第二目标特征向量;步骤3.2:确定每一只所述股票的所述第一处理特征向量在相邻两个交易日之间的第一特征向量涨跌差值,和/或,确定每一只所述股票的所述第二处理特征向量在相邻两个交易日之间的第二特征向量涨跌差值;第x只所述股票和第y只所述股票分别在第t-1个交易日与第t个交易日之间的所述本文档来自技高网...

【技术保护点】
1.一种基于近邻传播的股票预测方法,其特征在于,包括以下步骤:步骤1:获取多只股票在预设时间内的多个历史交易数据,对任一只所述股票的所述历史交易数据中的特征向量集合进行处理,得到对应的一只所述股票的目标特征向量集合;步骤2:根据步骤1中得到的对应的一只所述股票的所述目标特征向量集合,直接获取与步骤1中其他剩余所述股票一一对应的多个所述目标特征向量集合;步骤3:采用近邻传播方法,根据所有所述目标特征向量集合对所有所述股票对应的所述历史交易数据进行近邻传播聚类分析,得到聚类结果;步骤4:根据聚类结果在待预测股票所属簇群内,选取预设数量的样本股票,并基于支持向量机训练方法,根据所述目标特征向量集合和所述样本股票对应的所述历史交易数据,得到股票趋势预测模型;步骤5:根据所述股票趋势预测模型对所述待预测股票进行预测,得到预测结果。

【技术特征摘要】
1.一种基于近邻传播的股票预测方法,其特征在于,包括以下步骤:步骤1:获取多只股票在预设时间内的多个历史交易数据,对任一只所述股票的所述历史交易数据中的特征向量集合进行处理,得到对应的一只所述股票的目标特征向量集合;步骤2:根据步骤1中得到的对应的一只所述股票的所述目标特征向量集合,直接获取与步骤1中其他剩余所述股票一一对应的多个所述目标特征向量集合;步骤3:采用近邻传播方法,根据所有所述目标特征向量集合对所有所述股票对应的所述历史交易数据进行近邻传播聚类分析,得到聚类结果;步骤4:根据聚类结果在待预测股票所属簇群内,选取预设数量的样本股票,并基于支持向量机训练方法,根据所述目标特征向量集合和所述样本股票对应的所述历史交易数据,得到股票趋势预测模型;步骤5:根据所述股票趋势预测模型对所述待预测股票进行预测,得到预测结果。2.根据权利要求1所述的基于近邻传播的股票预测方法,其特征在于,所述特征向量集合包括六个特征向量,分别为开盘价、收盘价、最高价、最低价、成交量和成交额;在所述步骤1中,得到所述目标特征向量集合的具体步骤包括:步骤1.1:对六个所述特征向量分别进行相关性分析,计算得到六个所述特征向量两两之间的多个相关系数;计算第i个所述特征向量和第j个所述特征向量之间的所述相关系数的具体公式为:其中,vi为第i个所述特征向量,vj为第j个所述特征向量,nij为第i个所述特征向量和第j个所述特征向量之间的所述相关系数,ui为第i个所述特征向量的期望值,uj为第j个所述特征向量的期望值,D(vi)为第i个所述特征向量的方差,D(vj)为第j个所述特征向量的方差,E(·)为求数学期望运算;步骤1.2:将所有所述相关系数从小到大排序,得到相关系数序列,并从所述相关系数序列的前端开始确定所述目标特征向量集合;其中,所述目标特征向量集合包括第一目标特征向量和第二目标特征向量。3.根据权利要求2所述的基于近邻传播的股票预测方法,其特征在于,在所述步骤3之前还包括:步骤3.0:对所有所述历史交易数据中的停牌数据分别进行填充处理后,得到多个处理历史交易数据。4.根据权利要求3所述的基于近邻传播的股票预测方法,其特征在于,在所述步骤3中,得到所述聚类结果的具体步骤包括:步骤3.1:对所有所述目标特征向量集合中的所有所述第一目标特征向量分别进行二范数归一化处理,得到多个第一处理特征向量,和/或,对所有所述目标特征向量集合中的所有所述第二目标特征向量进行二范数归一化处理,得到多个第二处理特征向量;第x只所述股票和第y只所述股票分别在第t个交易日的所述第一处理特征向量分别为:其中,为第x只所述股票在第t个交易日的所述第一处理特征向量,xt_1为第x只所述股票在第t个交易日的所述第一目标特征向量,为第y只所述股票在第t个交易日的所述第一处理特征向量,yt_1为第y只所述股票在第t个交易日的所述第一目标特征向量,T为交易日的总天数;第x只所述股票和第y只所述股票分别在第t个交易日的所述第二处理特征向量分别为:其中,为第x只所述股票在第t个交易日的所述第二处理特征向量,xt_2为第x只所述股票在第t个交易日的所述第二目标特征向量,为第y只所述股票在第t个交易日的所述第二处理特征向量,yt_2为第y只所述股票在第t个交易日的所述第二目标特征向量;步骤3.2:确定每一只所述股票的所述第一处理特征向量在相邻两个交易日之间的第一特征向量涨跌差值,和/或,确定每一只所述股票的所述第二处理特征向量在相邻两个交易日之间的第二特征向量涨跌差值;第x只所述股票和第y只所述股票分别在第t-1个交易日与第t个交易日之间的所述第一特征向量涨跌差值分别为:其中,为第x只所述股票在第t-1个交易日的所述第一处理特征向量,为第y只所述股票在第t-1个交易日的所述第一处理特征向量,x1为第x只所述股票在第t-1个交易日与第t个交易日之间的所述第一特征向量涨跌差值,y1为第y只所述股票在第t-1个交易日与第t个交易日之间的所述第一特征向量涨跌差值;第x只所述股票和第y只所述股票分别在第t-1个交易日与第t个交易日之间的所述第二特征向量涨跌差值分别为:其中,为第x只所述股票在第t-1个交易日的所述第二处理特征向量,为第y只所述股票在第t-1个交易日的所述第二处理特征向量...

【专利技术属性】
技术研发人员:黄巍胡迪易雪蓉
申请(专利权)人:武汉工程大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1