基于特征加权支持向量回归的股指预测方法、装置及介质制造方法及图纸

技术编号:33554505 阅读:17 留言:0更新日期:2022-05-26 22:51
本发明专利技术涉及一种基于特征加权支持向量回归的股指预测方法、装置及介质,方法包括:利用训练好的支持向量机模型对股票指数进行动态预测;支持向量机模型的训练过程包括以下步骤:采集某一交易日的股票指数以及该交易日前的若干个交易日的技术指标数据集,构成训练集,技术指标数据集包括若干项技术指标数据;2)对训练集进行归一化处理;通过因子模型筛选算法从若干项技术指标数据中筛选出若干项参考技术指标数据,并构建表征各项参考技术指标数据的权重的特征权重矩阵;利用特征权重矩阵对支持向量机模型的核函数映射过程进行加权。与现有技术相比,本发明专利技术具有精度高、鲁棒性高、自动化、节约人力资源等优点。节约人力资源等优点。节约人力资源等优点。

【技术实现步骤摘要】
基于特征加权支持向量回归的股指预测方法、装置及介质


[0001]本专利技术涉及一种数据预测技术,尤其是涉及一种基于特征加权支持向量回归的股指预测方法、装置及介质。

技术介绍

[0002]关于股指时间序列的预测问题一直是目前的难题,造成这种现状,本质上是因为股票市场是一个非线性的动态系统,加之受诸如政策、心理等不确定因素的影响,使得相关研究存在精度不高、鲁棒性不强的缺陷。
[0003]传统的时间序列ARIMA、GARCH模型通常适用于处理低维度时间序列数据,且预测精度不高,无法对复杂特征影响下的多维非线性时间序列数据进行准确预测。相比而言,机器学习中的支持向量机在处理这类复杂数据时更加行之有效。然而,业内多数研究采用支持向量机时仅等权处理每个特征,但是其中的核函数却是对特征高度敏感的,导致最终的预测结构的精确性和鲁棒性不高。

技术实现思路

[0004]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于特征加权支持向量回归的股指预测方法、装置及介质,精度高,鲁棒性高,自动化,节约人力资源。
[0005]本专利技术的目的可以通过以下技术方案来实现:
[0006]一种基于特征加权支持向量回归的股指预测方法,包括:
[0007]利用训练好的支持向量机模型对股票指数进行动态预测;
[0008]所述的支持向量机模型的训练过程包括以下步骤:
[0009]1)采集某一交易日的股票指数以及该交易日前的若干个交易日的技术指标数据集,构成训练集,所述的技术指标数据集包括若干项技术指标数据;
[0010]2)对训练集进行归一化处理;
[0011]3)通过因子模型筛选算法从若干项技术指标数据中筛选出若干项参考技术指标数据,并构建表征各项参考技术指标数据的权重的特征权重矩阵;
[0012]4)利用特征权重矩阵对支持向量机模型的核函数映射过程进行加权。
[0013]进一步地,通过滑动窗口截取训练集,动态训练支持向量机模型。
[0014]进一步地,所述的因子模型筛选步骤包括:
[0015]对每项参考技术指标数据进行数据分箱操作,计算每个分箱的IV值,将各分箱的IV值相加,得到该项参考技术指标数据的IV值总和;
[0016]根据IV值总和由小到大的顺序对若干项参考技术指标数据进行排序,选择IV值总和最大的n项参考技术指标数据,作为参考技术指标数据,并构特征权重矩阵P。
[0017]进一步地,所述的特征权重矩阵的表达式为:
[0018][0019]其中,IV(x1)是特征x1的IV值总和,IV(x
n
)是特征x
n
的IV值总和。
[0020]进一步地,所述的核函数采用高斯核函数,表达式为:
[0021][0022]其中,K(x
i
,x
j
)为样本x
i
与x
j
在特征空间中的内积,σ为高斯核的带宽。
[0023]进一步地,对核函数映射过程进行加权后获得的加权高斯核函数表达式为:
[0024][0025]其中,P为特征权重矩阵。
[0026]进一步地,所述的归一化处理过程包括:
[0027]采用z

score均值归一化处理。
[0028]进一步地,所述的技术指标数据集包括EMA、MACD、KDJ、BOLL、RSI、DPO、CCI和BBI中的一种或多种。
[0029]一种股指预测装置,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器调用所述程序指令能够执行所述的股指预测方法。
[0030]一种计算机可读存储介质,包括计算机程序,所述计算机程序能够被处理器执行以实现所述的股指预测方法。
[0031]与现有技术相比,本专利技术具有以如下有益效果:
[0032](1)本专利技术获取技术指标数据集并对其进行处理,计算各项技术指标IV值,根据IV值筛选技术指标,并进行重要性排序并构建权重矩阵,对SVR核函数映射过程进行特征加权,再利用SVR核函数预测股指数据,自动筛选特征,并有着较强的泛化能力,鲁棒性高,大大提高了股指预测精度,保证了人工做出经济决策的效率;
[0033](2)本专利技术通过滑动窗口截取训练集,动态训练支持向量机模型,根据滚动的数据构建一个实时的信息反馈机制,实现了对海量经济数据的自动挖掘,节约了大量的人力资源。
附图说明
[0034]图1为本专利技术的方法流程图。
具体实施方式
[0035]下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。
[0036]实施例1
[0037]一种基于特征加权支持向量回归的股指预测方法,如图1,包括:
[0038]1)数据处理:
[0039]首先从数据库获取股票每日的K线数据,选择最常用的8大技术指标,如表1所示:
[0040]表1技术指标
[0041][0042][0043]根据上述公式,计算股指前20个交易日的八大技术指标数据,并与股指下一日的收盘价一同构建训练数据,得到原始数据后,由于各数据量纲不一致,因而对其进行均值归一化处理,从而提高最终预测精度;
[0044]2)权重分析:
[0045]通常特征筛选都是依据人为经验积累而做的判别,而股市每段时间的数据都极具特色,并且各个特征的有效周期可能会发生变化,特征的有效性也不是一成不变的,因而,首先需要对特征因子进行统计学方法筛选;
[0046]对因子进行IV值计算,IV是一种主流的因子模型筛选方法,它不仅可以保障因子筛选的质量,还能减轻计算机运行负荷;
[0047]首先对每个指标进行数据分箱操作,计算每个分箱的WOE以及IV值,最终将各分箱IV值相加,得到该因子IV值总和,完成上述步骤后,将所有因子通过IV值由小到大排序,按
需选择IV值最大的n个因子,并构建特征权重矩阵P,特征权重矩阵P采用对角阵的形式,表达式为:
[0048][0049]其中,IV(x1)是特征x1的IV值总和,IV(x
n
)是特征x
n
的IV值总和;
[0050]3)模型构建:
[0051]在SVR算法的基础上,对核函数映射过程进行动态加权,特征通过IV值的计算来获取不同权值,不仅保留了原SVR算法的处理非线性数据的能力,同时对核函数的映射过程做了优化,使得最终模型预测更加精确;
[0052]4)趋势预测:
[0053]采用滑动窗口预测模型,利用前20个交易日的数据对下一交易日的收盘价进行预测,动态训练,动态测试,依照最新数据实时更新模型,提高最终模型准确性。
[0054]本实施例提出的股指预测方法用到了以下三种技术:
[0055](1)特征重要性分析
...

【技术保护点】

【技术特征摘要】
1.一种基于特征加权支持向量回归的股指预测方法,其特征在于,包括:利用训练好的支持向量机模型对股票指数进行动态预测;所述的支持向量机模型的训练过程包括以下步骤:1)采集某一交易日的股票指数以及该交易日前的若干个交易日的技术指标数据集,构成训练集,所述的技术指标数据集包括若干项技术指标数据;2)对训练集进行归一化处理;3)通过因子模型筛选算法从若干项技术指标数据中筛选出若干项参考技术指标数据,并构建表征各项参考技术指标数据的权重的特征权重矩阵;4)利用特征权重矩阵对支持向量机模型的核函数映射过程进行加权。2.根据权利要求1所述的一种基于特征加权支持向量回归的股指预测方法,其特征在于,通过滑动窗口截取训练集,动态训练支持向量机模型。3.根据权利要求1所述的一种基于特征加权支持向量回归的股指预测方法,其特征在于,所述的因子模型筛选步骤包括:对每项参考技术指标数据进行数据分箱操作,计算每个分箱的IV值,将各分箱的IV值相加,得到该项参考技术指标数据的IV值总和;根据IV值总和由小到大的顺序对若干项参考技术指标数据进行排序,选择IV值总和最大的n项参考技术指标数据,作为参考技术指标数据,并构特征权重矩阵P。4.根据权利要求1所述的一种基于特征加权支持向量回归的股指预测方法,其特征在于,所述的特征权重矩阵的表达式为:其中,IV(x1)是特征x1的IV值总和,IV(x
n
)是特征...

【专利技术属性】
技术研发人员:陈鹏徐思牛晶茹
申请(专利权)人:中银金融科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1