当前位置: 首页 > 专利查询>中山大学专利>正文

一种结合日内量价信息的股指趋势预测方法及系统技术方案

技术编号:31495246 阅读:36 留言:0更新日期:2021-12-18 12:35
本发明专利技术提出一种结合日内量价信息的股指趋势预测方法及系统,涉及量化交易与计算机科学的技术领域,在每个交易日收盘后,获取股票指数当前交易日及之前若干个交易日的量价信息数据,并从数据中提取粗粒度因子及细粒度因子,以充分考虑可能影响股票市场的市场内部因素以及市场外部因素,然后通过因子评价方法对细粒度因子进行评价筛选,确定训练集数据和测试集数据,将该股票指数在之前若干个交易日的涨跌作为标签,对股指趋势预测模型进行训练,然后测试股指趋势预测模型,在下一个交易日开盘时,根据股指趋势预测模型输出的涨跌信号进行交易,最后,基于历史回测,对股指趋势预测模型进行评价,具有很强的实践意义。具有很强的实践意义。具有很强的实践意义。

【技术实现步骤摘要】
一种结合日内量价信息的股指趋势预测方法及系统


[0001]本专利技术涉及量化交易与计算机科学的
,更具体地,涉及一种结合日内量价信息的股指趋势预测方法及系统。

技术介绍

[0002]股票市场的价格趋势预测是金融投资领域的核心任务之一,根据有效市场理论,股票市场的任何信息均已经反映到股票价格中,如果能够从市场中提取出有效的市场信息以及投资者行为的特征,并进行价格趋势的预测,则能为投资者带来收益。因为市场中的多空博弈属于零和博弈,投资者的收益实际上来自于其他对股票价格趋势做出错误预测的投资者的亏损,因此,从市场历史数据中提炼有效信息并准确预测股价趋势有助于投资者获得收益。
[0003]股票价格研究方法分为基本面分析以及技术分析方法。基本面分析方法认为市场的基本要素决定股票的价格,如宏观的经济状况、海外市场因素等等;技术分析方法主要是指通过市场运行产生的量价数据分析实现研究股票价格的方法,因为股票价格不仅受到宏观经济状况的影响,也会受到市场中投资者行为的影响,所以这两种方法都具有一定的有效性。不仅如此,股票市场存在多尺度的属性,如市场中本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种结合日内量价信息的股指趋势预测方法,其特征在于,所述方法包括以下步骤:S1.选定作为预测对象的股票指数,在每个交易日收盘后,获取该股票指数当前交易日及之前若干个交易日的量价信息数据;S2.从步骤S1的数据中获取粗粒度因子及细粒度因子;S3.通过因子评价法对细粒度因子进行评价筛选;确定股指趋势预测模型;S4.将该股票指数在之前若干个交易日数据中提取的粗粒度因子和步骤S3评价筛选后的细粒度因子作为训练集数据,将该股票指数在之前若干个交易日的涨跌信号作为标签,对股指趋势预测模型进行训练;S5.将该股票指数当前交易日中提取的粗粒度因子和步骤S3评价筛选后的细粒度因子作为测试集数据输入至训练好的股指趋势预测模型,在下一个交易日开盘时,根据股指趋势预测模型输出的涨跌信号进行交易;S6.基于历史回测,对股指趋势预测模型进行评价。2.根据权利要求1所述的结合日内量价信息的股指趋势预测方法,其特征在于,步骤S1所述的当前交易日及之前若干个交易日的量价信息数据包括股票指数的日频率量价数据、日频率海外股票市场指标、宏观指标及分钟频率量价数据。3.根据权利要求2所述的结合日内量价信息的股指趋势预测方法,其特征在于,从步骤S1的数据中获取的粗粒度因子为股票指数的日频率量价数据、日频率海外股票市场指标及宏观指标,统一定义为:其中,L
t
表示交易日t收盘后当前交易日获得的粗粒度因子的统称,第m个粗粒度因子表示为从步骤S1的数据中获取的细粒度因子以日频率量价数据信息作为高频量价信息,通过高频量价信息低频化得到,设交易日t内存在N个时间段,交易日t内时间序列上的高频率量价信息表示为:P
t
={P1,P2,P3,...,P
N
};每一个时间段的高频率量价信息由一系列的分时间段量价数据构成,即P
n
={p
h
,p
o
,p
l
,p
c
,p
v
,p
a
},n表示第n个时间段,p
h
表示该时间段内的最高价,p
o
表示该时间段内的开盘价,p
l
表示该时间段内的最低价,p
c
表示该时间段内的收盘价,p
v
表示该时间段内的交易量,p
a
表示该时间段内的交易金额。4.根据权利要求3所述的结合日内量价信息的股指趋势预测方法,其特征在于,获取细粒度因子的过程包括提取阶段和转换阶段;在提取阶段,分为单点数据提取方式和滑动窗口提取方式,其中,在单点数据提取方式中,通过不同的因子提取器f(
·
;θ)从高频量价信息中提取描绘不同市场特征的细粒度因子,细粒度因子分为五大类:成交量、均线、趋势、波动、振荡,其中,θ为因子提取器的参数,
·
表示提取器的输入,因子提取器输入为当前时刻量价数据,交易日内时段n的第k个细粒度因子表示为:在滑动窗口提取方式中,因子提取器输入为一段窗口内的量价数据序列P
n

m+1
,在交易
日内的时段n的第k个细粒度因子表示为:设滑动窗口的大小为m,则满足:W
n
={P
n

m+1
,P
n

m+2
,...,P
n
};单点数据提取方式和滑动窗口提取方式提取的细粒度因子在每个交易日组成一个序列,设在交易日t,第k个因子的序列记为利用因子转换器对其进行转换,因子转换器表示为9(
·
;γ),γ为转换器的参数,
·
表示转换器的输入,第t个交易日因子转换器输出为当日对应的细粒度因子,记为:除选取全日平均值、开盘和收盘时的因子值和当日最值,也选取开盘和收盘前30分钟的因子平均值的计算方法作为转换器;最终,获得的细粒度因子定义为:其中,第n个细粒度因子表示为对于高频量价信息中全天的量价信息数据,直接提取细粒度因子,不需要因子转换器转换,当日的细粒度因子表达式为:其中,P
t
表示第t个交易日的所有日内量价数据组成的序列,表示第t日的第k个细粒度因子。5.根据权利要求4所述的结合日内量价信息的股指趋势预测方法,其特征在于,步骤S3所述通过因子评价法对细粒度因子进行评价筛选的过程包括第一次因子评价过程和因子再评价过程;所述的股指趋势预测模型为XGBoost预测模型。6.根据权利要求5所述的结合日内量价信息的股指趋势预测方法,其特征在于,所述的第一次因子评价过程包括:S31.在第t个交易日收盘后,获取前s...

【专利技术属性】
技术研发人员:陈思航骆伟祺
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1