基于复杂科学的元强化学习对股指已实现波动率的预测方法技术

技术编号:39716740 阅读:7 留言:0更新日期:2023-12-17 23:24
本发明专利技术提供一种基于复杂科学的元强化学习对股指已实现波动率的预测方法,所述预测方法结合金融环境和元知识环境,通过强化学习器的训练实现对股指已实现波动率的预测

【技术实现步骤摘要】
基于复杂科学的元强化学习对股指已实现波动率的预测方法


[0001]本专利技术属于金融业务数字化



技术介绍

[0002]在金融市场上进行金融业务的各类金融主体,因为立场和职能的不同,会面临各种金融风险,金融市场的风险把控一直是金融参与者最关注的问题之一,而风险把控的关键往往在于预测的准确性

此外,金融市场最直观的表现是数据,对数据分析的方向选择以及数据分析的准确性决定了预测的准确性,因此,对金融市场的分析和数据科学紧密相关

与此相关的,复杂科学

人工智能

金融学三个学科之间也存在交叉和借鉴

但现有技术中,鲜有结合复杂科学规律等对金融数据进行预测的相关研究

[0003]现有技术中,针对金融数据预测也有一些模型的建立,目前在业界流行的许多量化投资模型是基于市场现象的一种描述性模型

比如,
Eugene F.Fama

Kenneth R.French
提出
CAPM
模型是描述了个股对市场指数变动而产生变动的敏感性刻画,后来又一次提出了3因子模型
(Fama and French,1995)
,也是对公司市值大小和账面市值比等市场异象的观察

再后来随着更多的市场异象被发现华尔街的精英们开始将各种不同的因子进行综合,创造了
USE1、USE2、USE3

1989
年开始实施第一个
Barra
全球股票风险模型
(GEM)
,根据
Menchero

Morozov

Shepard(2008)
的描述,创业板紧随其后的是第二代全球股票风险模型
GEM2。Miller
等人
(2014)
正式基于因子集成的原理进行了不同于马科维兹的积极投资组合创建

这一类多因子模型风靡一时,但都有着共同的问题

比如:市场风格转换时,部分因子容易失效,投资策略会产生“风格漂移”;不同因子可能存在重叠和冗余;因子不能穷尽等等


技术实现思路

[0004]本专利技术所要解决的技术问题是提供一种基于复杂科学的元强化学习对股指已实现波动率的预测方法,将复杂科学的理论和结合适应市场假说的观点相结合,以数据形式,数量化地反映适应市场假说的观点,从而实现将假说观点落地到量化的过程,实现准确定量的金融市场特征规律预测,也消除了现有技术中因为市场风格转换而造成的一些不确定因素的影响

[0005]为解决上述技术问题,本专利技术采用以下技术方案:
[0006]基于复杂科学的元强化学习对股指已实现波动率的预测方法,所述预测方法结合金融环境和元知识环境,通过强化学习器的训练实现对股指已实现波动率的预测,具体包括以下步骤:
[0007](1)
提取波动率特征,结合复杂科学的理论背景和适应性假说观点,提取波动率的元知识

[0008]在本专利技术中,元知识的提取来自于波动率的正序列相关性和周期性,本专利技术基于分别基于正序列相关性和周期性通过特征化方法来提取波动率的元知识

[0009]正序列相关性指的是金融价格序列

收益率序列

波动率序列等金融时间序列在未来的数值与当下和过去的数值有着正相关性

它的典型表现为,当此时出现价格的暴涨或暴跌时,未来很有可能继续延续涨势和跌势;历史波动率时间序列也有类似的表现,比如当出现波动率放大时,可能在不久的将来也会出现较大的波动率,而波动率低迷时,未来也可能会持续低迷

[0010]时间序列的正相关性并非金融时间序列独有,在自然界是普遍存在的

早在
20
世纪时,英国水文专家
H.E.Hurst
就专利技术了一种
Hurst
指数用以度量时间序列的历史记忆性

如果
Hurst
指数=
0.5
,表明时间序列可以用随机游走来描述;如果
0.5<Hurst
指数
<1
,表明时间序列存在长期记忆性;如果
0≤Hurst
指数
<0.5
,表明粉红噪声
(
反持续性
)
即均值回复过程

也就是说,只要
Hurst
指数
≠0.5
,就可以用有偏的布朗运动
(
分形布朗运动
)
来描述该时间序列数据

所以,可以用滑动窗口的历史波动率序列的
Hurst
指数序列来刻画波动率的正序列相关性

[0011]波动率的周期性指的是波动率在一段时间内呈现出有规律的起伏涨跌变化,可以用下式来刻画:
[0012]V(t+T)

kV(t)+err_t

[0013]式中,
V(t)

t
时刻的波动率,
V(t+T)

t+T
的时刻波动率,
T
是周期的期限,
k
是线性参数,
err_t
是随机误差

该式意味着
t+T
的时刻波动率可以用一个周期前的波动率的线性表达来近似

[0014](2)
选取强化学习算法,构成强化学习器;本专利技术中所采用的强化学习器是基于
GPI
准则的值函数残差神经网络模型,“基于
GPI
准则的值函数残差神经网络模型”是对在时序问题上有着良好表现的经典模型残差神经网络的强化学习改造

[0015]深度神经网络随着网络层数的增加,其模型的训练和预测表现并没有增加,相反可能还出现了恶化

这是因为随着网络层数的增加,非但没有起到自己应有的作用,反而扭曲了网络空间,模型参数过多

模型复杂度更高,深层神经网络会出现十分严重的过拟合问题

那么如何才能保证增加的新的网络层不扭曲网络空间,而是真正去逼近真实的目标函数呢?最关键的问题是让新增加的网络层来自于前几层与真实标签的误差,那么即使新增加的网络层不能从误差中汲取知识进而改善整体网络,也至少不会增加扭曲的网络结构从而导致过度拟合

[0016]残差块用公式来表示如下:
[0017][0018]其中
x
l
是第
l
层网络的输出并作为
l+1
层本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于复杂科学的元强化学习对股指已实现波动率的预测方法,其特征在于:所述预测方法结合金融环境和元知识环境,通过强化学习器的训练实现对股指已实现波动率的预测,具体包括以下步骤:
(1)
提取波动率特征,结合复杂科学的理论背景和适应性假说观点,提取波动率的元知识,所述元知识来源包括波动率的正序列相关性和周期性;
(2)
选取强化学习算法,构成强化学习器;所述强化学习器以广义策略迭代
(Generalized Policy Iteration

GPI)
准则作为策略求解的基本形式,首先通过下式完成策略估计:
v
π
(s)


a
π
(a∣s)∑
s

,r
p(s

,r∣s,a)[r+
γ
v
π
(s

)]
式中,
v
π
(s)
是状态
s
下所有行动
a
所得到的期望状态值
v
π

GPI
准则通过最大化
v
π
的增益来估计策略
π
在现有状态和行动下的表现,然后通过下式完成策略改进:式中,在完成策略估计后,我们知道了在策略
π
下,状态
s
的价值有多高,但是并不知道是否应该选择新的策略

如果在状态
s
下由某新策略
π

(s)
选择行动所...

【专利技术属性】
技术研发人员:李一邨滕远阳
申请(专利权)人:杭州伊园科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1