当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于限价指令簿的动态高频量化交易方法技术

技术编号:36348063 阅读:11 留言:0更新日期:2023-01-14 18:02
本发明专利技术公开了一种基于限价指令簿的动态高频量化交易方法,包括步骤:数据预处理;使用股票未来三秒中间价来刻画价格变化,并标记为上涨、平稳和下跌,构成样本;使用基于改进样本不平衡方法生产平衡的生成样本,包括:生成新的样本;检查新的生成样本,排除与本类距离远的生成样本;消除噪声样本,得到亲和力强的新的生成样本,补齐样本,使与多数类样本数量一致;最后多次重复生成样本,筛选到亲和力最强的新的生成样本,获取到所需的平衡的生成样本;量化投资模型训练;量化投资模型动态高频预测。本发明专利技术提出的改进不平衡的样本生成方法,在不损失信息的情况下,能很好的平衡标签的三种状态,提升整个量化投资模型的预测效果。果。果。

【技术实现步骤摘要】
一种基于限价指令簿的动态高频量化交易方法


[0001]本专利技术属于量化交易
,尤其涉及一种基于限价指令簿的动态高频量化交易方法。

技术介绍

[0002]量化投资模型是利用计算机算法进行证券交易,以获取稳定收益为目的的交易方法。随着中国金融市场规模不断壮大,与国际市场的互联互通加强,量化投资领域飞速发展,竞争渐趋激烈,金融机构和投资者面临的风险日益复杂,给金融交易领域的发展提出了诸多挑战。高频交易作为投资领域王冠上的明珠,其最大的特点是收益高,而风险却小,当然资金容量不会太大,高频策略一般不会对外募资扩大规模。
[0003]计算机软硬件的快速发展,使得诸如盘口五档数据、盘口十档数据、逐笔交易数据等高频时间序列的采集门槛变低,积累的数据量呈现爆发式增长,传统的金融分析方法需要满足的假设条件过于苛刻,而且应用过于广泛,市场上的产品同质化高,导致实际应用效果不理想,高频交易是一个相对狭窄的赛道,相关的研究较少,随着机器学习和人工智能技术的快速迭代升级,相关技术应用到股票的高频预测领域成为可能。
[0004]另一方面,在预测限价指令簿价格趋势时,根据每个时刻的数据构建标签,将此问题转为分类问题,但在构建标签时,往往会出现标签类别不平衡的问题,该问题在高频数据中比较突出。当使用类别数量相差很大的数据集进行训练与预测时,可能会出现整体准确率较高,“上涨”或“下跌”等少数类重点样本准确率很低的情况。常见的解决办法是对数据进行过采样和欠采样,然而简单的降采样和过采样效果并不理想,最终下单执行策略时,往往又是围绕“上涨”或“下跌”的样本来设计,因此,少数类样本识别精度不高,会严重影响交易策略的落地执行效果。

技术实现思路

[0005]为了解决上述问题,本专利技术提出了一种基于限价指令簿的动态高频量化交易策略,基于限价指令簿的具体情况构造特征,将机器学习技术应用于高频预测,并采用滚动动态更新的方法,充分利用最新数据信息,从整个模型层面不断优化现有策略,以适应市场的变化。同时,提出的改进不平衡的样本生成方法,在不损失信息的情况下,能很好地平衡标签的三种状态,从而提升整个量化投资模型的预测效果。
[0006]本专利技术公开的一种基于限价指令簿的动态高频量化交易方法,包括以下步骤:
[0007]步骤1:数据预处理
[0008]将获取到的数据源进行数据清理,包括缺失值处理、离群点处理;然后,数据集成,将多个数据源中的数据结合并存放在数据库中;然后,数据规约,通过删除不相关的属性,来减少数据量,并保证信息的损失最小;最后,数据规范,根据数据的特点,将数据中不同量纲的特征进行缩放、离散化处理;
[0009]步骤2:样本获取
[0010]使用股票未来三秒中间价来刻画价格变化,并标记为“上涨”、“平稳”和“下跌”三个状态,构成样本;再使用基于改进样本不平衡方法生产平衡的生成样本,包括:生成新的样本;检查新的生成样本,排除与本类距离远的生成样本;消除噪声样本,得到亲和力强的新的生成样本,补齐样本,使与多数类样本数量一致;多次重复生成样本,筛选到亲和力最强的新的生成样本,获取到所需的平衡的生成样本;
[0011]步骤3:量化投资模型训练
[0012]训练机器学习模型,计算整体预测效果评价指标,调整模型参数,得到最优模型;
[0013]步骤4:量化投资模型动态高频预测
[0014]对时间窗口进行动态更新,采用滑动窗口方式,将获取到的平衡的生成样本,输入至含最优参数的量化投资模型,判断股票预测时间点的上涨、下跌和平稳。
[0015]进一步的,特征至少包括以下之一:
[0016]卖方的卖i价格和买方的买i价格、卖方的卖i下单数量和买方的买i下单数量、成交量、持仓量、最新成交价、不同档位买卖价差、不同档位中间价、不同档位买卖中间下单量指标、不同档位价差除以中间价、不同档位价差除以下单数量的深度、不同档位卖价与卖1价之间的价差、不同档位买1价与买价之间的价差、相邻档位之间卖价价差、相邻档位之间买价价差、所有卖价档位的均值、所有买价档位的均值、所有买方档位下单数量的均值、所有卖方档位下单数量的均值、所有档位买卖价差的累计和、所有档位买卖下单数量的累计和、所有档位的卖方下单数量加权平均价格、所有档位的买方下单数量加权平均价格、不同档位买卖双方下单数量的不平衡性特征、不同档位卖方价格的对数关于时间t的一阶导数、不同档位买方价格的对数关于时间t的一阶导数、不同档位卖方下单数量的对数关于时间t的一阶导数、不同档位买方下单数量的对数关于时间t的一阶导数、不同档位卖方价格的对数关于时间t的二阶导数、不同档位买方价格的对数关于时间t的二阶导数、不同档位卖方下单数量的对数关于时间t的二阶导数、不同档位买方下单数量的对数关于时间t的二阶导数、成交量的一阶导数、持仓量的一阶导数、所有档位买卖下单数量差累计和的一阶导数、所有档位买卖下单数量差累计和的二阶导数、所有档位的卖方下单数量加权平均价格的一阶导数、所有档位的买方下单数量加权平均价格的一阶导数。
[0017]进一步的,采用中间价来刻画价格变化,定义t时刻中间价的定义为:
[0018][0019][0020]式中,为t时刻最佳卖一价,为t时刻最佳买一价,ΔP
t
为中间价在Δt时间内的价格变化,根据ΔP
t
将t时刻的限价指令簿数据划分为“上涨”、“平稳”和“下跌”三个状态;当ΔP
t
大于等于0.4时,t时刻的标签设置为“上涨”;当ΔP
t
小于等于0.4时,t时刻的标签设置为“下跌”;当ΔP
t
处于

0.4和0.4之间时,t时刻的标签设置为“平稳”。
[0021]进一步的,生成新的样本,包括:
[0022]对标签的分类,按照每个类别数量的多寡,将所有样本分为少数类样本集合中数类样本集合
多数类样本集合式中N
min
为少数类样本数量,N
mid
为中数类样本数量,N
maj
为多数类样本数量;
[0023]确定生成少数类样本的数量为生成中数类样本的数量为
[0024]在少数类样本集合S
min
中随机抽取样本在中数类样本集合S
min
中随机抽取样本式中,N
feature
为特征数量;
[0025]计算从S
min,i
到集合S
min
中所有样本的曼哈顿距离,并计算从S
mid,i
到集合S
mid
中所有样本的曼哈顿距离;
[0026]找出S
min,i
到集合S
min
曼哈顿距离最短的K个邻近样本,并找出S
mid,i
到集合S
mid
曼哈顿距离最短的K个邻近样本;
[0027]分别对S
min,i
与S
mid,i<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于限价指令簿的动态高频量化交易方法,其特征在于,包括以下步骤:步骤1:数据预处理获取交易历史数据,将获取到的数据源进行数据清理,包括缺失值处理、离群点处理;然后,数据集成,将多个数据源中的数据结合并存放在数据库中;然后,数据规约,通过删除不相关的属性,来减少数据量,并保证信息的损失最小;最后,数据规范,根据数据的特点,将数据中不同量纲的特征进行缩放、离散化处理;步骤2:样本获取使用股票未来三秒中间价来刻画价格变化,并标记为“上涨”、“平稳”和“下跌”三个状态,构成样本;再使用基于改进样本不平衡方法生产平衡的生成样本,包括:生成新的样本;检查新的生成样本,排除与本类距离远的生成样本;消除噪声样本,得到亲和力强的新的生成样本,补齐样本,使与多数类样本数量一致;多次重复生成样本,筛选到亲和力最强的新的生成样本,获取到所需的平衡的生成样本;步骤3:量化投资模型训练训练机器学习模型,计算整体预测效果评价指标,调整模型参数,得到最优模型;步骤4:量化投资模型动态高频预测对时间窗口进行动态更新,采用滑动窗口方式,将获取到的平衡的生成样本,输入至含最优参数的量化投资模型,判断股票预测时间点的上涨、下跌和平稳。2.根据权利要求1所述的基于限价指令簿的动态高频量化交易方法,其特征在于,特征至少包括以下之一:卖方的卖i价格和买方的买i价格、卖方的卖i下单数量和买方的买i下单数量、成交量、持仓量、最新成交价、不同档位买卖价差、不同档位中间价、不同档位买卖中间下单量指标、不同档位价差除以中间价、不同档位价差除以下单数量的深度、不同档位卖价与卖1价之间的价差、不同档位买1价与买价之间的价差、相邻档位之间卖价价差、相邻档位之间买价价差、所有卖价档位的均值、所有买价档位的均值、所有买方档位下单数量的均值、所有卖方档位下单数量的均值、所有档位买卖价差的累计和、所有档位买卖下单数量的累计和、所有档位的卖方下单数量加权平均价格、所有档位的买方下单数量加权平均价格、不同档位买卖双方下单数量的不平衡性特征、不同档位卖方价格的对数关于时间t的一阶导数、不同档位买方价格的对数关于时间t的一阶导数、不同档位卖方下单数量的对数关于时间t的一阶导数、不同档位买方下单数量的对数关于时间t的一阶导数、不同档位卖方价格的对数关于时间t的二阶导数、不同档位买方价格的对数关于时间t的二阶导数、不同档位卖方下单数量的对数关于时间t的二阶导数、不同档位买方下单数量的对数关于时间t的二阶导数、成交量的一阶导数、持仓量的一阶导数、所有档位买卖下单数量差累计和的一阶导数、所有档位买卖下单数量差累计和的二阶导数、所有档位的卖方下单数量加权平均价格的一阶导数、所有档位的买方下单数量加权平均价格的一阶导数。3.根据权利要求1所述的基于限价指令簿的动态高频量化交易方法,其特征在于,采用中间价来刻画价格变化,定义t时刻中间价的定义为:
式中,为t时刻最佳卖一价,为t时刻最佳买一价,ΔP
t
为中间价在Δt时间内的价格变化,根据ΔP
t
将t时刻的限价指令簿数据划分为“上涨”、“平稳”和“下跌”三个状态;当ΔP
t
大于等于0.4时,t时刻的标签设置为“上涨”;当ΔP
t
小于等于0.4时,t时刻的标签设置为“下跌”;当ΔP
t
处于

0.4和0.4之间时,t时刻的标签设置为“平稳”。4.根据权利要求1所述的基于限价指令簿的动态高频量化交易方法,其特征在于,生成新的样本,包括:对标签的分类,按照每个类别数量的多寡,将所有样本分为少数类样本集合中数类样本集合中数类样本集合多数类样本集合式中N
min
为少数类样本数量,N
mid
为中数类样本数量,N
maj
为多数类样本数量;确定生成少数类样本的数量为生成中数类样本的数量为在少数类样本集合S
min
中随机抽取样本在中数类样本集合S
min
中随机抽取样本式中,N
feature
为特征数量;计算从S
min,i
到集合S
min
中所有样本的曼哈顿距离,并计算从S
mid,i
到集合S
mid
中所有样本的曼哈顿距离;找出S
min,i
到集合S
min
曼哈顿距离最短的K个邻近样本,并找出S
mid,i
到集合S
mid
曼哈顿距离最短的K个邻...

【专利技术属性】
技术研发人员:王燕华
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1