【技术实现步骤摘要】
基于Attention机制的股票指标分析数据评估系统及方法
[0001]本专利技术涉及数据评估
,尤其涉及一种基于Attention机制的股票指标分析数据评估系统及方法。
技术介绍
[0002]在今天快速变化的市场环境中,使用数学工具分析市场行情正变得越来越普遍。量化交易的兴起意味着,金融市场更加多样化。
[0003]量化交易是把数学、统计学、金融学、计算机技术结合起来,通过挖掘交易海量数据,寻找规律给出参考数据,做出推荐,通过建立先进的数学模型以替代人为的主观判断,利用计算机技术从海量的历史数据中寻找能带来超额收益的规律以制定策略,并利用数学模型验证及固化这些规律和策略,然后通过程序化交易严格执行,最大程度减少投资者情绪波动下的非理性决策影响,以求获得持续、稳定、高于平均收益的超额回报。量化交易可以快速地发现和利用其他市场参与人有时不容易察觉的交易机会,同时它的交易速度快,运作效率大大提高。
[0004]在过去的十几年里,人工智能在金融领域已经成为学术界和金融业非常热门的讨论话题。如今也已经有了许多研 ...
【技术保护点】
【技术特征摘要】
1.一种基于Attention机制的股票指标分析数据评估系统,其特征在于,包含:股票行情实时获取模块、股票指标分析数据评估模块、评估模型优化模块;所述股票行情实时获取模块通过股票名称或者代码实时查询股票的行情趋势和历史行情数据,以及将该股票的历史行情数据保存在本地磁盘中,用户在该模块进行股票选定;所述股票指标分析数据评估模块根据用户所选定股票的历史行情数据进行分析和评估并展示数据的评估结果;所述评估模型优化模块使用过往股市积累的历史数据重新对模型进行训练,更新模型参数。2.一种基于Attention机制的股票指标分析数据评估方法,基于权利要求1所述的一种基于Attention机制的股票指标分析数据评估系统实现,其特征在于,包括以下步骤:步骤1:获取目标股票的历史行情数据,按照该股票分钟k线未停牌的60分钟,即每一个小时作为一个时间粒度采集数据点,以过去24*3个连续未停牌小时作为时间序列长度L
x
,采集输入序列数据X
input
;以未来24个连续未停牌小时作为时间序列长度L
y
形成输出序列数据X
output
;对于每一个时间粒度t的数据点为多维数据,包含这个小时时间段开始时的股票价格、这个小时时间段结束时的股票价格、最低价、最高价、成交的指数数量、成交的金额、涨停价、跌停价、平均价、191Alphas因子,以输入时序数据紧接着的24个连续未停牌小时作为时间序列长度采集输出序列数据;对于输出数据中每一个时间粒度t的数据点包含这个小时时间段开始时的股票价格、这个小时时间段结束时的股票价格、最低价、最高价、成交的指数数量、成交的金额、涨停价、跌停价和平均价;将上述目标股票的历史时序数据建立训练数据集;步骤2:构建引入Attention机制的Informer模型;通过神经网络构建一个编码器和一个解码器,即使用Encoder
‑
Decoder的架构来解决对于长时序数据的评估问题;步骤3:获取未来非停牌24小时的股票指标评估数据;由训练数据集训练好模型后,向训练好的模型中输入长时序输入数据,输入数据格式如下:时间序列长度L
x
为历史24*3个连续未停牌小时,每一个小时作为一个时间粒度t;对于每一个时间粒度t的数据点为多维数据,包含这个小时时间段开始时的股票价格、这个小时时间段结束时的股票价格、最低价、最高价、成交的指数数量、成交的金额、涨停价、跌停价、平均价、191Alphas因子;输入数据后,训练好的模型会给出未来非停牌24小时的股票指标评估数据,每一个时间粒度t的数据点包含这个小时时间段开始时的股票价格、这个小时时间段结束时的股票价格、最低价、最高价、成交的指数数量、成交的金额、涨停价、跌停价和平均价。3.根据权利要求2所述的一种基于Attention机制的股票指标分析数据评估方法,其特征在于,所述步骤2包括以下步骤:步骤2.1:构建数据转换的Embedding层;在输入序列数据X
input
与Encoder层的输入数据X
en
之间构建了Embedding层,对输入序列数据X
input
进行数据表示形式的统一转换处理,得到全局位置上下文特征信息和局部时间上下文特征信息;所述统一转换处理包括标量投影、增强位置特征信息的局部时间戳、以及增强时间联系特征的全局时间戳;假设输入数据进行统一数据表示形式转换后的维度为d
model
,对于时间序列长度L
x
的输入序列数据X
input
,首先使用固定位置嵌入信息来保留局部上下文信息,
即局部时间戳其中标识位置信息的下标j的取值为j∈{1,...,d
model
/2},pos为输入序列数据X
input
的第i个数据点X
i
在X
input
中的位置,即pos∈{1,...,L
x
};而全局时间戳SE
(pos)
由有限类别构成,包含分钟、小时、周、月、假日类型;假设包含p种类型的全局时间戳,第t个训练输入数据序列样本为X
t
,为了对齐维度,使用宽度设为3,步长设为1的1
‑
...
【专利技术属性】
技术研发人员:朱荣晖,王广普,陈建,张斌,
申请(专利权)人:沈阳麟龙科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。