基于时序卷积自编码的异动股票快速找出系统及方法技术方案

技术编号:22331268 阅读:68 留言:0更新日期:2019-10-19 12:29
本发明专利技术公开了一种基于时序卷积自编码的异动股票快速找出方法,涉及数据挖掘技术领域,技术方案为,包括获取一个时间跨度内股票交易行情数据;将获取的股票交易行情数据进行时序数据形式化表示,生成股票的时序形式化数据;根据时序形式化数据生成时序卷积自编码模型,并对所述时序卷积自编码模型进行训练;根据时序卷积自编码模型,结合时序形式化数据找出异动股票。本发明专利技术的有益效果是:1.可以自动检出任意时间跨度的异动股票,节省人工分析成本。2.能够检出非突破指标阈值类型的异动股票。

The system and method of fast finding out the change stock based on time series convolutional self coding

【技术实现步骤摘要】
基于时序卷积自编码的异动股票快速找出系统及方法
本专利技术涉及数据挖掘
,特别涉及一种基于时序卷积自编码的异动股票快速找出系统及方法。
技术介绍
异动股票是指在某个时间跨度,交易特征与大多数的股票不同的一小部分股票。在同一个证券交易市场或者同一个经济体中,大多数的股票的价格、成交量等指标的走势基本相似。但有一小部分异动股票因消息的影响或者主要交易参与者的有意为之,会出现独立走势。短周期内,异动股票的价格大概率会出现较大幅度的波动。在市场大量股票中找出异动股票,再附之预测模型及金融工程工具,会帮助投资者减少损失、增加收益。异动股票需要在较短的时间内找出。股票市场中,大资金参与者,通常被称为主力,通过操纵股价走势盈利。其通常会在早期以较为隐蔽的方式买入筹码,待时机成熟,大幅拉高价格,吸引中小投资者关注以派发筹码。若以人工方式或者仅以指标阈值的方式查找异动股票,常常只能在后一阶段找出,投资者会错过交易时机,导致获利减少甚至亏损。针对这一问题本专利技术提出一种基于时序卷积自编码的异动股票快速检出方法。该技术可以在大量交易数据中自动检出异动股票,这些异动股票包括非突破指标阈值类型的异动股本文档来自技高网...

【技术保护点】
1.基于时序卷积自编码的异动股票快速找出方法,其特征在于,包括:S1、获取一个时间跨度内股票交易行情数据;S2、将S1获取的股票交易行情数据进行时序数据形式化表示,生成股票的时序形式化数据;S3、根据S2的时序形式化数据生成时序卷积自编码模型,并对所述时序卷积自编码模型进行训练;S4、根据S3获得的时序卷积自编码模型,结合所述S2的时序形式化数据找出异动股票。

【技术特征摘要】
1.基于时序卷积自编码的异动股票快速找出方法,其特征在于,包括:S1、获取一个时间跨度内股票交易行情数据;S2、将S1获取的股票交易行情数据进行时序数据形式化表示,生成股票的时序形式化数据;S3、根据S2的时序形式化数据生成时序卷积自编码模型,并对所述时序卷积自编码模型进行训练;S4、根据S3获得的时序卷积自编码模型,结合所述S2的时序形式化数据找出异动股票。2.根据权利要求1所述的基于时序卷积自编码的异动股票快速找出方法,其特征在于,所述S2中,时序数据形式化表示的方法为:S201,对一支股票设定时间序列的初始时刻为1,结束时刻为t,那么n维时序数据可表示为:其中n与t分别为矩阵的行数与列数,X表示矩阵数据,x为元素值;一行数据代表股票一个维度的数据,一支股票有多维度的时序数据。3.根据权利要求2所述的基于时序卷积自编码的异动股票快速找出方法,其特征在于,所述S3中,时序卷积自编码模型包括结构对称的编码部分和解码部分;所述编码部分包括原始数据层及若干个编码循环,每个所述编码循环包括一个卷积层与一个池化层,在每个所述编码循环中,若输入为n×t矩阵,则输出为n×(t/2);所述解码部分包括与所述编码循环对应且数量相同的若干个解码循环,及输出数据层,每个所述解码循环均包括一个上采样层与一个反卷积层;在每个所述解码循环中,若输入为n×t的矩阵,则输出为n×(2t);编码循环的数量与解码循环相同,二者数量均设为r,编码循环升序编号,解码部分降序编号,r值用如下公式获得:r=log2(t/c),其中c为时序卷积自编码的最小中间特征的列数。4.根据权利要求3所述的基于时序卷积自编码的异动股票快速找出方法,其特征在于,所述时序卷积自编码模型的前向传播经过编码部分与解码部分,即X→F,的过程,其中X表示原始数据,F表示中间特征数据,表示输出数据;在每个所述编码循环中各有一个卷积层与池化层;所述卷积层利用k个卷积核生成卷积特征,k为卷积核的数量;所述编码循环有两种,分别为第一循环与编码普通循环;紧邻所述原始数据层的循环为第一循环,其它的为编码普通循环;所述第一循环与编码普通循环的区别为卷积核的大小,设原始数据的特征大小为d×t,d为维度,t是时序数,d与t分别代表数据特征矩形的宽与长;所述第一循环中,每个卷积核的大小为d×3,有k个核;所述编码普通循环中,每个卷积核为k×3,有k个核;每个卷积核生成一行卷积向量,因有k个卷积核,所以会生成k行特征;那么生成的卷积特征的大小为(t-2)×k;利用插值法对边沿元素补足,使得特征的大小为k×t;同理,编码普通循环的卷积层利用k个卷积核生成特征的行数也是k;卷积核的参数都初始化为随机值,激活函数采用ReLU;在池化层,采用最大池化方法,用一个2×1的filter采样输出一个1×1特征值,因此池化后的特征为的矩阵;若编码部分的循环数量为r,则编码部分的输出特征为矩阵。5.根据权利要求4所述的基于时序卷积自编码的异动股票快速找出方法,其特征在于,所述解码部分输入特征大小为输出特征大小为d×t;在每个所述解码循环中,各有一个上采样层与反卷积层;上采样层是池化层的逆操作,即将特征列扩大一倍,即一列特征扩展为两列。反...

【专利技术属性】
技术研发人员:邹立达耿蕾蕾蔡慧英冉令强马艳
申请(专利权)人:山东财经大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1