【技术实现步骤摘要】
一种基于生成式对抗网络的金融时间序列预测系统和方法
[0001]本专利技术涉及深度学习及金融时间序列预测领域,尤其涉及一种基于生成式对抗网络的金融时间序列预测系统和方法。
技术介绍
[0002]量化投资是指采用数量化分析手段及用计算机程序发出买卖指令进行交易的投资方式。在海外的发展已有几十年的历史,其投资业绩稳定,市场规模和份额不断扩大。目前,随着互联网技术的发展以及大数据时代的到来,国内量化交易开始逐步发展起来,各种量化投资基金相继成立,越来越多原本基于基本面分析进行主观投资的交易者转用程序化的量化技术通过计算机进行交易。
[0003]在量化投资领域中,时间序列分析是一项基本技术。许多量化策略基于通过时序分析对金融产品的行情趋势进行预测来构建,因此趋势的预测结果对交易决策起到至关重要的作用。金融时间序列数据包括股票、期货等金融产品的行情走势,由于其自身的嘈杂性、高复杂性、非平稳性和强非线性等特点,对其准确预测一直是业界的一个难题。近几年,随着以机器学习、深度学习为代表的人工智能算法高度发展,许多人尝试使用线性回归、 ...
【技术保护点】
【技术特征摘要】
1.一种基于生成式对抗网络的金融时间序列预测系统,其特征在于,包括:数据集采集模块,所述数据集采集模块用于数据集样本的构建,所述数据集样本分成训练集、验证集和测试集三个部分,所述数据集样本包括互相关联的若干金融产品的行情趋势和价格标签,所述行情趋势包括历史开盘价、最高价、最低价、收盘价以及成交量,所述价格标签可以选择开盘价或者收盘价;数据集处理模块,所述数据集处理模块连接所述数据集采集模块,将从所述数据集采集模块接收的所述数据集样本先进行归一化处理,再将同一时刻的不同所述金融产品的特征融合在一起构成一个多元金融产品特征矩阵;按照模型输入所需要的时间步数大小,对所述多元金融产品特征矩阵在时间维度上进行切割分块,分成若干个数据块,以符合所述模型所需的输入形式;所述每一个数据块代表一个输入样本,是一个长度为设定的所述时间步数大小、元素为所述多元金融产品特征矩阵的时间序列;模型构建模块,所述模型构建模块连接所述数据集处理模块,用于构建基于GAN网络的金融时间序列预测模型;基于所述GAN网络的所述金融时间序列预测模型包括特征提取网络、生成器网络和判别器网络,其中,所述GAN网络包括所述生成器网络和所述判别器网络;所述特征提取网络包括卷积网络和胶囊网络;训练模块,所述训练模块连接所述模型构建模块,用于利用所述数据集处理模块输出的经过处理的所述数据集样本中的所述训练集训练基于所述GAN网络的所述金融时间序列预测模型;在训练过程中,所述生成器网络所生成的生成数据越来越接近真实数据,而所述判别器网络则不断提升区分出所述生成数据和所述真实数据的能力,所述生成器网络与所述判别器网络的训练过程交替进行并最终达到纳什平衡,当基于所述GAN网络的所述金融时间序列预测模型的损失函数收敛到一定程度时,所述生成器网络所生成的所述生成数据等同于所述真实数据,使所述基于所述GAN网络的所述金融时间序列预测模型能够挖掘出所述数据集样本中表征未来变化趋势的特征,再分别试验不同的超参数,从中选出在所述验证集上评价指标最好的模型作为最终的模型选择;预测模块,所述预测模块连接所述训练模块,用于采用所述训练模块训练好的模型在所述测试集上对金融产品价格行情进行预测,并计算评价指标来对模型性能进行评估。2.如权利要求1所述的基于生成式对抗网络的金融时间序列预测系统,其特征在于,在所述数据集处理模块中,所述多元金融产品特征矩阵表示为X
i
∈R
N
×
D
,其中,i表示时刻,N代表所选取的互相关联的若干所述金融产品的个数,D表示所选取的若干所述金融产品的特征的个数;所述每一个数据块的具体形式为(X
T
‑
s
,
…
X
T
‑2,X
T
‑1),其中,s表示选取的时间步数;所述数据块对应的标签为T时刻的价格Y
T
。3.如权利要求1所述的基于生成式对抗网络的金融时间序列预测系统,其特征在于,在所述模型构建模块的所述特征提取网络中,先由所述卷积网络从所述多元金融产品特征矩阵中初步提取特征,寻找所述不同金融产品之间的相关性,然后由所述胶囊网络代替所述卷积网络的池化层自动提取出最佳的特征量。4.如权利要求3所述的基于生成式对抗网络的金融时间序列预测系统,其特征在于,所述生成器网络的输入为所述特征提取网络提取的所述特征量,输出是对应T时刻所述金融
产品的预测价格所述生成器网络由长短时间记忆门控循环单元组成。5.如权利要求3所述的基于生成式对抗网络的金融时间序列预测系统,其特征在于,所述判别器网络采用卷积神经网络,判断输入的价格序列是否反映真实的价格规律,如果输入序列越真实,所述判别器网络的输出分数就越大;反之,如果所述生成器网络所预测的数据没有真实规律性,则所述判别器网络所输出的值很低。6.一种基于生成式对抗网络的金融时间序列预测方法,其特征在于,所述步骤包括以下步骤:步骤1、构建数据集样本,分成训练集、验证集和测试集三个部分;步骤2、对所述数据集样本进行预处理;步骤3、构建基于GAN网络的金融时间序列预测模型,基于所述GAN网络的所述金融时间序列预测模型包括特征提取网络、生成器网络和判别器网络,其中,所述GAN网络包括所述生成器网络和所述判别器网络;所述特征提取网络包括卷积网络和胶囊网络;步骤4、用经过预处理的所述数据集样本中的所述训练集训练基于所述GAN网络的所述金融时间序列预测模型,并在所述验证集上进行验证,确定最终的模型选择;步骤5、将训练好的基于所述GAN网络的所述金融时间序列预测模型在所述测试集上进行预测,并计算评价指标对模型性能进行评估。7.如权利要求6所述的基于生成式对抗网络的金融时间序列预测方法,其特征在于,所述步骤2包括以下步骤:步骤2.1、采用Max
‑
Min方法对所述数据集样本的每一个特征维度单独进行归一化处理,计算公式为:其中,x表示某一特征原始值,x
min
表示该特征在所述训练集上的最小值,x
max
表示该特征在所述训练集上的最大值,x
*
表示归一化后的结果;步骤2.2、将同一时刻的不同金融产品的特征融合在一起构成一个多元金融产品特征矩阵X
i
∈R
N
×
D
,其中,i表示时刻,N代表所选取的相关的若干所述金融产品的个数,D表示所选取的所述金融产品的特征的个数;步骤2.3、按照模...
【专利技术属性】
技术研发人员:王泽林,李雅,褚健,杨根科,
申请(专利权)人:上海交通大学宁波人工智能研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。