基于k线聚类和强化学习的自适应金融时间序列预测方法技术

技术编号：19321401 阅读：382 留言：0更新日期：2018-11-03 11:24

本发明专利技术公开了一种基于k线聚类和强化学习的自适应金融时间序列预测方法，先获取金融数据，对金融数据进行K线化处理，并K线化处理后的数据进行计算，得到当前匹配周期内的K线数据；采用Kmeans聚类算法、FCM聚类算法或基于数据密度的在线聚类方法对K线各个子部分进行聚类；将聚类结果输入到深度强化学习模型中进行参数训练，利用训练好的深度强化学习模型进行金融交易。本发明专利技术将金融数据进行K线化，并对K线各子部分进行聚类，将聚类结果输入到深度强化学习模型，得到基于分解k线聚类的深度强化学习模型，实现了实时金融交易价格的在线自适应预测。

Adaptive financial time series forecasting method based on K-line clustering and reinforcement learning

The invention discloses an adaptive prediction method of financial time series based on K-line clustering and reinforcement learning. Firstly, financial data are acquired, K-line processed, and K-line processed data are computed to obtain K-line data in the current matching period; Kmeans clustering algorithm, FCM clustering algorithm or based on K-line clustering algorithm are adopted. On-line clustering method of data density is used to cluster all sub-parts of K-line. The clustering results are input into the deep reinforcement learning model for parameter training, and the trained deep reinforcement learning model is used for financial transactions. The invention linearizes the financial data into K-lines, clusters each sub-part of K-lines, inputs the clustering results into the deep reinforcement learning model, obtains the deep reinforcement learning model based on decomposition k-lines clustering, and realizes online adaptive prediction of real-time financial transaction price.

全部详细技术资料下载

【技术实现步骤摘要】
基于k线聚类和强化学习的自适应金融时间序列预测方法
本专利技术涉及金融交易领域，具体涉及一种基于分解k线聚类和深度强化学习的自适应金融时间序列预测方法。
技术介绍
通过计算机来实现自动化交易在很多发达国家是很普遍的现象，用计算机代替人为交易一方面是因为计算机可以从庞大的历史数据中发现一些人很难或者无法捕捉的规律和现象，另一方面可以极大地减少交易者情绪波动的影响，避免在市场极端的情况下做出非理智的决策。随着人工智能的飞速发展，通过人工智能技术训练出一个自动化交易的模型是每个从事金融交易和策略研发人员梦寐以求的事情，尽管机器学习等技术在图像识别、语音识别和医疗诊断等领域取得了很多成就，但是把机器学习等技术直接应用到自动化交易上却不是一件容易的事情。不同于常见的监督性学习方法，进行自动化交易没有可以用于学习的标签，所以就需要通过在一个未知的环境中去不断探索，并通过环境的反馈来不断更新和优化决策，这也正是强化学习的学习方式。DeepMind在2013年发表的论文”PlayingAtariwithDeepReinforcementLearning”中展示了如何运用强化学习训练计算机去玩Atari游戏，通过训练得到的模型在玩7种不同的游戏时，其中3种游戏电脑甚至超过了人类的水平。两年后，他们又对模型进行了改进，通过这个模型去玩49种不同的游戏，半数的游戏均超越了人类的水平。到2017年初，DeepMind又利用了深度强化学习等技术开发了AlphaGo打败了世界顶级的围棋手。强化学习作为机器学习里面的一个分支，它主要用来解决马尔科夫决策类型的问题。通常可以将强化学习分为...

【技术保护点】
1.一种基于分解k线聚类和深度强化学习的自适应金融时间序列预测方法，其特征是，包括以下步骤：步骤1：获取金融时间序列，对金融时间序列进行K线化处理，并对K线化处理后的数据进行计算，得到当前匹配周期内的K线各个子部分的长度；步骤2：采用Kmeans聚类算法、FCM聚类算法或基于数据密度的在线聚类方法对K线各个子部分的长度进行聚类，得到K线各个子部分的长度所对应的聚类中心；步骤3：将聚类结果以及K线的实体颜色作为学习特征输入到深度强化学习模型中进行参数训练，利用训练好的深度强化学习模型进行金融交易。

【技术特征摘要】
1.一种基于分解k线聚类和深度强化学习的自适应金融时间序列预测方法，其特征是，包括以下步骤：步骤1：获取金融时间序列，对金融时间序列进行K线化处理，并对K线化处理后的数据进行计算，得到当前匹配周期内的K线各个子部分的长度；步骤2：采用Kmeans聚类算法、FCM聚类算法或基于数据密度的在线聚类方法对K线各个子部分的长度进行聚类，得到K线各个子部分的长度所对应的聚类中心；步骤3：将聚类结果以及K线的实体颜色作为学习特征输入到深度强化学习模型中进行参数训练，利用训练好的深度强化学习模型进行金融交易。2.根据权利要求1所述的基于分解k线聚类和深度强化学习的自适应金融时间序列预测方法，其特征是，所述K线包括上影线、下影线、实体以及实体的颜色。3.根据权利要求1所述的基于分解k线聚类和深度强化学习的自适应金融时间序列预测方法，其特征是，所述步骤1中，根据K线对应时段的价格，计算得到当前匹配周期内的K线各个子部分的长度的步骤包括：根据K线对应时段的最高价、开盘价、最低价和收盘价，计算得到当前匹配周期内的K线的上影线、下影线以及实体的长度；当K线的实体颜色是红色时，K线的上影线长度等于最高价与收盘价的差值，K线的下影线长度等于开盘价与最低价的差值，K线的实体长度等于收盘价与开盘价的差值；当K线的实体颜色是绿色时，K线的上影线长度等于最高价与开盘价的差值，K线的下影线长度等于收盘价与最低价的差值，K线的实体长度等于开盘价与收盘价的差值。4.根据权利要求1所述的基于分解k线聚类和深度强化学习的自适应金融时间序列预测方法，其特征是，所述步骤2中，采用Kmeans聚类算法、FCM聚类算法或基于数据密度的在线聚类方法分别对K线的上影线长度、下影线长度以及实体长度进行聚类，得到K线的上影线长度、下影线长度以及实体长度所对应的聚类中心。5.根据权利要求1所述的基于分解k线聚类和深度强化学习的自适应金融时间序列预测方法，其特征是，所述采用Kmeans聚类算法对K线的上影线长度、下影线长度或实体长度进行聚类的步骤包括：将当前匹配周期内的K线的上影线长度、下影线长度或实体长度作为输入样本，构建训练样本集合K；将训练样本集合K划分为5个类，随机选取每个类中输入样本作为该类的初始聚类中心；计算每个类中输入样本与初始聚类中心的距离平方和，得到Kmeans目标函数，对Kmeans目标函数进行求偏导，计算该导数的最小值，得到每个类的聚类中心。6.根据权利要求1所述的基于分解k线聚类和深度强化学习的自适应金融时间序列预测方法，其特征是，所述采用FCM聚类算法对K线的上影线长度、下影线长度或实体长度进行聚类的步骤包括：将当前匹配周期内的K线数据的上影线、下影线、实体的长度或实体的颜色作为输入样本，构建训练样本集合K；将训练样本集合K划分为5个类，随机选取每个类中输入样本作为该类的初始聚类中心，计算每个输入样本对所有类的隶属度，通过隶属度的大小判断输入样本所属的聚类中心；计算每个类中输入样本与初始聚类中...

【专利技术属性】
技术研发人员：骆超，丁奉乾，
申请(专利权)人：山东师范大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人