当前位置: 首页 > 专利查询>曹东专利>正文

金融时间序列分段分布特征计算方法及系统技术方案

技术编号:11763856 阅读:171 留言:0更新日期:2015-07-23 13:59
本发明专利技术公开了一种金融时间序列分段分布特征计算方法。所述方法基于交易价格的TICK数据,采用差分去直流的数据预处理方法,构造一种新的分段序列数据结构,对差分序列进行连续分段,统计分段序列先验概率分布,实现金融交易数据趋势分布计算。本发明专利技术还提供一种金融时间序列分段分布特征计算系统,相比于其他金融时间序列特征提取算法,本发明专利技术具有更简洁的数据处理结构,更优的识别性能和良好的数据一致性;同时,本发明专利技术的数据处理方法得到的序列分布特性明显,在模糊估计方面相比于其他同类算法具有更优性能。

【技术实现步骤摘要】

本专利技术涉及一种金融时间序列数据分布特征提取方法,属于计算机数据处理技术 领域。
技术介绍
时间序列分析在理论和经验上已成为金融市场研宄的不可缺少的部分。时间序列 分析方法已是金融定量分析的主流方法之一。近代计量经济和金融市场的许多研宄成果都 建立在时间序列分析的基础之上。Engle和Grange因为他们的时间序列模型在经济金融中 的广泛应用而获得2003年的诺贝尔经济学奖,就是时间序列分析方法的重要性在世界上 被广泛认可的有力证明。 金融时间序列分析研宄的是资产价值随时间演变的理论与实践。对于金融资产收 益率序列,波动率往往不能被观察到,此时统计技术与方法起到了很重要的作用。时间序列 预测就是利用统计技术与方法,从预测指标的时间序列中找出演变模式,建立数学模型,对 预测指标的未来发展趋势做出定量估计。时间序列预测主要是以连续性原理作为依据的, 连续性原理是指客观事物的发展具有合乎规律的连续性,事物发展是按照它本身固有的规 律进行的。在一定条件下,只要规律赖以发生作用的条件不产生质的变化,则事物的基本发 展趋势在未来就还会延续下去。 程序化交易方法在专业投资领域被广泛采用,近年来呈现高速发展趋势,金融时 间序列分析方法在程序化交易设计等等量化投资领域给出有效的解决方案。可以为投资机 构在进行算法交易与投资组合管理时提供模型依据,并且可以提供风险分析的数据源。 但是,金融时间序列实时数据随市场波动性强,每交易日的TICK数据量大,在分 析处理过程中的计算复杂度较大,增加了数据特征提取的难度。
技术实现思路
本专利技术所要解决的技术问题是针对金融时间序列数据分段分布特征提取难度大 的现状,提出一种金融时间序列数据分段分布特征计算方法。 本专利技术为解决上述技术问题采用以下技术方案: 一种金融时间序列分段分布特征计算方法,包括如下步骤: 步骤A、对获取的金融交易数据按照价格-时间序列进行差分处理,去除数据中的 直流成分,得到差分序列; 步骤B、对差分序列按照时间顺序进行连续分段,得到若干个W元向量,W为分段窗 口的大小; 步骤C、进行连续分段的分布特性统计,筛选出不同种类的分段,对于同一种分段 统计其出现的次数;然后对于不同种类的分段进行排序构成分段特征矩阵,其中:矩阵中 每行的第一列至第W列构成的行向量代表每个分段,第W+1列代表对应分段出现的次数;第 w+2列到最末列为分段特征向量; 步骤D、根据分段特征矩阵,在已知差分序列第i位取值的条件下,得到差分序列 第i+1至第i+w-i位取值的概率分布,具体操作过程是:首先确定差分序列第i位取值Vi, 然后从分段特征矩阵中挑选出第一列元素等于Vi的所有行构成新的子矩阵'_,将子矩阵Mj 的第二至w列作为子向量按照升序排列,然后以第二至第w列的升序子向量作为横轴,各子 向量对应出现的次数为纵轴,得到第i+1至第i+w-1位的取值频度分布情况。 进一步的,本专利技术所提出的金融时间序列分段分布特征计算方法,步骤A所述的 差分处理为一阶差分处理,得到一阶差分序列。 进一步的,本专利技术所提出的金融时间序列分段分布特征计算方法,步骤B所述分 段窗口W= 2、3、4、5、6、7。 进一步的,本专利技术所提出的金融时间序列分段分布特征计算方法,步骤C中分段 特征矩阵中的列排序是按照各分段的w元向量的第一元至第w元从小到大进行排列,先以 分段向量第一元素的大小从小往大进行升序排列,如果分段向量第一元素的大小相同时, 再以分段向量第二元素的大小从小到大进行升序排列,依此类推。 进一步的,本专利技术所提出的金融时间序列分段分布特征计算方法,分段特征向量 代表对应分段在步骤A所述差分序列中的位置,分段特征向量中出现1的位置代表对应分 段在序列中出现的位置,其余位置用0元素表示。 进一步的,本专利技术所提出的金融时间序列分段分布特征计算方法,步骤B所述分 段窗口W= 2。 进一步的,本专利技术所提出的金融时间序列分段分布特征计算方法,步骤D中将子 矩阵%的第二至w列作为子向量按照升序排列,是按照各子向量第一元素的大小从小往大 进行升序排列,如果第一元素的大小相同时,再以第二元素的大小从小到大进行升序排列, 依此类推。 进一步的,本专利技术所提出的金融时间序列分段分布特征计算方法,步骤A所述的 差分处理,是采用量子熵分布模糊哈希算法以确定差分阶数: (1)分析原始金融时间序列的各阶差分序列的量子广义信息熵及其相似性: 将各阶差分序列表示成量子序列形式,给定一个具有t个数据元素的量子数据序 列I 每个数据元素表示为quatrit态,quatrit态的一系列正交基表示为|〇>,|1>与 2>,纯态Iy>为10>,11>与I2>的叠加态,量子态Iy>表示为:【主权项】1. 一种金融时间序列分段分布特征计算方法,其特征在于,包括如下步骤: 步骤A、对获取的金融交易数据按照价格-时间序列进行差分处理,去除数据中的直流 成分,得到差分序列; 步骤B、对差分序列按照时间顺序进行连续分段,得到若干个W元向量,W为分段窗口的 大小; 步骤C、进行连续分段的分布特性统计,筛选出不同种类的分段,对于同一种分段统计 其出现的次数;然后对于不同种类的分段进行排序构成分段特征矩阵,其中:矩阵中每行 的第一列至第W列构成的行向量代表每个分段,第W+1列代表对应分段出现的次数;第W+2 列到最末列为分段特征向量; 步骤D、根据分段特征矩阵,在已知差分序列第i位取值的条件下,得到差分序列第i+1 至第i+w-1位取值的概率分布。2. 根据权利要求1所述的一种金融时间序列分段分布特征计算方法,其特征在于,步 骤D具体操作过程是;首先确定差分序列第i位取值Vi,然后从分段特征矩阵中挑选出第一 列元素等于Vi的所有行构成新的子矩阵Mj.,将子矩阵Mj.的第二至W列作为子向量按照升序 排列,然后W第二至第W列的升序子向量作为横轴,各子向量对应出现的次数为纵轴,得到 第i+1至第i+w-1位的取值频度分布情况。3. 根据权利要求1所述的一种金融时间序列分段分布特征计算方法,其特征在于,步 骤A所述的差分处理为一阶差分处理,得到一阶差分序列。4. 根据权利要求1所述的一种金融时间序列分段分布特征计算方法,其特征在于,步 骤B所述分段窗口W为2或3或4或5或6或7中的任意一个。5. 根据权利要求1所述的一种金融时间序列分段分布特征计算方法,其特征在于,步 骤C中分段特征矩阵中的列排序是按照各分段的W元向量的第一元至第W元从小到大进行 排列,先W分段向量第一元素的大小从小往大进行升序排列,如果分段向量第一元素的大 小相同时,再W分段向量第二元素的大小从小到大进行升序排列,依此类推。6. 根据权利要求1所述的一种金融时间序列分段分布特征计算方法,其特征在于,分 段特征向量代表对应分段在步骤A所述差分序列中的位置,分段特征向量中出现1的位置 代表对应分段在序列中出现的位置,其余位置用0元素表示。7. 根据权利要求1或4所述的一种金融时间序列分段分布特征计算方法,其特征在于, 步骤B所述分段窗口w= 2。8. 根据权利要求2所述的一种金融时间序列分段分布特征计算方法,其特征在于,步 骤D中本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/CN104794235.html" title="金融时间序列分段分布特征计算方法及系统原文来自X技术">金融时间序列分段分布特征计算方法及系统</a>

【技术保护点】
一种金融时间序列分段分布特征计算方法,其特征在于,包括如下步骤:步骤A、对获取的金融交易数据按照价格‑时间序列进行差分处理,去除数据中的直流成分,得到差分序列;步骤B、对差分序列按照时间顺序进行连续分段,得到若干个w元向量,w为分段窗口的大小;步骤C、进行连续分段的分布特性统计,筛选出不同种类的分段,对于同一种分段统计其出现的次数;然后对于不同种类的分段进行排序构成分段特征矩阵,其中:矩阵中每行的第一列至第w列构成的行向量代表每个分段,第w+1列代表对应分段出现的次数;第w+2列到最末列为分段特征向量;步骤D、根据分段特征矩阵,在已知差分序列第i位取值的条件下,得到差分序列第i+1至第i+w‑1位取值的概率分布。

【技术特征摘要】

【专利技术属性】
技术研发人员:曹东
申请(专利权)人:曹东
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1