高频数据的波动率获取方法、装置及计算机可读存储介质制造方法及图纸

技术编号:20547272 阅读:25 留言:0更新日期:2019-03-09 20:03
本发明专利技术涉及数据分析技术,公开了一种高频数据的波动率获取方法,该方法包括:获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;计算市值因子收益率和账面市值比因子收益率;基于市场收益率、市值因子收益率和账面市值比因子收益率,对Fama‑French三因子模型进行回归处理,获取目标股票在交易日内的残差数据;根据残差数据计算个股在交易日内的已实现双幂次变差,作为个股在该交易日内的日内波动率。本发明专利技术还提出一种高频数据的波动率获取装置以及一种计算机可读存储介质。本发明专利技术解决了股票高频数据日内波动率数据准确度低的技术问题。

【技术实现步骤摘要】
高频数据的波动率获取方法、装置及计算机可读存储介质
本专利技术涉及计算机
,尤其涉及一种高频数据的波动率获取方法、装置及计算机可读存储介质。
技术介绍
随着信息技术的进步和数据粒度的微型化,高频交易数据无疑成为各专业机构竟相掘矿的对象,因为日内的高频数据往往蕴含着丰富的信息,但是尚未得到充分的开采。业界对于高频数据的波动率,多采用的是RV(RealizedVolatility,实际波动率)模型进行刻画,主要原因在于RV计算简便,可操作性强,对于无噪声或者噪声较小的环境,RV依概率收敛到IV(IntegratedVolatility,累积波动率);但是,更为现实的环境是,高频数据的噪声是普遍存在的,在这种情况下,现有的RV模型无法将连续波动率和跳跃波动率区分开来,因此也就无法把内在价值信息和噪音区分开来,导致获取到的股票日内波动率数据由于受到噪声的影响而准确度低。
技术实现思路
本专利技术提供一种高频数据的波动率获取方法、装置及计算机可读存储介质,其主要目的在于解决现有技术中获取的股票高频数据日内波动率数据准确度低的技术问题。为实现上述目的,本专利技术还提供一种高频数据的波动率获取方法,该方法包括:获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率;根据所述个股的分钟级别的收益率数据和所述账面市值比计算账面市值比因子收益率;基于所述个股在一个交易日内的市场收益率、所述市值因子收益率和所述账面市值比因子收益率,对Fama-French三因子模型进行回归处理,获取所述目标股票在所述交易日内的残差数据;根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的已实现双幂次变差,将所述已实现双幂次变差作为所述个股在该交易日内的日内波动率。可选地,所述根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率的步骤包括:将全市场的个股按照市值由高至低的顺序进行排序;计算排名为前三分之一的个股构成的高市值股票组合的分钟级别的第一市值加权平均对数收益率,并计算排名为后三分之一的个股构成的低市值股票组合的分钟级别的第二市值加权平均对数收益率;将所述第一市值加权平均对数收益率与所述第二市值加权平均对数收益率之差作为所述市值因子收益率。可选地,所述方法还包括如下步骤:重复执行所述获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据至所述根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的日内波动率的步骤,以计算全市场个股在预设交易日之前的连续多个交易日的日内波动率,并计算所述连续多个交易日的日内波动率的均值;获取所述预设交易日的收益率数据,并根据全市场个股在所述连续多个交易日的日内波动率的均值和所述预设交易日的收益率数据,计算个股日内波动率与次日收益率之间的皮尔森相关系数;若所述皮尔森相关系数为负值且绝对值大于预设阈值,则将所述日内波动率作为选股因子进行选股。可选地,所述将所述日内波动率作为选股因子进行选股的步骤包括:按照个股的在所述预设周期内的平均日内波动率由小至大的顺序对全市场的个股进行排序,将排名最前的预设数量的个股作为优选个股。可选地,所述已实现双幂次变差模型的计算公式如下:其中,RBVi表示个股i在一个交易日内的已实现双幂次变差,εi为个股i在该交易日内的残差数据,n为该交易日内残差数据的个数。此外,为实现上述目的,本专利技术还提供一种高频数据的波动率获取装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的波动率获取程序,所述波动率获取程序被所述处理器执行时实现如下步骤:获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率;根据所述个股的分钟级别的收益率数据和所述账面市值比计算账面市值比因子收益率;基于所述个股在一个交易日内的市场收益率、所述市值因子收益率和所述账面市值比因子收益率,对Fama-French三因子模型进行回归处理,获取所述目标股票在所述交易日内的残差数据;根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的已实现双幂次变差,将所述已实现双幂次变差作为所述个股在该交易日内的日内波动率。可选地,所述根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率的步骤包括:将全市场的个股按照市值由高至低的顺序进行排序;计算排名为前三分之一的个股构成的高市值股票组合的分钟级别的第一市值加权平均对数收益率,并计算排名为后三分之一的个股构成的低市值股票组合的分钟级别的第二市值加权平均对数收益率;将所述第一市值加权平均对数收益率与所述第二市值加权平均对数收益率之差作为所述市值因子收益率。可选地,所述波动率获取程序还可被所述处理器执行,以实现如下步骤:重复执行所述获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据至所述根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的日内波动率的步骤,以计算全市场个股在预设交易日之前的连续多个交易日的日内波动率,并计算所述连续多个交易日的日内波动率的均值;获取所述预设交易日的收益率数据,并根据全市场个股在所述连续多个交易日的日内波动率的均值和所述预设交易日的收益率数据,计算个股日内波动率与次日收益率之间的皮尔森相关系数;若所述皮尔森相关系数为负值且绝对值大于预设阈值,则将所述日内波动率作为选股因子进行选股。可选地,所述已实现双幂次变差模型的计算公式如下:其中,RBVi表示个股i在一个交易日内的已实现双幂次变差,εi为个股i在该交易日内的残差数据,n为该交易日内残差数据的个数。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有波动率获取程序,所述波动率获取程序可被一个或者多个处理器执行,以实现如上所述的高频数据的波动率获取方法的步骤。本专利技术提出的高频数据的波动率获取方法、装置及计算机可读存储介质,获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;根据个股的分钟级别的收益率数据和市值计算市值因子收益率;根据个股的分钟级别的收益率数据和账面市值比计算账面市值比因子收益率;基于个股在一个交易日内的市场收益率、市值因子收益率和账面市值比因子收益率,对Fama-French三因子模型进行回归处理,获取目标股票的在交易日内的残差数据;根据残差数据和已实现双幂次变差模型,计算个股在交易日内的已实现双幂次变差,将已实现双幂次变差作为个股在该交易日内的日内波动率。本专利技术的方案,首先根据Fama-French三因子模型获取残差数据,该残差数据是排除了Fama-French三因子模型中三个因子的影响后,个股独有的收益率部分,将这部分数据作为计算个股日内特有的波动率的数据基础,通过已实现双幂次变差模型,剔除日内高频噪声,消除了已实现波动率和实际波动率之间的偏差,获取到准确度高的股票日内波动率数据。附图说明图1为本专利技术一实施例提供的高频数据的波动率获取方法的流程示意图;图2为本本文档来自技高网...

【技术保护点】
1.一种高频数据的波动率获取方法,其特征在于,所述方法包括:获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率;根据所述个股的分钟级别的收益率数据和所述账面市值比计算账面市值比因子收益率;基于所述个股在一个交易日内的市场收益率、所述市值因子收益率和所述账面市值比因子收益率,对Fama‑French三因子模型进行回归处理,获取所述目标股票在所述交易日内的残差数据;根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的已实现双幂次变差,将所述已实现双幂次变差作为所述个股在该交易日内的日内波动率。

【技术特征摘要】
1.一种高频数据的波动率获取方法,其特征在于,所述方法包括:获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率;根据所述个股的分钟级别的收益率数据和所述账面市值比计算账面市值比因子收益率;基于所述个股在一个交易日内的市场收益率、所述市值因子收益率和所述账面市值比因子收益率,对Fama-French三因子模型进行回归处理,获取所述目标股票在所述交易日内的残差数据;根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的已实现双幂次变差,将所述已实现双幂次变差作为所述个股在该交易日内的日内波动率。2.如权利要求1所述的高频数据的波动率获取方法,其特征在于,所述根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率的步骤包括:将全市场的个股按照市值由高至低的顺序进行排序;计算排名为前三分之一的个股构成的高市值股票组合的分钟级别的第一市值加权平均对数收益率,并计算排名为后三分之一的个股构成的低市值股票组合的分钟级别的第二市值加权平均对数收益率;将所述第一市值加权平均对数收益率与所述第二市值加权平均对数收益率之差作为所述市值因子收益率。3.如权利要求1所述的高频数据的波动率获取方法,其特征在于,所述方法还包括如下步骤:重复执行所述获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据至所述根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的日内波动率的步骤,以计算全市场个股在预设交易日之前的连续多个交易日的日内波动率,并计算所述连续多个交易日的日内波动率的均值;获取所述预设交易日的收益率数据,并根据全市场个股在所述连续多个交易日的日内波动率的均值和所述预设交易日的收益率数据,计算个股日内波动率与次日收益率之间的皮尔森相关系数;若所述皮尔森相关系数为负值且绝对值大于预设阈值,则将所述日内波动率作为选股因子进行选股。4.如权利要3所述的高频数据的波动率获取方法,其特征在于,所述将所述日内波动率作为选股因子进行选股的步骤包括:按照个股的在所述预设周期内的平均日内波动率由小至大的顺序对全市场的个股进行排序,将排名最前的预设数量的个股作为优选个股。5.如权利要求1至4中任一项所述的高频数据的波动率获取方法,其特征在于,所述已实现双幂次变差模型的计算公式如下:其中,RBVi表示个股i在一个交易日内的已实现双幂次变差,εi为个股i在该交易日内的残差数据,n为该交易日内残差数据的个数。6.一种高频数据的波动率获取装置,其特征在于,所述装置包括存储...

【专利技术属性】
技术研发人员:李海疆
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1