行情数据模拟生成的方法、装置、存储介质及电子设备制造方法及图纸

技术编号:35840007 阅读:16 留言:0更新日期:2022-12-03 14:12
本公开实施例提供的行情数据模拟生成的方法、装置、存储介质及电子设备,属于数据处理领域,通过对高流动性资产报价市场行情的深度分析,基于统计学的经典概率分布理论,结合机器学习中的隐马尔可夫模型,针对较少的tick级行情数据进行全面分析和特征提取,生成多维度、非均匀时间的时间序列模拟数据。非均匀时间的时间序列模拟数据。非均匀时间的时间序列模拟数据。

【技术实现步骤摘要】
行情数据模拟生成的方法、装置、存储介质及电子设备


[0001]本公开实施例涉及数据处理领域,具体地涉及一种行情数据模拟生成的方法、装置、存储介质及电子设备。

技术介绍

[0002]随着信息时代日渐成熟、国内金融政策转变,量化交易在银行等金融机构中的热度逐渐高涨,而tick级报价行情数据是进行量化策略回测和量化交易风控设计的核心前提条件。但由于经纪商的tick级数据价格昂贵、数据量庞大且需花费大量时间进行基础的清洗、提取、储存和维护,因此数据形态可控、数据结构稳定且不需要二次清洗的行情数据已成为各大金融机构的迫切需求。现有技术中,只能针对单一维度的时间序列数据进行模拟且只能生成均匀的序列、无法模拟实际报价时间不均匀的情景;因此如何生成多维度、非均匀时间的时间序列模拟数据是亟待解决的问题。

技术实现思路

[0003]本公开的目的在于,针对现有技术中存在的问题,提供一种行情数据模拟生成的方法、装置、存储介质及电子设备,生成多维度、非均匀时间的时间序列模拟数据。
[0004]根据本公开的一个方面,提出一种行情数据模拟生成的方法,包括:响应于输入对象数据,生成所述对象数据的统计特征,所述对象数据为行情数据,所述统计特征包括与报价相关的第一统计特征以及与报量相关的第二统计特征,基于所述第一统计特征,通过隐马尔科夫模型生成报量的第二统计特征,至少基于所述第一统计特征和所述第二统计特征生成所述对象数据的模拟数据。
[0005]在一些实施例中,所述方法还包括,所述对象数据包括单日内完整tick行情数据。
[0006]在一些实施例中,所述方法还包括,基于单位时间内是否发生报价的概率,随机生成交易时间对应的报价状态,获取均匀时间序列T下的报价状态序列S,其中报价状态包括非零状态和零状态,非零状态是指有新报价推出,零状态是指无新报价推出。
[0007]在一些实施例中,所述方法还包括,所述第一统计特征包括报价涨跌幅的均值与标准差、bid报价与ask报价的价差及价差的均值与标准差。
[0008]在一些实施例中,所述方法还包括,所述基于所述第一统计特征,通过隐马尔科夫模型生成报量的第二统计特征,具体为:运用隐马尔科夫模型获取所述价差两种隐状态下的高斯分布,基于所述两种隐状态对所述报价涨跌幅分类,对每组所述分类进行二次分组,基于报价涨跌幅分类分别对所述报量进行分类并分别计算bid报量、ask报量在各分组中的均值与标准差。
[0009]在一些实施例中,所述方法还包括,选定报价基数和模拟次数,基于所述报价涨跌
幅的均值与标准差,通过高斯分布生成对应的随机数,基于任意选择的初始值累加可模拟生成n条长度为q的价格模拟序列,其中q为序列中非零状态数量,根据预设条件筛选所需模拟bid报价数据,其中n>0,q>0。
[0010]在一些实施例中,所述方法还包括,基于模拟报价数据的长度,以及所述价差的均值与标准差,生成对应模拟价差数据。
[0011]在一些实施例中,所述方法还包括,基于所述模拟bid报价数据和所述模拟价差数据计算得到模拟ask报价数据。
[0012]在一些实施例中,所述方法还包括,基于原行情价差、报价涨跌幅与报量的所述隐马尔可夫模型分组关系、所述bid报量、ask报量在各分组中的均值与标准差,通过所述模拟bid报价数据、所述模拟ask报价数据和所述模拟价差数据生成对应报量的模拟数据。
[0013]在一些实施例中,所述方法还包括,在所述报价状态序列及对应时间序列中插入模拟数据,通过筛选报价状态为有新报价推出,即可生成非均匀时间的模拟行情数据。
[0014]根据本公开的另一个方面,提出一种行情数据模拟生成的装置,包括:第一统计特征生成模块,用于响应于输入对象数据,生成所述对象数据的统计特征,所述对象数据为行情数据,所述统计特征包括与报价相关的第一统计特征以及与报量相关的第二统计特征;第二统计特征生成模块,用于基于所述第一统计特征,通过隐马尔科夫模型生成报量的第二统计特征;模拟数据生成模块,用于至少基于所述第一统计特征和所述第二统计特征生成所述对象数据的模拟数据。
[0015]在一些实施例中,所述装置还包括,报价状态序列生成模块,用于基于单位时间内是否发生报价的概率,随机生成交易时间对应的报价状态,获取均匀时间序列T下的报价状态序列S,其中报价状态包括非零状态和零状态,非零状态是指有新报价推出,零状态是指无新报价推出。
[0016]本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如上任一实施例所述的一种行情数据模拟生成的方法中的步骤。
[0017]本申请实施例还提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,执行如上任一实施例所述的行情数据模拟生成的方法中的步骤。
[0018]本公开实施例提供的一种行情数据模拟的方法、装置、存储介质及电子设备,通过对高流动性资产报价市场行情的深度分析,基于统计学的经典概率分布理论,结合机器学习中的隐马尔可夫模型,针对较少的tick级行情数据进行全面分析和特征提取,生成多维度、非均匀时间的时间序列模拟数据。
附图说明
[0019]下面结合附图,通过对本公开的具体实施方式详细描述,将使本公开的技术方案及其它有益效果显而易见。
[0020]图1为本申请实施例提供的一种行情数据模拟的方法示意图。
[0021]图2本申请实施例提供的一种行情数据模拟的装置示意图。
[0022]图3本申请实施例提供的一种电子设备示意图。
具体实施方式
[0023]下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。本公开的说明书和权利要求书以及附图中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排它的包含。在本公开的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0024]以下将分别对本申请实施例提供的一种行情数据模拟生成的方法、装置、存储介质及电子设备进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
[0025]实施例一:具体地,请参阅图1,为本公开提供的一种行情数据模拟方法。具体步骤如下:步骤S1响应于输入对象数据,生成所述对象数据的统计特征,所述对象数据为行情数据,所述统计特征包括与报价相关的第一统计特征以及与报量相关的第二统计特征。
[0026]在一些实施例中,以国债期货报价行情为例,输入的对象数据包括单日内完整tick行情数据,tick级(每秒三次或逐笔推送)行情数据:时间(t),买入报价(bid_price),卖出报价(ask_price),买入报量(bid_volume),卖出报量(ask_volume)。
[0027]在一些实施例中,首先生成均匀时间序列状态下的报价状态序列。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行情数据模拟生成的方法,其特征在于,包括:响应于输入对象数据,生成所述对象数据的统计特征,所述对象数据为行情数据,所述统计特征包括与报价相关的第一统计特征以及与报量相关的第二统计特征,基于所述第一统计特征,通过隐马尔科夫模型生成所述第二统计特征,至少基于所述第一统计特征和所述第二统计特征生成所述对象数据的模拟数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括,所述对象数据包括单日内完整tick行情数据。3.根据权利要求2所述的方法,其特征在于,所述方法还包括,基于单位时间内是否发生报价的概率,随机生成交易时间对应的报价状态,获取均匀时间序列T下的报价状态序列S,其中报价状态包括非零状态和零状态,非零状态是指有新报价推出,零状态是指无新报价推出。4.根据权利要求3所述的方法,其特征在于,所述方法还包括,所述第一统计特征包括报价涨跌幅的均值与标准差、bid报价与ask报价的价差及价差的均值与标准差。5.根据权利要求4所述的方法,其特征在于,所述方法还包括,所述基于所述第一统计特征,通过隐马尔科夫模型生成报量的第二统计特征,具体为:运用隐马尔科夫模型获取所述价差两种隐状态下的高斯分布,基于所述两种隐状态对所述报价涨跌幅分类,对每组所述分类进行二次分组,基于报价涨跌幅分类分别对所述报量进行分类并分别计算bid报量、ask报量在各分组中的均值与标准差。6.根据权利要求5所述的方法,其特征在于,所述方法还包括,选定报价基数和模拟次数,基于所述报价涨跌幅的均值与标准差,通过高斯分布生成对应的随机数,基于任意选择的初始值累加可模拟生成n条长度为q的价格模拟序列,其中q为序列中非零状态数量,根据预设条件筛选所需模拟bid报价数据,其中n>0,q>0。7.根据权利要求6所述的方法,其特征在于,所述方法还包括,基于模拟报价数据的长度,以及所述价差的均值与标准差,生成对应模拟价差数据。8.根据权利要求7所述的方法,其特征在于,所述方法...

【专利技术属性】
技术研发人员:杨蕊菱张炜祺赵禹平徐建程陈雪东万宇雷
申请(专利权)人:上海金仕达软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1