一种基于时间序列的因素占比衡量方法及装置制造方法及图纸

技术编号:36810565 阅读:15 留言:0更新日期:2023-03-09 00:41
本申请适用于数据处理技术领域,提供了一种基于时间序列的因素占比衡量方法,该方法包括:根据第一时间序列构建预测模型,第一时间序列是金融数据随时间变化的序列;根据预测模型计算第二时间序列在第一时间序列的影响下的模拟序列值,第二时间序列是金融数据随时间变化的序列;根据模拟序列值计算第一时间序列对第二时间序列的影响比例。该方案通过构建预测模型来模拟得出第二时间序列在仅受第一时间序列的影响下的模拟序列值,然后利用时间点法或滑动窗口法来计算第一时间序列对第二时间序列的影响比例,从而有助于量化第一时间序列对第二时间序列的影响程度。列对第二时间序列的影响程度。列对第二时间序列的影响程度。

【技术实现步骤摘要】
一种基于时间序列的因素占比衡量方法及装置


[0001]本申请涉及金融数据的处理
,尤其涉及一种基于时间序列的因素占比衡量方法及装置。

技术介绍

[0002]大数据时代,时间序列在各领域中应用广泛。时间序列是指将同一统计指标的数值按照发生的时间顺序排列而成的数列。在实践中,可以根据已有的历史时间的统计指标数值对未来时间的统计指标数值进行预测,也即时间序列预测。例如,对移动通信流量的时间序列预测,对金融领域中股票价格的时间序列预测等等。
[0003]在传统方案中,主要是通过改进对时间序列数据自身的分析算法来提高时间序列预测的精确度,但是此种方法只考虑了某一时间序列数据本身的影响因素,较为片面,容易导致对时间序列的研究结果不准确。

技术实现思路

[0004]本申请实施例提供了一种基于时间序列的因素占比衡量方法及装置,可以解决如何计算一种时间序列对另一种时间序列的影响程度的技术问题。
[0005]第一方面,提供了一种基于时间序列的因素占比衡量方法,该方法包括:根据第一时间序列构建预测模型,第一时间序列是金融数据随时间变化的序列。例如,大盘指数时间序列或者GDP指数时间序列等等。
[0006]根据预测模型计算第二时间序列在第一时间序列的影响下的模拟序列值,第二时间序列是金融数据随时间变化的序列,例如,个股股价时间序列或者房价走势时间序列。
[0007]根据模拟序列值计算第一时间序列对第二时间序列的影响比例。该方法有助于准确量化各因素对时间序列的影响程度,也有利于计算第二时间序列仅受第一时间序列的影响下的预测值。
[0008]上述方法还包括:预测模型为回归模型、树结构模型或神经网络模型。该回归模型包括线性回归模型。该树结构模型是利用决策树、随机森林或梯度提升决策树算法训练得到的。
[0009]当预测模型为线性回归模型时,该线性回归模型的目标函数满足下面的公式:
[0010][0011]其中,J为目标函数,
[0012]是指第一时间序列在时间点t
i
仅受自身影响下的变化率;
[0013]是指第一时间序列在时间点t
i
仅受自身影响下的模拟变化率;
[0014]A=[a1,a2,

,a
m
]T
,A为回归模型的模型参数;
[0015]表示在时间点t
i
与相关的因素特征。
[0016]上述方法还包括:计算回归模型中目标函数J对模型参数A的梯度值:
[0017][0018]采用梯度下降算法,更新模型参数,直到计算结果收敛到预设条件,
[0019][0020]其中l为迭代次数,lr为学习率;
[0021]当计算结果收敛到预设条件时,输出回归模型。
[0022]该预设条件可以是迭代计算的次数或者是迭代结果的误差阈值,也可以是更新数据的规模等等。
[0023]上述方法还包括:第二时间序列在第一时间序列的影响下的模拟序列值满足下面的公式:
[0024][0025]其中,指第二时间序列在时间点t
i
的在第一时间序列的影响下的模拟序列值,指第二时间序列在时间点t0的值。根据该公式可以准确计算出第二时间序列在第一时间序列的影响下的模拟序列值。
[0026]根据模拟序列值计算第一时间序列对第二时间序列的影响比例,包括:
[0027]计算时间段t
i
~t
n
内第二时间序列的模拟序列值与第二时间序列的值的比值序列
[0028][0029]其中,指第二时间序列在时间点t
n
的在第一时间序列的影响下的模拟序列值,指第二时间序列在时间点t
i
的值,指第二时间序列在时间点t
n
的值;
[0030]计算时间段t
i
~t
n
内第一时间序列对第二时间序列的影响比例,得到第一影响比例r
point

[0031][0032]其中,point表示时间点。使用时间点法可以将异常点的因素考虑在内,适合希望将序列突变情况考虑在计算结果的应用场景。
[0033]根据模拟序列值计算第一时间序列对第二时间序列的影响比例还包括:
[0034]利用滑动窗口法计算第一时间序列对第二时间序列的影响比例,得到第二影响比
例r
period

[0035][0036]其中,period表示滑动窗口。滑动窗口法可以平滑掉个别时间上的异常点对最终结果的影响,通过时间窗口内的平滑,将异常点过滤掉。
[0037]第二方面,本申请实施例提供了一种基于时间序列的因素占比衡量装置,该装置具有实现第一方面或其任意可能的实现方式中的方法的功能。具体地,该装置包括实现第一方面或其任意可能的实现方式中的方法的单元。
[0038]在其中的一个实施例中,该装置包括:
[0039]构建单元,用于根据第一时间序列构建预测模型,该第一时间序列是金融数据随时间变化的序列。
[0040]计算单元,用于根据预测模型计算第二时间序列在第一时间序列的影响下的模拟序列值,该第二时间序列是金融数据随时间变化的序列。然后根据模拟序列值计算第一时间序列对第二时间序列的影响比例。
[0041]第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序。处理器执行计算机程序时实现上述第一方面任意一种实现方式的方法。
[0042]第四方面,本申请实施例提供了一种计算机可读存储介质。计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述第一方面任意一种实现方式的方法。
[0043]第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面任意一种实现方式的方法。
[0044]本申请实施例与现有技术相比存在的有益效果是:通过构建预测模型来模拟得出第二时间序列在仅受第一时间序列的影响下的模拟序列值,然后计算第一时间序列对第二时间序列的影响比例,有助于量化第一时间序列对第二时间序列的影响程度,从而能够准确判断影响第二时间序列的各因素的重要程度,便于预测研究第二时间序列的相关内容。
[0045]此外,在上述方案的基础上,进一步利用时间点法或滑动窗口法来计算第一时间序列对第二时间序列的影响比例,可以满足是否考虑突变情况的需求,使计算结果更精确。
附图说明
[0046]图1是本申请一实施例提供的一种基于时间序列的因素占比衡量方法的流程示意图;
[0047]图2是本申请一实施例提供的一种构建预测模型的方法的流程示意图;
[0048]图3是本申请一实施例提供的一种计算影响比例的方法的示意图;
[0049]图4是本申请实施例提供的一种基于时间序列的因素占比衡量装本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时间序列的因素占比衡量方法,其特征在于,包括:根据第一时间序列构建预测模型,所述第一时间序列是金融数据随时间变化的序列;根据所述预测模型计算第二时间序列在所述第一时间序列的影响下的模拟序列值,所述第二时间序列是金融数据随时间变化的序列;根据模拟序列值计算所述第一时间序列对所述第二时间序列的影响比例。2.如权利要求1所述的方法,其特征在于,所述预测模型为回归模型、树结构模型或神经网络模型,所述回归模型包括线性回归模型,所述树结构模型是利用决策树、随机森林或梯度提升决策树GBDT算法训练得到的。3.如权利要求2所述的方法,其特征在于,当所述预测模型为线性回归模型时,所述线性回归模型的目标函数满足下面的公式:其中,J为目标函数,是指所述第一时间序列在时间点t
i
仅受自身影响下的变化率;是指所述第一时间序列在时间点t
i
仅受自身影响下的模拟变化率;A=[a1,a2,

,a
m
]
T
,A为所述回归模型的模型参数;,A为所述回归模型的模型参数;表示在时间点t
i
与相关的因素特征。4.如权利要求3所述的方法,其特征在于,所述方法还包括:计算所述回归模型中所述目标函数J对所述模型参数A的梯度值:采用梯度下降算法,更新模型参数,直到计算结果收敛到预设条件,其中l为迭代次数,lr为学习率;当计算结果收敛到所述预设条件时,输出所述回归模型。5.如权利要求1

4中任一项所述的方法,其特征在于,所述第二时间序列在所述第一时间序列的影响下的模拟序列值满足下面的公式:其中,指所述第二时间序列在时间点t
i
的在所述第一时间序列的影响下的模拟序列值,指所述第二时间序列在时间点t0的值。6.如权利要求1所述的方法,其特征在于,所述根据所述模拟序列值计算所...

【专利技术属性】
技术研发人员:赵洋陈龙包荣鑫刘迪田多
申请(专利权)人:深圳价值在线信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1