用于生成股票的alpha因子的方法、处理器及可读存储介质技术

技术编号:32334672 阅读:14 留言:0更新日期:2022-02-16 18:42
本申请实施例提供一种用于生成股票的alpha因子的方法、处理器及可读存储介质。该方法包括:输入股票的基础特征数据和基础函数;根据基础特征数据和基础函数生成多个公式;计算多个公式中每个公式的适应度;根据每个公式的适应度对公式进行变异和迭代,以确定股票的alpha因子。本申请基于遗传算法生成大量公式,再基于公式的适应度确定是否能成为alpha因子,可以实现alpha因子的批量化挖掘,提高股票的alpha因子的挖掘效率。的alpha因子的挖掘效率。的alpha因子的挖掘效率。

【技术实现步骤摘要】
用于生成股票的alpha因子的方法、处理器及可读存储介质


[0001]本申请涉及计算机
,具体涉及一种用于生成股票的alpha因子的方法、处理器及可读存储介质。

技术介绍

[0002]在传统的股票投资中,研究员往往通过阅读报告和现场调研等方式来分析个股的质地和行业的发展趋势,最终在汇总各方面的研究结果基础上给出一个主观上的判断。在股票的量化投资中,量化研究员更多地是通过数理模型来选择投资的标的,而股票多因子模型是最经典、最主流的模型之一。量化研究员或者量化基金经理通过历史数据(包括交易数据,财务数据等)来挖掘优质股票的特征(也叫因子),并将其应用于未来的投资之中。
[0003]传统的因子挖掘方法是“先有逻辑,再有公式”的,例如,量化研究员认为投资低估值的股票能带来超额收益,便可以通过构建衡量股票估值的指标进行测试,如果用该指标衡量的低估值的股票在历史数据中能带来显著的超额收益,就可以将该指标认定为是一个alpha因子(能带来超额收益的股票特征)。其次,量化研究员还会通过股票特征的函数关系来挖掘股票alpha因子,常见的方法包括对股票特征进行加减乘除等方法构建新的股票特征,如通过市值除以净资产得到市净率。通过这种方法能更高效地挖掘到一些新的因子,但这种挖掘往往也是“先有逻辑,再有公式”,而且由于是人工挖掘,挖掘到的因子是有限而且低效的,同时,由于研究员更难对复杂的函数关系有直观想象,对于需要股票特征之间较为复杂的运算结果才能表达的股票alpha因子往往很难挖掘出来。

技术实现思路

[0004]本申请实施例的目的是提供一种用于生成股票的alpha因子的方法、处理器及可读存储介质,旨在解决现有技术中人工挖掘股票的alpha因子数量有限且效率较低。
[0005]为了实现上述目的,本申请第一方面提供一种用于生成股票的alpha因子的方法,该方法包括:
[0006]输入股票的基础特征数据和基础函数;
[0007]根据基础特征数据和基础函数生成多个公式;
[0008]计算多个公式中每个公式的适应度;
[0009]根据每个公式的适应度对公式进行变异和迭代,以确定股票的alpha因子。
[0010]在本申请实施例中,基础特征数据包括以下中至少一者:
[0011]开盘价、最高价、最低价、收盘价。
[0012]在本申请实施例中,该方法还包括:
[0013]设置对公式进行变异和迭代的参数值。
[0014]在本申请实施例中,设置对公式进行变异和迭代的参数值包括:
[0015]将每一代生成的公式树的公式数量设置为第一设定数量;
[0016]将每一代作为下一代迭代的父代公式的数量设置为第二设定数量;
[0017]将最后一代输出的公式数量设置为第三设定数量;
[0018]其中,第二设定数量和第三设定数量均小于或等于第一设定数量。
[0019]在本申请实施例中,根据每个公式的适应度对公式进行变异和迭代,以确定股票的alpha因子包括:
[0020]随机生成第一设定数量的第一代公式树;
[0021]计算第一代公式树中每个公式的适应度;
[0022]根据适应度从第一代公式树中选择第二设定数量的公式作为下一代迭代的父代公式;
[0023]对父代公式进行变异以生成第二代公式树;
[0024]对第二代公式树进行迭代;
[0025]判断迭代是否达到迭代设定条件;
[0026]在迭代达到设定迭代条件的情况下,停止迭代并获取最后一代的目标公式树;
[0027]计算目标公式树中每个公式的适应度,以确定股票的alpha因子。
[0028]在本申请实施例中,变异包括下列中至少一者:
[0029]交叉变异、子树变异、点变异以及提升变异。
[0030]在本申请实施例中,设置对公式进行变异和迭代的参数值还包括:
[0031]设置交叉变异、子树变异、点变异以及提升变异中至少一者的变异概率;变异概率小于等于1。
[0032]在本申请实施例中,设置对公式进行变异和迭代的参数值还包括:
[0033]将第一代公式树的深度区间设置为设定深度区间。
[0034]在本申请实施例中,随机生成第一设定数量的第一代公式树包括:
[0035]随机生成第一设定数量的设定深度的第一代公式树;设定深度在设定深度区间内。
[0036]在本申请实施例中,判断迭代是否达到迭代设定条件包括:
[0037]判断迭代的代数是否达到设定代数或者当前公式树中所有公式的适应度是否达到设定适应度阈值;
[0038]在迭代的代数达到设定代数或者当前公式树中所有公式的适应度达到设定适应度阈值,判定迭代达到迭代设定条件。
[0039]在本申请实施例中,计算目标公式树中每个公式的适应度,以确定股票的alpha因子包括:
[0040]计算目标公式树中每个公式的适应度;
[0041]根据适应度选择第三设定数量的公式;
[0042]将第三设定数量的公式确定为股票的alpha因子。
[0043]本申请第二方面提供一种处理器,被配置成执行上述的用于生成股票的alpha因子的方法。
[0044]本申请第三方面提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行上述的用于生成股票的alpha因子的方法。
[0045]通过上述技术方案,先根据基础特征数据和基础函数生成多个公式并计算多个公式中每个公式的适应度,再根据每个公式的适应度对公式进行变异和迭代,以确定股票的
alpha因子。这样可以实现alpha因子的批量化挖掘,提高股票的alpha因子的挖掘效率。
[0046]本申请实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0047]附图是用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本申请实施例,但并不构成对本申请实施例的限制。在附图中:
[0048]图1示意性示出了根据本申请实施例的用于生成股票的alpha因子的方法的一实施例的流程示意图;
[0049]图2示意性示出了根据本申请实施例的用于生成股票的alpha因子的方法的另一实施例的流程示意图;
[0050]图3示意性示出了根据本申请实施例的交叉变异的示意图;
[0051]图4示意性示出了根据本申请实施例的子树变异的示意图;
[0052]图5示意性示出了根据本申请实施例的点变异的示意图;
[0053]图6示意性示出了根据本申请实施例的提升变异的示意图;
[0054]图7示意性示出了根据本申请实施例的用于生成股票的alpha因子的方法的一具体实施例的流程示意图;
[0055]图8示意性示出了根据本申请实施例的计算机设备的内部结构图。
具体实施方式
[0056]为使本申请本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于生成股票的alpha因子的方法,其特征在于,所述方法包括:输入所述股票的基础特征数据和基础函数;根据所述基础特征数据和所述基础函数生成多个公式;计算所述多个公式中每个公式的适应度;根据所述每个公式的适应度对所述公式进行变异和迭代,以确定所述股票的alpha因子。2.根据权利要求1所述的方法,其特征在于,所述基础特征数据包括以下中至少一者:开盘价、最高价、最低价、收盘价。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:设置对所述公式进行变异和迭代的参数值。4.根据权利要求3所述的方法,其特征在于,所述设置对所述公式进行变异和迭代的参数值包括:将每一代生成的公式树的公式数量设置为第一设定数量;将每一代作为下一代迭代的父代公式的数量设置为第二设定数量;将最后一代输出的公式数量设置为第三设定数量;其中,所述第二设定数量和所述第三设定数量均小于或等于所述第一设定数量。5.根据权利要求4所述的方法,其特征在于,所述根据所述每个公式的适应度对所述公式进行变异和迭代,以确定所述股票的alpha因子包括:随机生成第一设定数量的第一代公式树;计算所述第一代公式树中每个公式的适应度;根据所述适应度从所述第一代公式树中选择第二设定数量的公式作为下一代迭代的父代公式;对所述父代公式进行变异以生成第二代公式树;对所述第二代公式树进行迭代;判断所述迭代是否达到迭代设定条件;在所述迭代达到设定迭代条件的情况下,停止迭代并获取最后一代的目标公式树;计算所述目标公式树中每个公式的适应度,以确定所述股票的alpha因子。6.根据权利要求5所述的方法,其特征在于,所述变异包括下列中至...

【专利技术属性】
技术研发人员:杨洲清刘本农金玮
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1