The present invention provides a method and apparatus, cluster device and storage medium, the method comprises the following steps: extracting a plurality of data samples from multiple data samples, with a characteristic quantity of each sample contains the data for the sub sample time disjoint data set; the sub samples according to the same feature the amount of imputation; factor parameter calculation of the plurality of sub sample values; the collection of similar factors are the same features of quantum samples, and according to the same factor parameter sort; the same factor according to the definition of parameter values by clustering to generate multiple clustering factor. By adopting the factor clustering method and the primary strategy generated by the system, the primary strategy generation and the corresponding back calculation operation are reduced, which further reduces the burden of the system resources, reduces the operation time of the strategy, and improves the efficiency of policy generation.
【技术实现步骤摘要】
因子聚类方法与装置、设备与存储介质
本专利技术涉及金融领域,尤其涉及金融数据处理领域中关于因子聚类方法装置、设备和存储介质。技术背景随着理财观念的不断普及,越来越多的投资理财产品应运而生,如基金、债券、股票以及保险等金融产品逐渐在金融市场中发展成熟,投资理财也不再是富人们的专利,普通百姓也改变了传统的理财观念,而不只是选择把资金存放在银行。但是对于普通百姓,尤其是对于那些没有经济金融专业背景的人们来说,纷繁复杂的投资理财产品常常会让他们感到不知所措,从而只能盲目地跟风。此外,购买理财产品时,首先需要读懂产品说明书,包括说明书中产品投资方向、风险等级以及相应的附加条款,而通常各种金融产品说明书上的用词术语都比较专业,投资者如不具备一定的知识基础则很容易被忽悠,这就需要该领域的专业人士来为这些投资者进行相关方面的投资指导和规划。针对上述问题,目前市面上已经出现了不少量化交易投资理财的平台,为个人或者企业投资者在制定投资策略、理财规划等方面提供了许多数据分析和建议。现有的量化交易策略大多数经过金融工程师编写产生,并通过回测历史数据进行甄别策略好坏的方法,这种方法所产生的策略耗时耗力,并且大多数都是无效策略。还有一种方法是通过定义多因子进行因子有效性检验,然后进行人工考察判别因子的有效性,此种方法也需要有经验的人员,效率低下,难以适应瞬息多变的市场。总之,若能提供一种基于自动因子聚类的量化策略生成方法,用于产生较好的模板,减少大量数据参与策略生成和运算,降低计算机运算时间,将极大提高工作效率,让策略快速落地。
技术实现思路
本专利技术提供一种因子聚类方法,用以解决 ...
【技术保护点】
因子聚类方法,适于在因子聚类设备中执行,其特征在于,包括以下步骤:从多个数据样本中抽取多个数据子样本,每个数据样本包含的同一特征量的数据子样本为时间不相交的数据集合;将所述子样本按同一特征量进行归集,所述特征量包括但不限于开盘价、收盘价、最高价、最低价、成交量;计算所述多个子样本的因子参数值,所述的参数值包括因子的统计量,形状或者形态的特征值;归集所述相同特征量子样本的同类因子,并依同类因子参数值大小进行排序;将所述同类因子按定义参数值进行聚类,生成多个聚类因子。
【技术特征摘要】
1.因子聚类方法,适于在因子聚类设备中执行,其特征在于,包括以下步骤:从多个数据样本中抽取多个数据子样本,每个数据样本包含的同一特征量的数据子样本为时间不相交的数据集合;将所述子样本按同一特征量进行归集,所述特征量包括但不限于开盘价、收盘价、最高价、最低价、成交量;计算所述多个子样本的因子参数值,所述的参数值包括因子的统计量,形状或者形态的特征值;归集所述相同特征量子样本的同类因子,并依同类因子参数值大小进行排序;将所述同类因子按定义参数值进行聚类,生成多个聚类因子。2.如权利要求1所述的因子聚类方法,其特征在于,所述的因子的统计量,包括但不限于平均值、方差、标准差、最高值、最低值、中间值。3.如权利要求1所述的因子聚类方法,其特征在于,所述的因子的形状或者形态的特征值通过计算相似度描述。4.如权利要求3所述的因子聚类方法,其特征在于,所述因子的形状或者形态的特征值相似度计算方法包括:设定多组标准形态,所述形态包括K线图反应的最高价、开盘价、收盘价和最低价;计算各子样本形态与所述多组标准形态的相似度,所述相似度计算方法包括欧氏距离。5.如权利要求1所述的因子聚类方法,其特征在于,在所述将所述子样本按同一特征量进行归集步骤后,所述计算所述多个子样本的因子参数值步骤前,还包括:将相同特征量的子样本进行排列的步骤。6.如权利要求5所述的因子聚类方法,其特征在于,所述将相同特征量的子样本进行排列的步骤,具体包括...
【专利技术属性】
技术研发人员:李贵,
申请(专利权)人:上海宽全智能科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。