用于资产管理和交易的分布式进化算法制造技术

技术编号:14146959 阅读:105 留言:0更新日期:2016-12-11 03:56
本发明专利技术的各实施例总体上涉及用于资产管理和交易的分布式进化算法。具体地,服务器计算机和多个客户端计算机形成网络计算系统,该网络计算系统是可扩展的,并且适于使用运行在所述客户端计算机上的软件应用来持续评估生成的多个基因的性能特性。每个客户端计算机持续周期性地接收与在其存储器中存储的基因相关联的数据。使用此数据,客户端计算机通过对由基因提供的解与周期性接收的与该基因相关联的数据进行比较来评估该基因的性能特性。由此,每个基因的性能特性利用每个周期性接收的数据而被更新和改变。基因的性能特性定义其适应度。基因可以是推荐交易选项的虚拟资产交易者,并且与基因相关联的数据可以是历史交易数据。

【技术实现步骤摘要】
分案申请说明本申请是申请日为2010年4月28日、申请号为201080018807.8、专利技术名称为“用于资产管理和交易的分布式进化算法”的中国专利技术专利申请的分案申请。相关申请交叉引用本申请基于35USC 119(e)要求2009年4月28日提交的名称为“Distributed Evolutionary Algorithm for Stock Trading”的美国临时申请号61/173580的权益,在此通过引用将其内容全文并入。
技术介绍
复杂的金融趋势和模式分析处理通常利用超级计算机、大型机或功能强大的工作站和PC完成,它们通常位于公司的防火墙内,并且由该公司的信息技术(IT)组拥有和操作。在这种硬件和运行该硬件的软件方面的投资是巨大的。维护(修复、调整、打补丁)和操作(电气,安全数据中心)这种基础架构的成本同样巨大。股票价格的波动通常是不可预测的,但是偶尔呈现出可预测模式。基因算法(GA)被公知为已经在股票分类中使用。根据一种理论,在任何给定时间,5%的股票遵循一种趋势。基因算法因此有时被使用来将股票分类为遵循或不遵循趋势,并且取得一些成功。作为基因算法的超集的进化算法在穿越混沌搜索空间时是良好的。如同Koza,J.R 1992年在MIT会议上发表的“Genetic Programming:On the Programming of Computers by Means of Natural Selection”中已经示出,进化算法可以被使用来在断言注释时进化完整的程序。进化算法的基本元素是环境、基因模型、适应性函数(fitness function)以及复制函数。环境可以是任何问题陈述的模型。基因可以由用于管理在所述环境内管理其行为的规则集定义。规则是要在所述环境中执行的动作所遵循的条件列表。适应性函数可以利用进化规则集正在与所述环境进行协商的成功程度定义。适应性函数由此用于评估每个基因在所述环境中的适应度(fitness)。复制函数通过将规则与所述父基因中的最适应的父基因混合来生成新基因。在每代中,创建新的群体(population)。在所述进化过程的开始,通过将形成基因的构件块或字母放置在一起,完全随机地创建组成所述初始群集的基因。在基因编程时,所述字母是一组条件和动作,该一组条件和动作组成在所述环境内管理所述基因的行为的规则。一旦建立起群集,就使用所述适应性函数来对该群集进行评估。具有最高适应度的基因随后被使用来在被称作复制的过程中创建下代。通过复制,父基因的规则被混合,并且有时被变异(即,在规则中进行随机变化)来创建新的规则集。该新的规则集随后被分配给将作为所述新代的成员的子基因。在一些具体实现中,上代中的最适应成员(称为精英)也被复制到下代。
技术实现思路
根据本专利技术的一个实施例,一种联网计算机系统,包括一个或多个服务器计算机,以及多个与所述服务器计算机通信的客户端计算机。每个客户端计算机部分包括存储器、通信端口和处理器。每个客户端服务器中的存储器可被操作来存储多个基因,每个基因由一组一组条件和至少一个动作表征。每个客户端计算机中的通信端口持续周期性地接收与存储在所述存储器中的基因相关联的数据。每个客户端计算机中的处理器通过将其每个基因所提供的解与周期性接收的与该基因相关联的数据进行比较来评估该基因的性能特性。由此,每个基因的性能特性利用每个周期性接收的数据而被更新和改变。基因的性能特性定义其适应度。在一个实施例中,与每个基因相关联的数据是历史交易数据,并且每个基因所提供的解是由该基因推荐的交易。在一个实施例中,其适应度在覆盖第一时间段的评估之后被确定为小于第一预定阈值的基因被丢弃。在周期性地接收到新数据时,剩余(存留的)基因继续由它们的客户端计算机评估。在一个实施例中,响应于来自所述服务器计算机的指令,在所述第一评估时间段中存留的基因继续由所述客户端计算机评估一个或多个附加时间段。在每个附加时间段期间,丢弃适应度小于阈值的基因。当服务器请求时,在一个或多个评估时间段中存留的基因被存储在精英基因池中,以供所述服务器选择。与多个时间段对应的用于评估基因的适应度的阈值可以相等或者可以不相等。在一个实施例中,所述服务器计算机从所述客户端计算机的精英池中选择基因,并且将其存储在其存储器中。所述服务器可以将存储在其存储器中的基因传送回所选择的客户端计算机中的一个或多个中,以进行覆盖附加时间段的进一步评估。所选择的客户端计算机在附加时间段内进一步评估基因,并且尝试将所述存留的基因传送回所述服务器。被所述客户端计算机丢弃的基因被报告给所述服务器。在一个实施例中,所述服务器仅仅接收适应度被所述客户端计算机确定为等于或大于所述服务器先前存储的该基因的适应度的基因。在一个实施例中,由客户端计算机初始评估的基因根据客户端计算机所存储并执行的计算机指令而被生成。在一个实施例中,所述服务器在任何给定时间将固定数目的基因存储在其存储器中。在从客户端计算机接受新基因后,所述服务器将所接受的基因的适应度值与所述服务器先前已经存储在所述服务器中的该基因的对应适应度值结合。根据本专利技术的一个实施例,一个求解计算问题的方法,部分包括:存储N个基因,每个基因由一组条件以及至少一个动作表征;继续周期性地接收与所述N个基因相关联的数据;以及通过将每个基因所提供的解与所述周期性接收的与该基因相关联的数据进行比较,来评估该基因的性能特性。由此,每个基因的性能特性利用每个周期性接收的数据而被更新和改变。基因的性能特性定义其适应度。在一个实施例中,与每个基因相关联的数据是历史交易数据,并且每个基因所提供的解是由该基因推荐的交易。在一个实施例中,在覆盖跨度为P天的第一时间段的评估之后其适应度被确定为小于第一预定阈值的基因被丢弃。在周期性地接收到新数据时,继续评估在上述评估中存留的剩余基因。在一个实施例中,在所述第一评估时间段中存留的基因响应于指令而被继续评估一个或多个附加时间段。在每个附加时间段期间,丢弃适应度低于阈值的基因。在所述一个或多个评估时间段内存留的基因被存储在精英基因池中,以供可能的选择。所选择的基因被存储在不同的存储器中。与多个时间段对应的用于评估基因的适应度的阈值可以相等或者可以不相等。在一个实施例中,所选择的基因可以被传送回,以用于覆盖附加时间段的进一步评估。所选择的基因在附加时间段内被进一步评估。在该进一步的评估中存留的基因被提供来用于选择。在该进一步的评估中没有存留的基因被丢弃,但是在报告中指出。在一个实施例中,仅仅选择适应度被确定为等于或大于先前存储的该基因的适应度的基因。在一个实施例中,基因根据所述客户端计算机存储并执行的计算机指令而被生成。在一个实施例中,管理和向所述客户端计算机传送指令的计算机在任何给定时间存储固定数目的所选择的基因。在一个实施例中,如果新近选择的基因先前被选择和存储,则将该新近选择的基因的适应度值与该基因的对应适应度值结合。附图说明图1是根据本专利技术的一个实施例的被配置为执行进化算法的网络计算系统的示例高级方框图。图2示出了根据本专利技术的一个示例实施例的图1中的客户端计算机系统和服务器计算机系统的多个功能逻辑块。图3A示出了根据本专利技术的一个实施例的一个或多个客户端计算机评估多个基因的性能特性本文档来自技高网
...
用于资产管理和交易的分布式进化算法

【技术保护点】
一种计算机实现的数据挖掘系统,包括:数据处理器;以及存储器,其对所述数据处理器可访问并且标识具有个体的池的候选数据库,所述个体中的每个个体进一步与相应适应度估计的指示相关联,为了与对所述数据处理器可访问并且标识训练数据的数据挖掘训练数据库一起使用,所述数据处理器被配置为:在所述训练数据的第一子集上测试所述个体中的至少一个个体的第一子集中的每个个体;依赖于在所述训练数据的第一子集上的所述测试,计算所述个体的第一子集中每个所述个体的适应度估计;依赖于其适应度估计,从所述个体的第一子集中丢弃个体,以形成小于所述个体的第一子集的个体的第二子集;在所述训练数据的第二子集上测试所述个体的第二子集中的每个个体,所述训练数据的第二子集包括至少一个不被包括在所述训练数据的第一子集中的数据;依赖于在所述训练数据的所述第二子集上的所述测试,更新在所述训练数据的第二子集上测试的每个个体的所述适应度估计;依赖于其更新的适应度估计,从所述个体的第二子集中丢弃其他个体;以及依赖于一个或多个个体,通过复制产生新的个体,作为所述复制中父亲的所有所述个体仅从所述个体的第二子集中被选择。

【技术特征摘要】
2009.04.28 US 61/173,5801.一种计算机实现的数据挖掘系统,包括:数据处理器;以及存储器,其对所述数据处理器可访问并且标识具有个体的池的候选数据库,所述个体中的每个个体进一步与相应适应度估计的指示相关联,为了与对所述数据处理器可访问并且标识训练数据的数据挖掘训练数据库一起使用,所述数据处理器被配置为:在所述训练数据的第一子集上测试所述个体中的至少一个个体的第一子集中的每个个体;依赖于在所述训练数据的第一子集上的所述测试,计算所述个体的第一子集中每个所述个体的适应度估计;依赖于其适应度估计,从所述个体的第一子集中丢弃个体,以形成小于所述个体的第一子集的个体的第二子集;在所述训练数据的第二子集上测试所述个体的第二子集中的每个个体,所述训练数据的第二子集包括至少一个不被包括在所述训练数据的第一子集中的数据;依赖于在所述训练数据的所述第二子集上的所述测试,更新在所述训练数据的第二子集上测试的每个个体的所述适应度估计;依赖于其更新的适应度估计,从所述个体的第二子集中丢弃其他个体;以及依赖于一个或多个个体,通过复制产生新的个体,作为所述复制中父亲的所有所述个体仅从所述个体的第二子集中被选择。2.根据权利要求1所述的系统,其中所述数据处理器进一步被配置为使得作为所述复制中父亲的所有所述个体仅从少于所述个体的第二子集中所有所述个体的其他子集中被选择。3.根据权利要求1所述的系统,其中所述数据处理器进一步被配置为在从所述个体的第一子集中丢弃个体之前:在所述训练数据的先前子集上测试所述个体中的至少一个个体的先前子集中的每个个体;依赖于在所述训练数据的所述先前子集上的所述测试,计算所述个体的先前子集中每个所述个体的适应度估计;依赖于其适应度估计,从所述个体的先前子集中丢弃个体,以形成所述个体的第一子集。4.根据权利要求1所述的系统,其中所述训练数据的第一子集还包括至少一个不被包括在所述训练数据的第二子集中的数据。5.根据权利要求1所述的系统,其中所述池中的每个个体标识至少一个条件的相应集合以及依赖于所述条件的至少一个对应的提议输出。6.根据权利要求5所述的系统,其中所述训练数据库包含针对一个或多个金融资产的历史市场数据,其中每个个体指示依赖于所述训练数据库中所述市场数据而可分解的多个条件,由所述个体标识的所述输出包括针对一个或多个所述金融资产的交易指令,并且其中所述数据处理器进一步被配置为提供来自依赖于其更新的适应度估计而未被丢弃的个体的所述池中的个体,以在依赖于生产数据生成交易推荐中使用。7.根据权利要求1所述的系统,其中所述数据处理器进一步被配置为向服务器计算机系统传送在依赖于其更新的适应度估计从所述个体的第二子集中丢弃其他个体之后剩余的个体。8.根据权利要求7所述的系统,进一步包括所述服务器计算机系统,其中所述服务器计算机系统包括:服务器数据处理器;以及存储器,其对所述数据处理器可访问,所述服务器数据处理器被配置为向客户端计算机系统传送选定的接收的个体以用于进一步在所述训练数据上测试。9.根据权利要求8所述的系统,其中所述服务器数据处理器进一步被配置为依赖于其适应度估计丢弃选定的接收的个体。10.根据权利要求1所述的系统,其中依赖于其适应度估计从所述个体的第一子集对个体的所述丢弃进一步依赖于所述个体已经经历的测试的数量来操作。11.根据权利要求1所述的系统,其中所述数据处理器进一步被配置为:依赖于所述新的个体,形成至少一个个体的第三子集;在所述训练数据的第三子集上测试所述个体的第三子集中的每个个体;依赖于在所述训练数据的所述第三子集上的所述测试,计算所述个体的第三子集中每个所述个体的适应度估计;依赖于其适应度估计,从所述个体的第三子集中丢弃个体,以形成小于所述个体的第三子集的个体的第四子集;以及依赖于一个或多个个体,通过复制产生其他新的个体,作为所述复制中父亲的所有所述个体用于产生仅从所述个体的第四子集中被选择的所述其他新的个体。12.根据权利要求1所述的系统,其中所述数据处理器进一步被配置为:依赖于所述新的个体,形成至少一个个体的第三子集;在所述训练数据的第三子集上测试所述个体的第三子集中的每个个体;依赖于在所述训练数据的所述第三子集上的所述测试,计算所述个体的第三子集中每个所...

【专利技术属性】
技术研发人员:B·霍德雅特H·沙尔扎德
申请(专利权)人:思腾科技巴巴多斯有限公司
类型:发明
国别省市:巴巴多斯;BB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1