【技术实现步骤摘要】
分案申请说明本申请是申请日为2010年4月28日、申请号为201080018807.8、专利技术名称为“用于资产管理和交易的分布式进化算法”的中国专利技术专利申请的分案申请。相关申请交叉引用本申请基于35USC 119(e)要求2009年4月28日提交的名称为“Distributed Evolutionary Algorithm for Stock Trading”的美国临时申请号61/173580的权益,在此通过引用将其内容全文并入。
技术介绍
复杂的金融趋势和模式分析处理通常利用超级计算机、大型机或功能强大的工作站和PC完成,它们通常位于公司的防火墙内,并且由该公司的信息技术(IT)组拥有和操作。在这种硬件和运行该硬件的软件方面的投资是巨大的。维护(修复、调整、打补丁)和操作(电气,安全数据中心)这种基础架构的成本同样巨大。股票价格的波动通常是不可预测的,但是偶尔呈现出可预测模式。基因算法(GA)被公知为已经在股票分类中使用。根据一种理论,在任何给定时间,5%的股票遵循一种趋势。基因算法因此有时被使用来将股票分类为遵循或不遵循趋势,并且取得一些成功。作为基因算法的超集的进化算法在穿越混沌搜索空间时是良好的。如同Koza,J.R 1992年在MIT会议上发表的“Genetic Programming:On the Programming of Computers by Means of Natural Selection”中已经示出,进化算法可以被使用来在断言注释时进化完整的程序。进化算法的基本元素是环境、基因模型、适应性函数(fitness function ...
【技术保护点】
一种计算机实现的数据挖掘系统,包括:数据处理器;以及存储器,其对所述数据处理器可访问并且标识具有个体的池的候选数据库,所述个体中的每个个体进一步与相应适应度估计的指示相关联,为了与对所述数据处理器可访问并且标识训练数据的数据挖掘训练数据库一起使用,所述数据处理器被配置为:在所述训练数据的第一子集上测试所述个体中的至少一个个体的第一子集中的每个个体;依赖于在所述训练数据的第一子集上的所述测试,计算所述个体的第一子集中每个所述个体的适应度估计;依赖于其适应度估计,从所述个体的第一子集中丢弃个体,以形成小于所述个体的第一子集的个体的第二子集;在所述训练数据的第二子集上测试所述个体的第二子集中的每个个体,所述训练数据的第二子集包括至少一个不被包括在所述训练数据的第一子集中的数据;依赖于在所述训练数据的所述第二子集上的所述测试,更新在所述训练数据的第二子集上测试的每个个体的所述适应度估计;依赖于其更新的适应度估计,从所述个体的第二子集中丢弃其他个体;以及依赖于一个或多个个体,通过复制产生新的个体,作为所述复制中父亲的所有所述个体仅从所述个体的第二子集中被选择。
【技术特征摘要】
2009.04.28 US 61/173,5801.一种计算机实现的数据挖掘系统,包括:数据处理器;以及存储器,其对所述数据处理器可访问并且标识具有个体的池的候选数据库,所述个体中的每个个体进一步与相应适应度估计的指示相关联,为了与对所述数据处理器可访问并且标识训练数据的数据挖掘训练数据库一起使用,所述数据处理器被配置为:在所述训练数据的第一子集上测试所述个体中的至少一个个体的第一子集中的每个个体;依赖于在所述训练数据的第一子集上的所述测试,计算所述个体的第一子集中每个所述个体的适应度估计;依赖于其适应度估计,从所述个体的第一子集中丢弃个体,以形成小于所述个体的第一子集的个体的第二子集;在所述训练数据的第二子集上测试所述个体的第二子集中的每个个体,所述训练数据的第二子集包括至少一个不被包括在所述训练数据的第一子集中的数据;依赖于在所述训练数据的所述第二子集上的所述测试,更新在所述训练数据的第二子集上测试的每个个体的所述适应度估计;依赖于其更新的适应度估计,从所述个体的第二子集中丢弃其他个体;以及依赖于一个或多个个体,通过复制产生新的个体,作为所述复制中父亲的所有所述个体仅从所述个体的第二子集中被选择。2.根据权利要求1所述的系统,其中所述数据处理器进一步被配置为使得作为所述复制中父亲的所有所述个体仅从少于所述个体的第二子集中所有所述个体的其他子集中被选择。3.根据权利要求1所述的系统,其中所述数据处理器进一步被配置为在从所述个体的第一子集中丢弃个体之前:在所述训练数据的先前子集上测试所述个体中的至少一个个体的先前子集中的每个个体;依赖于在所述训练数据的所述先前子集上的所述测试,计算所述个体的先前子集中每个所述个体的适应度估计;依赖于其适应度估计,从所述个体的先前子集中丢弃个体,以形成所述个体的第一子集。4.根据权利要求1所述的系统,其中所述训练数据的第一子集还包括至少一个不被包括在所述训练数据的第二子集中的数据。5.根据权利要求1所述的系统,其中所述池中的每个个体标识至少一个条件的相应集合以及依赖于所述条件的至少一个对应的提议输出。6.根据权利要求5所述的系统,其中所述训练数据库包含针对一个或多个金融资产的历史市场数据,其中每个个体指示依赖于所述训练数据库中所述市场数据而可分解的多个条件,由所述个体标识的所述输出包括针对一个或多个所述金融资产的交易指令,并且其中所述数据处理器进一步被配置为提供来自依赖于其更新的适应度估计而未被丢弃的个体的所述池中的个体,以在依赖于生产数据生成交易推荐中使用。7.根据权利要求1所述的系统,其中所述数据处理器进一步被配置为向服务器计算机系统传送在依赖于其更新的适应度估计从所述个体的第二子集中丢弃其他个体之后剩余的个体。8.根据权利要求7所述的系统,进一步包括所述服务器计算机系统,其中所述服务器计算机系统包括:服务器数据处理器;以及存储器,其对所述数据处理器可访问,所述服务器数据处理器被配置为向客户端计算机系统传送选定的接收的个体以用于进一步在所述训练数据上测试。9.根据权利要求8所述的系统,其中所述服务器数据处理器进一步被配置为依赖于其适应度估计丢弃选定的接收的个体。10.根据权利要求1所述的系统,其中依赖于其适应度估计从所述个体的第一子集对个体的所述丢弃进一步依赖于所述个体已经经历的测试的数量来操作。11.根据权利要求1所述的系统,其中所述数据处理器进一步被配置为:依赖于所述新的个体,形成至少一个个体的第三子集;在所述训练数据的第三子集上测试所述个体的第三子集中的每个个体;依赖于在所述训练数据的所述第三子集上的所述测试,计算所述个体的第三子集中每个所述个体的适应度估计;依赖于其适应度估计,从所述个体的第三子集中丢弃个体,以形成小于所述个体的第三子集的个体的第四子集;以及依赖于一个或多个个体,通过复制产生其他新的个体,作为所述复制中父亲的所有所述个体用于产生仅从所述个体的第四子集中被选择的所述其他新的个体。12.根据权利要求1所述的系统,其中所述数据处理器进一步被配置为:依赖于所述新的个体,形成至少一个个体的第三子集;在所述训练数据的第三子集上测试所述个体的第三子集中的每个个体;依赖于在所述训练数据的所述第三子集上的所述测试,计算所述个体的第三子集中每个所...
【专利技术属性】
技术研发人员:B·霍德雅特,H·沙尔扎德,
申请(专利权)人:思腾科技巴巴多斯有限公司,
类型:发明
国别省市:巴巴多斯;BB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。