基于K线形态聚类的相似K线序列搜索系统及方法技术方案

技术编号:38395938 阅读:33 留言:0更新日期:2023-08-07 11:10
本发明专利技术提供一种基于K线形态聚类的相似K线序列搜索系统及方法,涉及数据评估技术领域。本发明专利技术通过对K线序列四个维度的完整数据进行定性和定量两个角度的研究,使得K线的形态特征与走势情况能被完整体现出来,用于后续步骤的相似度分析;提出相应的相似性度量与计算方法,提高搜索结果的正确性;通过聚类技术和优化搜索策略,提高搜索效率。提高搜索效率。提高搜索效率。

【技术实现步骤摘要】
基于K线形态聚类的相似K线序列搜索系统及方法


[0001]本专利技术涉及数据评估
,尤其涉及一种基于K线形态聚类的相似K线序列搜索系统及方法。

技术介绍

[0002]当前社会已经步入高速发展时代,在金融股票投资方面,随着上市公司数量的增加,所产生的可用于分析的金融数据以及相关信息的总量在持续增加。一些研究显示,股票的K线序列具有较为明显的相似性,即在不同股票中会不断地重复出现相似的K线序列,而多项研究工作均发现,K线数据的波动在历史上能找到相似情况用于预测。因此若能查询到相似的股票K线序列,将对投资行为具有一定的指导作用。在这个大前提下,应用计算机科学技术,对股票市场中所有的股票K线数据进行深入研究,实现快速搜索相似K线序列,成为了当下一种迫切而具有经济潜力的需求。
[0003]K线数据的定性分析是解读K线图图案的重要技术手段。大多数对于K线图图案的研究都集中在单个K线图或日间价格变动上,与此同时,大多数研究中使用的K线图模式都是经验丰富的投资者的总结,这种人为衍生的“模式趋势”相关性在复杂的金融市场中通常无效。人工总结出的图案类本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于K线形态聚类的相似K线序列搜索系统,其特征在于,包括离线定性聚类模块和在线定量搜索模块;所述离线定性聚类模块包括数据获取模块、数据表示模块和聚类存储模块:所述数据获取模块用于从互联网上获取所需K线数据并进行整理与清洗;所述数据表示模块用于对数据进行定性分析完成重新表示的过程,将数据表示为同时具备形态特征和数据特征的形式;所述聚类存储模块用于将数据表示模块表示完成的K线数据,按K

中心点聚类法得出相应的聚类结果,将处理完毕的K线数据划分为多个聚类簇;所述在线定量搜索模块包括K线分簇模块、相似计算模块和结果输出模块:所述K线分簇模块用于在用户输入待计算相似的K线数据后,对其进行聚类计算,以此得到输入K线数据的归属类簇;所述相似计算模块用于在得出的归属类簇中进行相应的相似度计算,并按设计好的优化搜索策略得出结果;所述结果输出模块用于输出最相似的K线片段或K线片段列表。2.一种基于K线形态聚类的相似K线序列搜索方法,基于权利要求1所述的一种基于K线形态聚类的相似K线序列搜索系统实现,其特征在于,包括以下步骤:步骤1:从互联网获取所需要的K线数据,并将其进行清洗,剔除空白数据和残损数据后,存入数据库或者内存中;步骤2:当完成K线数据的获取后,要对步骤1中获取的数据进行定性分析,从而完成重新表示的过程,以此将数据表示为同时具备形态特征和数据特征的形式;步骤3:基于步骤2得到的重新表示后的K线数据,按K

MEDOIDS聚类方法得出相应的聚类结果,将处理完毕的K线数据按照K

中心点聚类法进行聚类,得出多个聚类簇,并在此过程中,对生成的聚簇的不断进行检验,如果发现聚类不平衡或者聚簇中点的间距过大,则重新开始进行聚类,直到所有点都处于间距合理的平衡聚簇中;步骤4:接收用户端输入的待搜索相似的K线数据,基于步骤3得到的聚簇进行K

MEMODIDS聚类计算,获取用户输入数据的所属类簇;步骤5:根据步骤4得到的所属类簇,获取该类簇中的全部数据,一一与用户输出数据进行DTW相似度计算,按给定的优化搜索策略得出最相似的K线片段或K线片段列表,并将结果进行输出。3.根据权利要求2所述的一种基于K线形态聚类的相似K线序列搜索方法,其特征在于,所述步骤2具体包括以下步骤:步骤2.1:加载步骤1中清洗处理完毕的K线数据;步骤2.2:根据步骤2.1中所获得的K线数据四个维度之间的大小关系,用不同的字符代表不同的大小关系,以字...

【专利技术属性】
技术研发人员:张斌王建翔那俊王广普安萌袁昊
申请(专利权)人:沈阳麟龙科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1