一种基于分布式图数据库的金融图像数据搜索方法及系统技术方案

技术编号:34412248 阅读:60 留言:0更新日期:2022-08-03 22:05
一种基于分布式图数据库的金融图像数据搜索方法,包括步骤:构建图数据库,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,构建表示图Q、图E;计算图Q与图E的相似度,根据相似度s(Q,E),选择显示最接近的K个历史金融图像数据。本发明专利技术的方法及系统显著了提高使用便捷性,在准确率方面大大增强,增强用户体验。增强用户体验。增强用户体验。

【技术实现步骤摘要】
一种基于分布式图数据库的金融图像数据搜索方法及系统


[0001]本专利技术涉及图像数据处理领域,具体地涉及一种基于基于分布式图数据库的金融图像数据搜索方法及系统。

技术介绍

[0002]随着图像处理技术以及股票金融债券市场的快速发展,金融图像数据处理相关技术迅猛发展,用图对复杂数据进行建模的应用渐渐兴起,图被广泛应用在生物领域、化学领域、社会科学领域,一般用无向图对结构化的数据建模成图数据,用图数据库管理及查询图数据,但是较少用于基于内容的图片检索和视频检索领域,尤其是对金融数据处理领域。
[0003]且在现有技术中,金融领域股票债券市场大部分的系统仅支持根据时间段、关键词进行金融信息的搜索,例如根据某个时间段的股票变化,选择时间段然后生成趋势图、K线图然后进行人工分析判断,或输入关键词,例如行业,股票名称、股票代码进行搜索对应股票的趋势图、K线图。但是随着各类智能系统的普及,人们不仅仅满足于这种单一功能的金融搜索系统,人们希望金融搜索系统能够实现更多智能化的搜索,提高用户体验。
[0004]例如,根据股票历史变化趋势预测未来变化趋势是非常重要的股票判断方法,但是目前只能选取某个时间段的人为观看,如果想找与最近一个月股票的变化趋势相似的历史上的股票变化趋势,根据历史上的变化趋势预测下一个月的股票走势,需要人工一个时间段一个时间段的筛选对比,导致智能化程度、准确度大大降低。
[0005]虽然存在股票趋势预测等应用,只是简单的数据处理或图像处理,智能化程度较低,预测不准确导致股票操作失误度大大增加,且对股票数据的加工不能够很好的呈现结果,且图像处理过程中没有对数据进行选择导致对所有数据处理导致数据传输速率较慢,且不能够实现与大量无效数据的筛选;且现有技术中还没有将图数据库应用在金融图像数据处理过程中,且搜索方式方式单一。如何能够让股票搜索预测更加智能化,人性化,提高其运行效率及准确度,增强用户实用性成为新的研究课题,但是现有股票分析效率较低;且主要是针对特定数据的单独的处理,因此,一种基于分布式图数据库的金融图像数据搜索方法及系统技术成为了改进搜索效果的迫切需求,从而改善用户的体验。

技术实现思路

[0006]为解决上述技术问题,本专利技术提供一种基于基于分布式图数据库的金融图像数据搜索方法及系统,本专利技术的种基于基于分布式图数据库的金融图像数据搜索方法及系统显著降低了人工分析股票进行图像对比的复杂度,提升了数据准确度以及传输效率,在准确率方面大大增强,增强用户体验;一种基于分布式图数据库的金融图像数据搜索方法,包括步骤:构建图数据库,所述图数据库用于存储历史金融图像数据集,所述历史金融图像数据集包括行情信息趋势图、K线图;输入待搜索的金融图像数据,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数
据特征值;对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,所述金融图像数据特征值包括成交量、成交额、振幅、委比、最高值、最低值、趋势图均值、趋势图方差、K线图的像素均值、K线图的像素偏移度、K线图的像素直度、K线图的像素方差、K线图的像素饱和度、K线图的像素log值,即对不同时间段的金融数据图像进行特征值计算;对提取的金融图像的特征值分别进行频数统计,取频数最高的N个金融图像特征值构建表示图Q;提取输入待搜索的金融图像数据的特征值,取频数最高的N个金融图像特征值构建表示图E;计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度:其中θ为调节值,根据相似度s(Q,E),选择显示与输入待搜索的金融图像数据最接近的K个历史金融图像数据。
[0007]优选地,所述行情信息趋势图包括上证、深证、创业板、科创板、新三板、恒生指数、全球指数趋势图;全球指数趋势图包括纳斯达克、标普500、道琼斯工业、英国富时、欧洲50、德意志、日经225趋势图,上证包括工商银行、中国银行、中国中车趋势图;深证包括金风科技、海格通信;创业板包括东方财富、宝色股份。但不限于以上股票,正常情况下是数据库中所有的股票。
[0008]优选地,所述对提取的特征值分别进行频数统计,包括对M个时间段中金融图像数据偏移度为A的出现次数进行统计,当出现次数大于设定阈值且频数位于前N名时,则将特征值偏移度纳入构建图Q。
[0009]优选地,所述金融图像数据特征值还包括K线图的直方图以及K线图的R、G、B通道值。
[0010]优选地,金融图像数据K线图的直方图为:l=1,2,

L

1M为象素总数,N(l)为灰度值为l 的象素数,l=1,2,

L

1 为图像的灰度;金融图像数据K线图的像素均值:金融图像数据K线图的像素方差:金融图像数据K线图的像素偏移度:
金融图像数据K线图的像素直度:金融图像数据K线图的像素饱和度:金融图像数据K线图的log值:。
[0011]本专利技术还包括一种基于分布式图数据库的金融图像数据搜索系统,包括:构建图数据库模块,所述图数据库用于存储历史金融图像数据集,所述历史金融图像数据集包括行情信息趋势图、K线图;输入模块:用于输入待搜索的金融图像数据,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;层次树构建模块:对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,所述金融图像数据特征值包括成交量、成交额、振幅、委比、最高值、最低值、趋势图均值、趋势图方差、K线图的像素均值、K线图的像素偏移度、K线图的像素直度、K线图的像素方差、K线图的像素饱和度、K线图的像素log值,即对不同时间段的金融数据图像进行特征值计算;频数统计模块:对提取的金融图像的特征值分别进行频数统计,取频数最高的N个金融图像特征值构建表示图Q;提取输入待搜索的金融图像数据的特征值,取频数最高的N个金融图像特征值构建表示图E;相似度计算模块:计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度:其中θ为调节值;显示模块;根据相似度s(Q,E),选择显示与输入待搜索的金融图像数据最接近的K个历史金融图像数据。
[0012]优选地,所述行情信息趋势图包括上证、深证、创业板、科创板、新三板、恒生指数、全球指数趋势图;全球指数趋势图包括纳斯达克、标普500、道琼斯工业、英国富时、欧洲50、德意志、日经225趋势图,上证包括工商银行、中国银行、中国中车趋势图;深证包括金风科技、海格通信;创业板包括东方财富、宝色股份。但不限于以上股票,正常情况下是数据库中所有的股票。
[0013]优选地,所述对提取的特征值分别进行频数统计,包括对M个时间段中金融图像数据偏移度为A的出现次数进行统计,当出现次数大于设定阈值且频数位于前N名时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分布式图数据库的金融图像数据搜索方法,其特征在于,包括步骤:构建图数据库,所述图数据库用于存储历史金融图像数据集,所述历史金融图像数据集包括行情信息趋势图、K线图;输入待搜索的金融图像数据,将历史金融图像数据集以及待搜索的金融图像数据表示成一个以时间段为顶点的有向图,图的每一条有向边表示两端顶点对应的金融图像数据特征值;对历史金融图像数据集分块构建层次树,自底向上遍历层次树,计算每个节点的特征值,所述金融图像数据特征值包括成交量、成交额、振幅、委比、最高值、最低值、趋势图均值、趋势图方差、K线图的像素均值、K线图的像素偏移度、K线图的像素直度、K线图的像素方差、K线图的像素饱和度、K线图的像素log值,即对不同时间段的金融数据图像进行特征值计算;对提取的金融图像的特征值分别进行频数统计,取频数最高的N个金融图像特征值构建表示图Q;提取输入待搜索的金融图像数据的特征值,取频数最高的N个金融图像特征值构建表示图E;计算由金融图像特征值构成的图Q与待搜索的金融图像特征值构成的图g的最大公共子图mcs(Q,E),计算图Q与图E的相似度:其中θ为调节值,根据相似度s(Q,E),选择显示与输入待搜索的金融图像数据最接近的K个历史金融图像数据。2.根据权利要求1所述的一种基于分布式图数据库的金融图像数据搜索方法,其特征在于,所述行情信息趋势图包括上证、深证、创业板、科创板、新三板、恒生指数、全球指数趋势图;全球指数趋势图包括纳斯达克、标普500、道琼斯工业、英国富时、欧洲50、德意志、日经225趋势图,上证包括工商银行、中国银行、中国中车趋势图;深证包括金风科技、海格通信;创业板包括东方财富、宝色股份。3.根据权利要求1所述的一种基于分布式图数据库的金融图像数据搜索方法,其特征在于,所述对提取的特征值分别进行频数统计,包括对M个时间段中金融图像数据偏移度为A的出现次数进行统计,当出现次数大于设定阈值且频数位于前N名时,则将特征值偏移度纳入构建图Q。4.根据权利要求1所述的一种基于分布式图数据库的金融图像数据搜索方法,其特征在于,所述金融图像数据特征值还包括K线图的直方图以及K线图的R、G、B通道值。5.根据权利要求4所述的一种基于分布式图数据库的金融图像数据搜索方法,其特征在于,金融图像数据K线图的直方图为:l=1,2,

L

1M为象素总数,N(l)为灰度值为l 的象素数,l=1,2,

L

1 为图像的灰度;金融图像数据K线图的像素均值:
金融图像数据K线图的像素方差:金融图像数据K线图的像素偏移度:金融图像数据K线图的像素直度:金融图像数据K线图的像素饱和度:金融图像数据K线图的log值:。6.一种基于分布式图数据库的金融图像数据搜索系统,...

【专利技术属性】
技术研发人员:孙勇
申请(专利权)人:深圳市拓保软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1