【技术实现步骤摘要】
一种基于超图的股票历史信息分析排序系统及方法
[0001]本专利技术属于分析系统领域,特别涉及基于一种超图的股票历史信息分析排序系统及方法。
技术介绍
[0002]量化交易是指通过先进数学模型替代人为的主观判断,并利用计算机技术在大量的历史数据中找出带来超额收益的多种大概率时间,进而制定相应策略。作为量化交易重要分支,股票历史数据分析工作在量化交易中有着很高的地位,而股票分析工作又可细化为很多工作,例如股票价格和趋势预测、风险分析以及收益预测等等。而本专利技术将进行对股票历史信息的分析,最终给出股票推荐,即投资组合问题。
[0003]股票投资组合问题一致备受人们关注,虽然解决方法层出不穷,但是由于股票数据的多变性,该问题依旧是一个具有挑战性的任务,目前解决该问题的方法主要分为三类:统计学方法、传统机器学习方法以及深度学习方法,相较于其他两种方法,深度学习方法有着适应性强、准确率较高、捕获特征能力较强以及人为干预少等优点,因此专利技术采用深度学习方法开展研究工作。
[0004]深度学习作为机器学习领域中一个新研究方向,使得机器学习更加接近于最初实现人工智能这一目标。其概念源于人工神经网络,模仿人脑机制来解释数据,它通过组合底层特征形成高层表示属性类别或特征。现如今,随着深度学习的崛起,深度学习也被广泛应用于各个领域,如搜索技术、数据挖掘、自然语言处理、图像识别等等。其效果也往往要超过先前相关技术,也可以用来解决很多以往传统技术无法解决的问题,深度学习随着解决问题的增多也在不断地发展,如今的深度学习技术类 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于超图的股票历史信息分析排序系统,其特征在于,由数据预处理部分、模型构建部分、分析和反馈部分组成;所述数据预处理部分用于公开股票数据的特征提取以及超图的构建;该模块对输入的时序股票特征进行编码,具体包括股票每天的开盘价、闭盘价、交易量、最高价和最低价,对原始股票数据进行特征提取并将数据的结构进行维度处理;所述模型构建部分用于模型的构建和模型的训练与分析;将数据预处理部分进行特征提取后股票数据通过训练好的模型处理为排序后的结果;所述分析和反馈部分根据模型构建部分的排序结果,调整超参数直到模型的评价指标符合预设的标准,在确定最终的模型后根据输入数据与关系超图获取最终的股票排序结果,对结果的分析包括金融领域的指标评价。2.根据权利要求1所述的一种基于超图的股票历史信息分析排序系统,其特征在于,所述超图的构建是根据从外部获取的预定义关系来构建系统后续处理的结构的超图。3.一种基于超图的股票历史信息分析排序方法,基于权利要求1所述的一种基于超图的股票历史信息分析排序系统实现,其特征在于,包括以下步骤:步骤1:获取所选股票的简称和对应的历史数据;步骤2:对步骤1中获取的股票历史数据进行数据预处理,根据股票简称对股票关系进行预定义扩充;步骤3:利用Infomer算法的encoder部分对完成数据预处理的历史数据进行特征提取;步骤4:使用步骤3特征提取后的数据进行隐藏概念挖掘,之后与预定义的股票关系构成完整的股票关系数据;步骤5:将步骤3特征提取后的数据X={x0,x1,
…
,x
k
}与步骤4构建的股票关系数据基于KL散度进行相似度判别,来筛选有价值的股票关系,具体公式如下:式中KL(
·
)为kl散度算法,计算每一个股票和与之相关的隐藏关系,如果二者kl散度小于0.5,则舍弃掉该条关系;步骤6:根据筛选后的股票关系构建股票关系超图;步骤7:构建超图卷积算法模型,将步骤3特征提取的结果输入到超图卷积算法模型之中;步骤8:通过损失函数对排名结果与真实股票的排序结果进行对比计算,根据损失函数的值与选择的优化器对模型参数进行反复优化,训练出最终的排序模型;步骤9:根据模型的输出结果,通过股票排名生成器生成排名,选择股票;输入的股票特征数据经过优化后的模型得到输出的排序得分对进行股票选择,以进行指标评价;选择中排名前topN个股票作为假定的客户根据模型结果做出的股票选择:其中sort(
·
)表示降序排序,[:N]表示取前N支股票作为模型本轮选择的用于性能分析的股票组合;步骤10:分析最终给出的股票排名是否符合实际情况,如果偏差值超过设定的标准,则
调整参数重新进行训练;至此完成了从原始的股票历史数据到分析出排名结果的整体方法。4.根据权利要求3所述的一种基于超图的股票历史信息分析排序方法,其特征在于,所述步骤2具体包括以下步骤:步骤2.1:股票数据缺失值的填补和去除;步骤2.2:对时间序列类型的股票原始数据进行消峰填谷优化;步骤2.3:进一步优化股票数据,对消峰填谷后的数据进行归一化处理,归一化算法公式为:式中x
i
为归一后的数据,为步骤2.2处理后的数据,∈为防止分母为零设置的极小值;步骤2.4:根据预选择的股票简称列表获取对应的股票关系,由于需要Wikidata获取股票关系,而Wikidata只能通过公司全称来自动获取对应的wikiq
‑
code,因此使用beautifulsoup逐个根据简称爬取GoogleFinance数据,获取简称对应的全称;步骤2.5:使用wikidataAPI中的SPARQL Query Service函数来逐个获取查询股票关系所用的q
‑
code;由于SPARQL Query Service只能使用精确查找,所以根据wikidata的命名规范,使用正则表达式匹配股票全称,以此获取尽可能多的有效预定义关系;步骤2.6:使用wikidataAPI中的Linked Data Interface函数来获取q
‑
code对应的p
‑
code;每个q
‑
code包含多个p
‑
code,每一个p
‑
code表示一种独立的关系;同时这些p
‑
code在一只股票中存在唯一的q
‑
code,表示股票x
i
在关系p
i
中存在属性q
i
;步骤2.7:最后遍历所有股票X;对于股票x
i
与x
j
,分别具有关系集P
i
和P
j
,此时:式中代表了股票x
i
在关系p
m
中对应的类别;对于具有相同的多只股票,且预定义的关系对集存在关系对(p
m
,p
n
),视为在关系对(p
m
,p
n
)中具有相关性,使用字典dict(x
i
)表示所有与股票x
i
相关其他股票,以及他们所属的关系,具体形式如下:dict(x
i
)={x
j
:[p
m
,p
n
],...,x
k
:[p
a
,p
b
]}。5.根据权利要求3所述的一种基于超图的股票历史信息分析排序方法,其特征在于,所述步骤3具体包括以下步骤:步骤3.1:输入股票特征数据集预设的权值矩阵W
Q
、W
K
、W
V
;步骤3.2:分别计算三个权值矩阵与X的乘积,得到对应的Query、Key、Value三个矩阵,公式如下:Q,K,V=X
×
W式中L
Q,K,V
与d是Query、Key、Value的矩阵维度;步骤3.3:计算queries的自注意力稀疏性,随机采样U个点积对进行计算:
U=L
K
InL
技术研发人员:张斌,闫宇宵,张长胜,刘礼铭,董兴俊,张宸,
申请(专利权)人:东北大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。