一种基于网络分析和多模型融合的股市投资决策方法技术

技术编号:10316060 阅读:257 留言:0更新日期:2014-08-13 17:32
本发明专利技术公开了一种基于网络分析和多模型融合的股市投资决策方法,首先从网络中抓取基本面信息,在此基础上构建网络节点和网络连接,构建复杂社会网络模型;利用网络分析的方法选择投资组合,再把投资组合所涉及的数据输入到多模型融合框架中;所述的多模型融合框架包括多个子模型,每个子模型针对从网络中抓取的不同特征的技术面信息,分别进行不同特点的市场趋势预测,生成各自的预测值,再将预测值加权求和,得到综合的市场趋势预测值,根据该值生成相应的投资策略。本发明专利技术从多元性的角度综合考虑了一般研究中被忽略的投资组合风险因素,以及通过基本面的预选降维数据和技术面的特征选择方法保证了决策的实时性要求,以提供更加可靠的投资策略。

【技术实现步骤摘要】

本专利技术属于股市投资策略分析
,涉及。
技术介绍
金融市场是国家经济运行的核心,因此,证券投资策略问题一直是各国投资理论界与投资实务界最为关注的核心问题之一,证券投资策略反映了我们基于对金融市场规律和投资者心理的认识,是根据投资目标指定的指导投资行为的规则体系和行动计划方案。其中,技术分析和基本面分析方法是两种主要的投资分析方法。其中技术分析主要应用于具体投资操作的时间和空间判断上,基本面分析则主要应用于投资标的物的选择上,作为提高投资分析有效性和可靠性的重要手段。随着互联网技术的迅速发展,大量与金融市场相关的信息在互联网上传播,这些实时信息规模巨大、形式多样,其中隐含着重要的、与投资决策相关的信息。如何综合利用信息进行市场预测和分析是金融市场投资决策中的重要问题。近年来,有许多研究者对投资决策方法问题进行了一系列的研究。其中一个比较新的研究方向是分析文本信息与股票价格之间的关系。例如著名的亚利桑纳州立大学研发了 Arizona Financial Text系统,通过对财经新闻和有关股票价格的文章进行分析并预测;在最近的2009年,Schumaker的研究团队分析了通过财经新闻消息利用基于文本的系统进行预测的可行性,并给出了肯定的结论;Nizer的研究团队在2012年进一步地对识别哪些新闻对股市产生可见的影响进行了研究。研究结果都表明,采用自动分析方法指导的投资策略可以获得超额利润。但是注意到,这些基于文本分析的研究所提供的分析方法利用的信息有限,局限于金融新闻这样的有强情感倾向性的文本。事实上,在这些基于文本分析的决策方法中,又通常忽略了在技术分析中使用的数据信息(如股价和股指),这些预测和分析方法显然是使用不全面的信息的方法。另一方面,对传统的分析方法(即股价预测方法)的研究进行已久,并已有一系列比较成熟的研究成果。MIT金融专家罗耀宗说:“技术分析是一个从市场价格中撷取出有用资讯的有效方法。”美国联邦准备理事会和学术界里也有一些研究表示,支持技术分析的证据是存在着的。国内例如最近刘海玥(2011)、江龙(2012)、郑晓薇(2013)的研究团队分别从神经网络、灰色RBF网络和LSSVM方法对股价趋势变化规律进行建模和预测,也都取得了较理想的成果。但是,这些预测方法是基于历史数据的规律进行预测分析,属于技术分析的思想,其理论为效率市场假说所反驳,而且其利用的信息也有限。并且传统的研究只考虑预测准确率,而考虑到实际的股价频繁波动情况,准确率并不能直接对应实际投资收益,甚至高预测准确率也可能带来负收益的结果,此外,这样的投资组合可能带来较高的投资风险。同时,传统的股票价格趋势分析与预测方法并没有考虑数据的规模和时效性,因此使用的信息量十分有限,在大数据量下进行预测时训练耗时十分大,考虑到实际投资决策时的实时性要求,已经无法适应网络环境中、海量数据规模下的股票市场分析和预测要求。而且,现有的股票预测多忽略股票间的相关关系,认为股票直接的价格变化是相互独立的,在此基础上进行股价趋势变化的规律研究和分析,这种简化假设明显违背了我们对金融市场的一般认识,因为各股票所对应的上市公司之间是相互有联系的,会受到彼此的影响与作用。如前所述,技术分析主要应用于具体投资操作的时间和空间判断上,基本面分析则主要应用于投资标的物的选择上,作为提高投资分析有效性和可靠性的重要手段。
技术实现思路
本专利技术解决的问题在于提供,综合利用了基本面分析和技术面分析进行市场投资决策,能够有效的降低投资风险,提高投资收益。本专利技术是通过以下技术方案来实现:,包括以下操作:首先从网络中抓取基本面信息,在此基础上构建网络节点和网络连接,构建复杂社会网络模型;利用网络分析的方法选择投资组合,再把投资组合所涉及的数据输入到多模型融合框架中;所述的多模型融合框架包括多个子模型,每个子模型针对从网络中抓取的不同特征的技术面信息,分别进行不同特点的市场趋势预测,生成各自的预测值,再将预测值加权求和,得到综合的市场趋势预测值,根据该值生成相应的投资策略;向子模型提供信息的特征选择器、子模型涉及的参数、子模型的预测值的权重均通过单变量分布估计算法进行封装训练。所述的复杂社会网络模型的构建包括以下操作:1.1)网络节点向量空间模型中,从网络中抓取的基本面信息文本以二元特征向量模式的词袋表示,如下所示:Infi = (〈t” wn>, <t2, wi2>,...<tM, wiM>)其中M是特征的数量,wik是文本特征tk权值,通过tf*idf方法计算权值,对固定特征化简为 infi = (wn, wi2,...wiM);对利用数据挖掘的方法从网络中获得的基本面信息中的文本进行如下操作:I)过滤:滤掉信息中无用的部分;2)分词:将经过过滤的信息分割成多个词汇,将分词后的结果存入词汇库中,标识词汇的词性;3)对词汇库中的词汇进行进一步的停词处理,包括去除虚词并绑定否定词;获取基本面信息当中的文本特征后,进行其权值的计算,将基本面信息整理成向量空间模型,对于时变的信息,该向量空间模型则成为一时变向量:infi(t) = (Wil (t), wi2(t),...wiM(t)),其中 t 为时间变量;1.2)网络连接对网络G(t) = (V(t),E(t)),用上市公司的基本面信息对其作为网络节点建模,即有 V(t) = {infi (t)},E(t) = {(i, j, edgij(t)) | i, j e V (t)};V(t)为利用基本面信息所构建的网络节点的集合,E(t)为网络节点当中的两个节点1、j以及它们之间的连接强度edgijU)的集合;使用余弦相似度本文档来自技高网
...

【技术保护点】
一种基于网络分析和多模型融合的股市投资决策方法,其他在在于,包括以下操作:首先从网络中抓取基本面信息,在此基础上构建网络节点和网络连接,构建复杂社会网络模型;利用网络分析的方法选择投资组合,再把投资组合所涉及的数据输入到多模型融合框架中;所述的多模型融合框架包括多个子模型,每个子模型针对从网络中抓取的不同特征的技术面信息,分别进行不同特点的市场趋势预测,生成各自的预测值,再将预测值加权求和,得到综合的市场趋势预测值,根据该值生成相应的投资策略;向子模型提供信息的特征选择器、子模型涉及的参数、子模型的预测值的权重均通过单变量分布估计算法进行封装训练。

【技术特征摘要】
1.一种基于网络分析和多模型融合的股市投资决策方法,其他在在于,包括以下操作: 首先从网络中抓取基本面信息,在此基础上构建网络节点和网络连接,构建复杂社会网络模型;利用网络分析的方法选择投资组合,再把投资组合所涉及的数据输入到多模型融合框架中; 所述的多模型融合框架包括多个子模型,每个子模型针对从网络中抓取的不同特征的技术面信息,分别进行不同特点的市场趋势预测,生成各自的预测值,再将预测值加权求和,得到综合的市场趋势预测值,根据该值生成相应的投资策略; 向子模型提供信息的特征选择器、子模型涉及的参数、子模型的预测值的权重均通过单变量分布估计算法进行封装训练。2.权利要求1所述的基于网络分析和多模型融合的股市投资决策方法,其特征在于,所述的复杂社 会网络模型的构建包括以下操作: `1.D网络节点 向量空间模型中,从网络中抓取的基本面信息文本以二元特征向量模式的词袋表示,如下所示:infi 一(〈t” Wn〉,〈t2,Wi2〉,...〈tj(,WiM〉) 其中M是特征的数量,Wik是文本特征tk权值,通过tf*idf方法计算权值,对固定特征化简为 Infi = (wn, wi2,...wiM); 对利用数据挖掘的方法从网络中获得的基本面信息中的文本进行如下操作: ` 1)过滤:滤掉信息中无用的部分; `2)分词:将经过过滤的信息分割成多个词汇,将分词后的结果存入词汇库中,标识词汇的词性; `3)对词汇库中的词汇进行进一步的停词处理,包括去除虚词并绑定否定词; 获取基本面信息当中的文本特征后,进行其权值的计算,将基本面信息整理成向量空间模型,对于时变的信息,该向量空间模型则成为一时变向量:Infi (t) = (wn (t), wi2(t),...wiM(t)),其中 t 为时间变量; `1.2)网络连接 对网络G(t) = (V(t),E(t)),用上市公司的基本面信息对其作为网络节点建模,即有V (t) = Unfi ⑴},E (t) = {(i, j, edg^.(t)) | i, j e V (t)}; V(t)为利用基本面信息所构建的网络节点的集合,E(t)为网络节点当中的两个节点`1、j以及它们之间的连接强度edgijU)的集合; Σ wJOwjM 使用余弦相似度Cosimfi(I),infβ)) ==.....................................-计算网络连 \ ln^接强度,其中Tm为基本面信息文本特征的全集,并使用阈值Θ进行过滤,即有 _ J O ,Cos(MfXt)Jnf ^t)) <θ。“kn/f、^cm(inft(t)Jnf^t)) ,cosihif^tXinf^t)) > Θ * θ 取 cos45 ,以如infjt) = (wn(t), wi2(t),...wiM(t))所示的向量空间模型描述网络节点,构建成所需要的网络节点;再将网络节点按照如 V(t) = {infi (t)},E(t) = {(i, j, edgij(t)) | i, j e V (t)}所示的网络连接方式连接,从而复杂社会网络模型,该模型是一个动态的网络模型。3.权利要求1所述的基于网络分析和多模型融合的股市投资决策方法,其特征在于,所述利用网络分析方法选择投资组合是选择最相互无关的股票组成投资组合,包括以下基于社团检测聚类的多元性划分方法: 使用社团检测方法进行划分,使用Girvan-Newman聚类方法进行网络聚类,其评价指标为模块度 4.权利要求1所述的基于网络分析和多模型融合的股市投资决策方法,其特征在于,所述利用网络分析方法选择投资组合是选择最相互无关的股票组成投资组合,包括以下基于最大全连通无关子网的多元性分割方法: 采用Bron - Kerbosch算法提取补网中的最大全连接子网,其基础形式是一个递归回溯的搜索算法,流程如下: Bron-Kerbosch 算法: Stepl:给定三个集合(R,P,X),初始化集合R,X分别为空,而集合P为所有网络节点的集合; Step2:若集合P,X分别为空,则输出R为最大团; Step3:对于每一个从集合P中取得得网络节点{v},有如下处理: 1)将网络节点M加到集合R中,集合P,X与网络节点M得邻接网络节点集合N{v}相交,之后递归集合R,P,X (转St印2); 2)从集合P中删除网络节点Ιν},并将网络节点M添加到集合X中; 此时基本面分析选择投资组合的策略模型表示为:/F鄭)= {JWT(G(if))h即按照...

【专利技术属性】
技术研发人员:彭勤科钟韬关新宇王晓秦小雨朱志博孙智
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1