基于机器学习的择时入股方法及终端设备技术

技术编号:17468490 阅读:60 留言:0更新日期:2018-03-15 05:40
本发明专利技术适用于计算机技术领域,提供了基于机器学习的择时入股方法及终端设备,其中,该方法包括:将各支股票的预设指标数据输入预设的选股模型,输出股票组合;分别获取所述股票组合中各支股票的特征数据,所述股票的特征数据包括所述股票的股市交易数据或所述股票的技术指标数据;将所述股票组合中各支股票的特征数据输入至完成预训练的所述长短期记忆网络,输出关于所述股票组合中各支股票的价格预测结果。本发明专利技术的整个预测过程充分考虑了金融市场的行为特点,有效地减少了预测结果与股票后续的实际价格走势之间的偏差,用户可以更为合理地基于该价格预测结果进行选股及择时入股的投资行为,有效降低了用户的投资风险。

【技术实现步骤摘要】
基于机器学习的择时入股方法及终端设备
本专利技术属于计算机
,尤其涉及基于机器学习的择时入股方法及终端设备。
技术介绍
股票的价格都是实时波动的,在股票交易过程中,往往是基于人的主观决策或者是在股票价格下跌时来做出选股及购买行为,这样的选股行为并非是基于对股票后续价格走势的预测来做出的,因此可能存在较大的投资风险。为了构建并采取适当的投资组合策略,以实现一种较为稳健的理性投资方式,机器学习技术在证券投资领域的应用,尤其是在投资组合的选择与入市时机的确定方面的应用,已受到了研究人员的广泛关注,其基于对股票价格波动的预测来进行选股及择时入股,已被应用于股票购买行为的决策过程中。然而,上述技术仅仅是从机器学习的角度出发来进行选股及择时入股预测的,其预测过程并未充分考虑金融市场的行为特点,导致预测结果与股票后续的实际价格走势存在较大偏差。
技术实现思路
有鉴于此,本专利技术实施例提供了基于机器学习的择时入股方法及终端设备,以解决现有的基于机器学习的预测模型的计算过程并未充分考虑金融市场的行为特点,导致选股及择时入股的预测结果与股票后续的实际价格走势存在较大偏差的问题。本专利技术实施例的第一方面提供了一种基于机器学习的择时入股方法,包括:将各支股票的预设指标数据输入预设的选股模型,输出股票组合;分别获取所述股票组合中各支股票的特征数据,所述股票的特征数据包括所述股票的股市交易数据或所述股票的技术指标数据;对长短期记忆网络进行预训练,并将所述股票组合中各支股票的特征数据输入至完成预训练的所述长短期记忆网络,输出关于所述股票组合中各支股票的价格预测结果,以使用户根据所述价格预测结果确定择时入股策略。本专利技术实施例的第二方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:将各支股票的预设指标数据输入预设的选股模型,输出股票组合;分别获取所述股票组合中各支股票的特征数据,所述股票的特征数据包括所述股票的股市交易数据或所述股票的技术指标数据;对长短期记忆网络进行预训练,并将所述股票组合中各支股票的特征数据输入至完成预训练的所述长短期记忆网络,输出关于所述股票组合中各支股票的价格预测结果,以使用户根据所述价格预测结果确定择时入股策略。本专利技术实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述处理器执行所述计算机程序时实现如本方明实施例的第一方面提供的方法的步骤。本专利技术实施例中,基于各支股票的预设指标数据来筛选出适宜投资的股票组合,再基于多种影响股份波动的数据源来提取出股票组合中各支股票的特征数据,以通过长短期记忆网络计算得到这些股票的价格预测结果,整个预测过程充分考虑了金融市场的行为特点,有效地减少了预测结果与股票后续的实际价格走势之间的偏差。由此一来,用户可以更为合理地基于该价格预测结果进行选股及择时入股的投资行为,有效降低了用户的投资风险。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的基于机器学习的择时入股方法的实现流程图;图2是本专利技术实施例提供的基于机器学习的择时入股方法S101的具体实现流程图;图3是本专利技术实施例提供的对股票相关的社交媒体数据的获取过程的示意图;图4是本专利技术实施例提供的对股票相关的新闻数据的获取过程的示意图;图5是本专利技术实施例提供的基于机器学习的择时入股方法S103的具体实现流程图;图6是本专利技术实施例提供的LSTM一个简易记忆细胞的运算图;图7是本专利技术实施例提供的基于机器学习的择时入股装置的结构框图;图8是本专利技术实施例提供的终端设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。图1示出了本专利技术实施例提供的基于机器学习的择时入股方法的实现流程,详述如下:S101:将各支股票的预设指标数据输入预设的选股模型,输出股票组合。在本专利技术实施例中,股票的预设指标数据可以为从上市公司三大财务报表中提取出的数据,包括但不限于估值指标、财务指标、规模指标、成长指标和技术指标等。其中,每类指标都是多个同类指标数据的集合。具体来讲,估值指标包括市盈率、市净率和市现率等;财务指标包括股东权益报酬率、资产报酬率和速动比率等;规模指标包括最小市值和收益市值比率等;成长指标包括总成资产同比增长、净资产增长率、营业利润同比增长和净资产同比增长等;技术指标包括60天的平均成交量、相对强弱指标和波动率等。需要说明的是,为了方便将预设指标数据输入选股模型中进行计算,在对预设指标数据抽取完成之后,需要对每类指标中的每维指标数值进行标准化处理。在本专利技术实施例中,可以采用标准化公式来进行标准化处理,其中,Z(Xt)是标准化后的指标数值,X为指标序列的均值,σ为指标序列的标准差。传统的多因子选股模型计算出每种因子贡献度,并据此,根据多因子综合评分,最终选出合适的选股因子;而本专利技术实施例中,采用机器学习的思路,将各类预设指标数据作为各个因子,选股模型的预测目标与既定时间段内的总收益相关。在此,将总收益划分为两类,且这两类总收益之间的收益差距较大。在上述预测目标的基础之上,计算出每种因子(即每类各类预设指标数据)的重要性,将重要性作为选股的依据。在本专利技术实施例中,可采用的机器学习算法包括逻辑回归、支持向量机和神经网络等。优选地,可以将支持向量机作为机器学习算法。由于采用的是机器学习算法,因此,选股模型不仅仅是简单地基于计量经济学与统计学的方法来计算出每种因子的贡献度,而是将各个因子看成是不同的预设指标数据,即上一步所提取的估值指标、财务指标、规模指标、成长指标和技术指标等,以选择适合投资的股票集合。图2对S101的一种具体实现方式进行详细阐述:S201:将预设年度全年收益排名在前M位的M支股票设置为第一类,将预设年度全年收益排名在后N位的N支股票设置为第二类,对初始的选股模型进行训练,以得到预设的选股模型。通常来说,用于进行选股模型训练的为已知收益的股票,例如,可以将当前年度的上一年度的股票的全年收益用于进行选股模型的训练。如上文所述,根据全年收益的高低,将股票分为两类,第一类的股票其全年收益排名在前M位,第二类的股票其全年收益排名在后N位,并通过合理设置M和N的取值,拉大第一类股票与第二类投票在全年收益上的差距,以便于训练出合适的选股模型。S202:基于决策树算法,选取对预设年度全年收益贡献度最大的P类预设指标数据。针对上文中提及的若干类预设指标,其每一类预设指标均由若干的同类指标数据构成,在此,通过决策树算法,从所有类别的预设指标中选取出对全年收益贡献度最大的若干类预本文档来自技高网...
基于机器学习的择时入股方法及终端设备

【技术保护点】
一种基于机器学习的择时入股方法,其特征在于,包括:将各支股票的预设指标数据输入预设的选股模型,输出股票组合;分别获取所述股票组合中各支股票的特征数据,所述股票的特征数据包括所述股票的股市交易数据或所述股票的技术指标数据;对长短期记忆网络进行预训练,并将所述股票组合中各支股票的特征数据输入至完成预训练的所述长短期记忆网络,输出关于所述股票组合中各支股票的价格预测结果,以使用户根据所述价格预测结果确定择时入股策略。

【技术特征摘要】
1.一种基于机器学习的择时入股方法,其特征在于,包括:将各支股票的预设指标数据输入预设的选股模型,输出股票组合;分别获取所述股票组合中各支股票的特征数据,所述股票的特征数据包括所述股票的股市交易数据或所述股票的技术指标数据;对长短期记忆网络进行预训练,并将所述股票组合中各支股票的特征数据输入至完成预训练的所述长短期记忆网络,输出关于所述股票组合中各支股票的价格预测结果,以使用户根据所述价格预测结果确定择时入股策略。2.如权利要求1所述的选股方法,其特征在于,所述特征数据还包括与所述股票相关的社交媒体数据,所述分别获取所述股票组合中各支股票的特征数据,包括:采集并存储网络社交平台上的用户生成内容;提取与检索关键词匹配的所述用户生成内容,所述检索关键词包括所述股票组合中各支股票的股票名称或者股票代码;对提取出的所述用户生成内容进行分析,分别得到所述股票组合中各支股票的所述社交媒体数据。3.如权利要求1所述的选股方法,其特征在于,所述特征数据还包括与所述股票相关的消息数据,所述分别获取所述股票组合中各支股票的特征数据,包括:采集新闻客户端或新闻网站上的新闻数据并存储;提取与检索关键词匹配的所述新闻数据,所述检索关键词包括所述股票组合中各支股票对应的上市公司相关的人名或公司名称;对提取出的所述新闻数据进行分析,得到所述股票组合中各支股票的消息数据。4.如权利要求1所述的选股方法,其特征在于,所述将各支股票的预设指标数据输入预设的选股模型,输出股票组合,包括:将预设年度全年收益排名在前M位的M支股票设置为第一类,将所述预设年度全年收益排名在后N位的N支股票设置为第二类,对初始的选股模型进行训练,以得到所述预设的选股模型;基于决策树算法,选取对所述预设年度全年收益贡献度最大的P类所述预设指标数据;将各支股票的P类所述预设指标数据分别输入所述预设的选股模型,计算各支股票在P类所述预设指标数据上的综合得分;将所述综合得分排在前Q位的股票输出为所述股票组合;其中,所述M、N、P和Q均为正整数。5.如权利要求1所述的选股方法,其特征在于,所述将所述股票组合中各支股票的特征数据输入至完成预训练的所述长短期记忆网络,输出关于所述股票组合中各支股票的价格预测结果,包括:将所述股票组合中各支股票的特征数据分...

【专利技术属性】
技术研发人员:王健宗黄章成吴天博肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1