基于逆金融收益率概率分布的权重优化Adaboost方法技术

技术编号:39002136 阅读:10 留言:0更新日期:2023-10-07 10:33
本发明专利技术公开了基于逆金融收益率概率分布的权重优化Adaboost方法,具体包括如下步骤:101)预处理步骤、102)分类步骤、103)更新权值训练步骤和104)预测步骤;本发明专利技术提供引入了“概率的概率”来刻画收益率分布尾部的动态性,以提高预测可能的极端事件的影响的基于逆金融收益率概率分布的权重优化Adaboost方法。融收益率概率分布的权重优化Adaboost方法。融收益率概率分布的权重优化Adaboost方法。

【技术实现步骤摘要】
基于逆金融收益率概率分布的权重优化Adaboost方法


[0001]本专利技术涉及机器学习分类算法领域,更具体的说,它涉及基于逆金融收益率概率分布的权重优化Adaboost方法用于分类问题。

技术介绍

[0002]集成学习的核心是构建多个不同的模型,并将这些聚合起来从而提高模型的性能。集成学习适用于机器学习的几乎所有领域,包括常用的回归和分类算法。在集成学习中,通常并不要求每个基学习器的性能特别好。在很多典型的集成学习算法中,只要求每个基学习器要好于随机猜测。甚至对于表现比较差的基分类器,可以将其反着用,比如一个分类器绝大多数情况下得到的结果是错误的,那么在其将一个样本归类为

1时,可以认为它所传达的信息是将样本归类为1。一般而言,基学习器也称为弱学习器(weak learner)。在集成学习中,重点是使训练得到的基学习器满足多样性的要求,这样将多个基学习器聚合起来时,能够有效地提升性能。从直观上看,虽然每个基学习器都会犯错,但是如果它们在犯不同的错误,那么将它们聚合起来之后犯错的可能性会很低。反之,如果基学习器比较相似,则通过集成学习提高性能的幅度较小,甚至可能带来过拟合的问题而导致性能降低。
[0003]根据基学习器的生成策略,如何进一步在逆金融收益概率分布中的优化分类器,减少收益概率中“正态分布”产生的严重低估的真实收益率分布的“尖峰厚尾”特征。更多地关心极端事件,比如金融危机、暴涨暴跌等,将更加富有意义的低概率事件加大其优化权重的可能,从而使得模型在预测对发生金融极端事件的准确率和敏感性上得到提高,成为一个重要的课题。

技术实现思路

[0004]本专利技术克服了现有技术的不足,提供引入了“概率的概率”来刻画收益率分布的动态性,以提高预测可能的极端事件的影响的基于逆金融收益率概率分布的权重优化Adaboost方法。
[0005]本专利技术的技术方案如下:
[0006]基于逆金融收益率概率分布的权重优化Adaboost方法,包括显示终端、云服务器和输入设备,显示终端、输入设备和云服务器联通,具体包括如下步骤:
[0007]101)预处理步骤:云服务器将通过输入设备采集的逆金融收益概率分布的数据中每个样本的初始抽样概率定为
[0008]102)分类步骤:将样本集通过金融领域中的基分类器进行分类,并调整被基分类器分错的单个样本的抽样概率权值;即将不确定性大的收益概率分布中的尾部数据,进行抽样概率权值调整,以调高收益概率分布中尾部的低概率区间事件发生的数据的权值;
[0009]其中,由于数据源有n种取值:s1,s2,s3,.....s
n
,对应的概率则为:p1,p2,p3,.....p
n
,这时,数据源的平均不确定性应当为单个数据不确定性的统计平均值,即为信息
熵,由信息熵调整收益概率分布中的尾部数据的抽样概率权值;具体信息熵的公式如下:
[0010]103)更新权值训练步骤:将抽样概率权值更新后的新样本集,由下一个新的基分类器进行分类,直到一个新的基分类器分类时能达到针对极端数据样本分类的预定错误率或达到了指定的最大迭代次数,才停止对样本的抽样概率权值更新;
[0011]104)预测步骤:将步骤103)更新权值后的收益概率分布数据,进行模型预测收益概率分布中尾部数据情况的发生(指暴涨和暴跌的情况),并将结果由云服务器传输到显示终端。
[0012]进一步的,步骤102)中对基分类器获取加权错误率,并结合加权错误率赋予每个基分类器的新权值,加权错误率公式如下:
[0013][0014]其中,h
j
(x
i
)为基分类器,ω
j
为基分类器的权值;I(.)是示性函数,其取值是0或1,当分类器的预测结果h
j
(x
i
)与真实的标签取值y
i
不相等时,I(.)取值为1,反之为0;
[0015]基分类器的权值公式如下:
[0016][0017]进一步的,对于收益概率分布中尾部数据结合信息熵,提高尾部数据被抽中的概率。
[0018]本专利技术的优点在于:
[0019]本专利技术通过改进收益率的分布假设,引入“概率的概率”来刻画收益率分布的动态性,提高整个数据中其分布尾部的低概率区的权值,更好的关注在此区事件发生的情况,即更多地关心极端事件,比如金融危机,暴涨暴跌等,将更加富有意义的低概率事件加入到预测的权重中,提高权重比例,从而使得模型在针对极端事件发生的预测上,有更好的准确率和敏感性,能够有效地预测可能出现的暴涨暴跌情况。
附图说明
[0020]图1为本专利技术的数据来源案例图;
[0021]图2为现有技术预测结果的输出数据图;
[0022]图3为调用基于逆金融收益率概率分布的权重优化法的Adaboost算法的代码;
[0023]图4为本专利技术的预测结果的输出数据图。
具体实施方式
[0024]下面结合具体实施方式对本专利技术进一步说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术,本方案中未做详细说明的部分均可采用常规技术手段进行实现。
[0025]一种基于逆金融收益率概率分布的权重优化Adaboost方法,包括显示终端、云服务器和输入设备,显示终端、输入设备和云服务器联通,具体包括如下步骤:
[0026]101)预处理步骤:云服务器将通过输入设备采集的逆金融收益概率分布的数据中每个样本的初始抽样概率定为
[0027]102)分类步骤:将样本集通过金融领域中的基分类器进行分类,并调整被基分类器分错的单个样本的抽样概率权值;即将不确定性大的收益概率分布中的尾部数据,进行抽样概率权值调整,以调高收益概率分布中尾部的低概率区间事件发生的数据的权值;
[0028]其中,基分类器获取加权错误率,并结合加权错误率赋予每个样本数据的新权值,加权错误率公式如下:
[0029][0030]其中,h
j
(x
i
)为基分类器,ω
j
为基分类器的权值;I(.)是示性函数,其取值是0或1,当分类器的预测结果h
j
(x
i
)与真实的标签取值y
i
不相等时,I(.)取值为1,反之为0;
[0031]基分类器的权值更新公式如下:
[0032][0033]作为优选,基分类器还包括分歧度,其用来描述多个基分类器对同一个样本分类的一致性程度,若所有基分类器对样本的分类一致,则分歧度小,若各分类器对样本的判断不一,则分歧度大;以此通过调整基分类器本身,来调整最终的结果。具体的分歧度计算如下:
[0034][0035]其中,dif
ij
是在前j个分类器下,第i个样本的分歧度,是与ERR
ij
的标准差,准差,是第i个样本在前j个分类器中被分错的次数,ERR<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于逆金融收益率概率分布的权重优化Adaboost方法,其特征在于,包括显示终端、云服务器和输入设备,显示终端、输入设备和云服务器联通,具体包括如下步骤:101)预处理步骤:云服务器将通过输入设备采集的逆金融收益概率分布的数据中每个样本的初始抽样概率定为102)分类步骤:将步骤101)处理后的样本集通过金融领域中的基分类器进行分类,并调整被基分类器分错的单个样本的抽样概率权值;即将不确定性大的收益概率分布中的尾部数据,进行抽样概率权值调整,以调高收益概率分布中尾部的低概率区间事件发生的数据的权值;其中,由于数据源有n种取值:s1,s2,s3,
……
s
n
,对应的概率则为:p1,p2,p3,
……
p
n
;这时,数据源的平均不确定性为单个数据不确定性的统计平均值,定义为信息熵,由信息熵调整收益概率分布中的尾部数据的抽样概率权值;具体信息熵的公式如下:103)更新权值训练步骤:将抽样概率权值更新后的新样本集,由下一个新的基分类器进行分类,直到一个新的...

【专利技术属性】
技术研发人员:李一邨滕远阳
申请(专利权)人:杭州伊园科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1