当前位置: 首页 > 专利查询>三峡大学专利>正文

一种基于粒子群优化增量支持向量机的内幕交易辨别方法技术

技术编号:22057649 阅读:25 留言:0更新日期:2019-09-07 16:06
一种基于粒子群优化增量支持向量机的内幕交易辨别方法,首先收集内幕交易相关的样本数据及其特征指标作为样本数据集;然后利用粒子群优化算法优化参数后的支持向量机对样本数据集进行学习和分类,并确定最优的分类面和分类向量,获得测试目标并收集测试目标数据集,根据最优分类面对测试目标的特征指标进行估计并分类,判断样本是否存在内幕交易。本发明专利技术建立了股票市场内幕交易行为自动识别模型,实现了对测试目标是否存在内幕交易进行准确识别;其中,采用粒子群优化算法对支持向量机进行优化,提高了支持向量机分类器的准确率;将违背原决策函数的KKT条件的样本和相应分类结果加入到原样本数据集形成新的样本数据集,实现模型的自动更新学习。

An Insider Trading Discrimination Method Based on Particle Swarm Optimization Incremental Support Vector Machine

【技术实现步骤摘要】
一种基于粒子群优化增量支持向量机的内幕交易辨别方法
本专利技术属于证券市场监管领域,具体涉及一种基于粒子群优化增量支持向量机的内幕交易辨别方法。
技术介绍
证券市场内幕交易行为违反了证券市场“公平、公正、公开”的三公原则,严重侵蚀中小投资者的利益,极大地阻碍了证券市场的健康发展。随着各国证券市场的不断发展,内幕交易主体构成的日益多元化、内幕交易行为手段的策略化与内幕交易形式的多样化、隐蔽化等特点,使得监管部门很难高效快速地进行侦查识别,以往现场突击审查与依靠知情人士举报的传统方法耗费大量的人力、物力、财力的同时往往得不到较好的监管效率。目前,对于内幕交易样本行为进行分类的应用模型主要有Logistic、随机森林、神经网络等辨别模型。其中,Logistic模型是基于经典统计学理论下的参数估计模型,是基于样本数趋近于无穷大时的一种渐进理论,在使用样本进行参数估计之前需要预知样本分布的具体形式;而神经网格学习方法虽然克服了传统参数估计方面的困难,但目前还缺乏统一的数学理论,且对于训练样本容易出现过拟合的状况;随机森林模型虽然可以快速处理具有多特征维度的样本分类,但其模型的精度较依赖于训练样本的数量,在样本数量较少的情况下辨别精度会大大降低。由于我国证券市场已公布内幕交易案例数量的局限性,针对小样本分类问题,支持向量机较具有优势。然而,支持向量机的惩罚因子C或核函数参数若人为选择不当,容易出现模型过度拟合或欠拟合的情况,进而会影响到支持向量机的分类精度,即内幕交易的辨别效果。
技术实现思路
本专利技术的目的是解决上述问题,提供一种基于粒子群优化增量支持向量机的内幕交易辨别方法,采用粒子群优化算法对支持向量机的参数进行优化,建立支持向量机模型作为分类器,对证券市场上市公司是否发生内幕交易予以准确识别。本专利技术的技术方案是一种基于粒子群优化增量支持向量机的内幕交易辨别方法,包括以下步骤:步骤1:收集内幕交易相关的样本、对应的非内幕交易样本及其特征指标作为样本数据集;步骤2:利用样本数据集对粒子群优化算法优化参数后的支持向量机对进行训练;步骤3:确定最优的分类面和分类向量;步骤4:获得测试目标并收集测试目标数据集,根据最优分类面对测试目标的特征指标进行估计并分类,得出其是否存在内幕交易;步骤5:判断测试目标是否违背原决策函数的KKT条件;步骤5.1:若违背决策函数的KKT条件,则执行步骤6;步骤5.2:若不违背决策函数的KKT条件,则执行步骤7;步骤6:将测试目标及其是否内幕交易的标签加入样本数据集,利用粒子群优化算法优化参数并训练得到一个新的支持向量机分类器;步骤7:判断是否有下一测试目标;步骤7.1:若有下一测试目标,则执行步骤3;步骤7.2:若无下一测试目标,则结束。进一步地,所述样本数据集包括是否为内幕交易的特征标签。进一步地,样本数据及其特征指标包括证券市场微观表现指标、财务指标、股权结构与治理指标。进一步地,所述支持向量机的核参数与惩罚因子采用粒子群优化算法优化得出。在支持向量机分类模型构建中,支持向量机的最优目标函数式如下:s.t.[(w·xi)+b]≥1-ξiξi≥0,i=1,2,…,n其中xi表示第i个样本点的特征,w表示权重向量,C表示惩罚因子,用于控制对错分样本惩罚的程度;ξi表示松弛变量,b表示阈值。利用拉格朗日优化方法,将其转化成对偶问题,并引入核函数K(x,x'),则式(1)转化为:其中,ai为拉格朗日乘子,xi为分类模型输入数据,yi为训练集的标签数据。进一步地,支持向量机的核函数采用高斯核函数:基于高斯核函数的支持向量机,需要确定模型的两个参数:惩罚因子C和核函数参数σ。本专利技术利用粒子群优化算法来确定和优化这两个参数。在支持向量机建模中代入经过粒子群优化算法优化后的惩罚因子C和核参数σ得到此支持向量机的决策函数:其中,sgn为符号函数,f(x)为分类模型的输出数据,取值为-1或1。n为指标集中训练样本个数,ai为拉格朗日乘子,K为高斯核函数。当判断一个测试样本是否发生了内幕交易时,将该样本代入到上述决策函数进行计算即可得出是否存在内幕交易的结果。获取测试目标后,首先采用样本数据集所建支持向量机模型进行分类,之后,对测试目标是否满足原决策函数的KKT条件进行判断,若其违背决策函数的KKT条件,则将测试目标及其是否内幕交易的标签加入样本数据集,然后利用粒子群优化算法优化参数并训练得到一个新的支持向量机分类器从而进行增量学习,否则则继续沿用原模型对下一个测试目标进行内幕交易与否的辨别。本专利技术的有益效果:1)本专利技术建立了一种优化的股票内幕交易识别方法,实现了对测试样本是否存在内幕交易进行准确识别;2)本专利技术采用粒子群优化算法对支持向量机的参数进行优化,提高了支持向量机分类器的识别准确率;3)将违背原决策函数的KKT条件的样本和相应分类结果加入到原样本数据集形成新的样本数据集,从而实现模型的自动更新学习,使本专利技术的方法对证券市场环境变化及新内幕交易行为具有更好的适应能力。附图说明下面结合附图和实施例对本专利技术作进一步说明:图1为基于粒子群优化增量支持向量机的内幕交易辨别方法流程图。图2为新增样本与KKT条件的关系示意图。具体实施方式如图1所示,基于粒子群优化增量支持向量机的内幕交易辨别方法,包括以下步骤:步骤1:收集内幕交易相关的样本和对应的非内幕交易样本,及其特征指标作为样本数据集;步骤2:利用粒子群优化算法优化参数后的支持向量机对样本数据集进行学习和分类;步骤3:确定最优的分类面和分类向量;步骤4:获得测试目标并收集测试目标数据集,根据最优分类面对测试目标的特征指标进行估计并分类,判断样本是否存在内幕交易;步骤5:判断测试目标是否违背决策函数的KKT条件;步骤5.1:若违背决策函数的KKT条件,则执行步骤6;步骤5.2:若不违背决策函数的KKT条件,则执行步骤7;步骤6:将测试目标及其是否内幕交易的标签加入样本数据集,利用粒子群优化算法优化参数并训练得到一个新的支持向量机分类器;步骤7:判断是否有下一测试目标;步骤7.1:若有下一测试目标,则执行步骤3;步骤7.2:若无下一测试目标,则结束。把内幕交易与对应的未发生内幕交易的样本及其特征T={(x1,y1),…(xn,yn)}∈(X×Y)n作为支持向量机的训练样本,其中xi∈X=Rn,yi∈Y=±1,i=1,2,…,n,xi为分类模型输入数据,yi为训练集的标签数据。特征指标数据包括证券市场个股公开的上市公司财务指标数据、上市公司股权结构与治理指标数据、个股证券市场微观指标数据,个股证券市场微观指标数据通过GARCH模型计算。在支持向量机分类模型构建中,支持向量机的最优目标函数式为:s.t.[(w·xi)+b]≥1-ξiξi≥0,i=1,2,…,n其中w表示权重向量,C表示惩罚因子,用于控制对错分样本惩罚的程度;ξi表示松弛变量;b表示阈值。利用拉格朗日优化方法,转化成对偶问题,并引入核函数K(x,x'),则式(1)转化为其中,ai表示拉格朗日乘子,xi为分类模型输入数据,yi为训练集的标签数据。引入核函数后,非线性分类问题转化为高维空间线性分类问题。满足Mercer条件都可用作为支持向量机的核函数。选取不同的核函数,可以构造不同类别的非线性本文档来自技高网...

【技术保护点】
1.一种基于粒子群优化增量支持向量机的内幕交易辨别方法,其特征在于,包括以下步骤:步骤1:收集内幕交易相关的样本、对应的非内幕交易样本及其特征指标作为样本数据集;步骤2:利用粒子群优化算法优化参数后的支持向量机对样本数据集进行学习和分类;步骤3:确定最优的分类面和分类向量;步骤4:获得测试目标样本并收集测试目标数据集,根据最优分类面对测试目标的特征指标进行估计并分类,判别测试样本是否存在内幕交易并输出判别结果;步骤5:判断测试目标是否违背决策函数的KKT条件;步骤5.1:若违背决策函数的KKT条件,则执行步骤6;步骤5.2:若不违背决策函数的KKT条件,则执行步骤7;步骤6:将测试目标及其是否内幕交易的标签加入样本数据集,利用粒子群优化算法优化参数并训练得到一个新的支持向量机分类器;步骤7:判断是否有下一测试目标;步骤7.1:若有下一测试目标,则执行步骤3;步骤7.2:若无下一测试目标,则结束。

【技术特征摘要】
1.一种基于粒子群优化增量支持向量机的内幕交易辨别方法,其特征在于,包括以下步骤:步骤1:收集内幕交易相关的样本、对应的非内幕交易样本及其特征指标作为样本数据集;步骤2:利用粒子群优化算法优化参数后的支持向量机对样本数据集进行学习和分类;步骤3:确定最优的分类面和分类向量;步骤4:获得测试目标样本并收集测试目标数据集,根据最优分类面对测试目标的特征指标进行估计并分类,判别测试样本是否存在内幕交易并输出判别结果;步骤5:判断测试目标是否违背决策函数的KKT条件;步骤5.1:若违背决策函数的KKT条件,则执行步骤6;步骤5.2:若不违背决策函数的KKT条件,则执行步骤7;步骤6:将测试目标及其是否内幕交易的标签加入样本数据...

【专利技术属性】
技术研发人员:邓尚昆王晨光粟智豪王明月
申请(专利权)人:三峡大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1