一种基于粒子群优化增量支持向量机的内幕交易辨别方法技术

技术编号：22057649 阅读：25 留言：0更新日期：2019-09-07 16:06

一种基于粒子群优化增量支持向量机的内幕交易辨别方法，首先收集内幕交易相关的样本数据及其特征指标作为样本数据集；然后利用粒子群优化算法优化参数后的支持向量机对样本数据集进行学习和分类，并确定最优的分类面和分类向量，获得测试目标并收集测试目标数据集，根据最优分类面对测试目标的特征指标进行估计并分类，判断样本是否存在内幕交易。本发明专利技术建立了股票市场内幕交易行为自动识别模型，实现了对测试目标是否存在内幕交易进行准确识别；其中，采用粒子群优化算法对支持向量机进行优化，提高了支持向量机分类器的准确率；将违背原决策函数的KKT条件的样本和相应分类结果加入到原样本数据集形成新的样本数据集，实现模型的自动更新学习。

An Insider Trading Discrimination Method Based on Particle Swarm Optimization Incremental Support Vector Machine

全部详细技术资料下载

【技术实现步骤摘要】
一种基于粒子群优化增量支持向量机的内幕交易辨别方法
本专利技术属于证券市场监管领域，具体涉及一种基于粒子群优化增量支持向量机的内幕交易辨别方法。
技术介绍
证券市场内幕交易行为违反了证券市场“公平、公正、公开”的三公原则，严重侵蚀中小投资者的利益，极大地阻碍了证券市场的健康发展。随着各国证券市场的不断发展，内幕交易主体构成的日益多元化、内幕交易行为手段的策略化与内幕交易形式的多样化、隐蔽化等特点，使得监管部门很难高效快速地进行侦查识别，以往现场突击审查与依靠知情人士举报的传统方法耗费大量的人力、物力、财力的同时往往得不到较好的监管效率。目前，对于内幕交易样本行为进行分类的应用模型主要有Logistic、随机森林、神经网络等辨别模型。其中，Logistic模型是基于经典统计学理论下的参数估计模型,是基于样本数趋近于无穷大时的一种渐进理论，在使用样本进行参数估计之前需要预知样本分布的具体形式；而神经网格学习方法虽然克服了传统参数估计方面的困难，但目前还缺乏统一的数学理论，且对于训练样本容易出现过拟合的状况；随机森林模型虽然可以快速处理具有多特征维度的样本分类，但其模型的精度较依赖于训练样本的数量，在样本数量较少的情况下辨别精度会大大降低。由于我国证券市场已公布内幕交易案例数量的局限性，针对小样本分类问题，支持向量机较具有优势。然而，支持向量机的惩罚因子C或核函数参数若人为选择不当，容易出现模型过度拟合或欠拟合的情况，进而会影响到支持向量机的分类精度，即内幕交易的辨别效果。
技术实现思路
本专利技术的目的是解决上述问题，提供一种基于粒子群优化增量支持向量机的内幕交易...

【技术保护点】
1.一种基于粒子群优化增量支持向量机的内幕交易辨别方法，其特征在于，包括以下步骤：步骤1：收集内幕交易相关的样本、对应的非内幕交易样本及其特征指标作为样本数据集；步骤2：利用粒子群优化算法优化参数后的支持向量机对样本数据集进行学习和分类；步骤3：确定最优的分类面和分类向量；步骤4：获得测试目标样本并收集测试目标数据集，根据最优分类面对测试目标的特征指标进行估计并分类，判别测试样本是否存在内幕交易并输出判别结果；步骤5：判断测试目标是否违背决策函数的KKT条件；步骤5.1：若违背决策函数的KKT条件，则执行步骤6；步骤5.2：若不违背决策函数的KKT条件，则执行步骤7；步骤6：将测试目标及其是否内幕交易的标签加入样本数据集，利用粒子群优化算法优化参数并训练得到一个新的支持向量机分类器；步骤7：判断是否有下一测试目标；步骤7.1：若有下一测试目标，则执行步骤3；步骤7.2：若无下一测试目标，则结束。

【技术特征摘要】
1.一种基于粒子群优化增量支持向量机的内幕交易辨别方法，其特征在于，包括以下步骤：步骤1：收集内幕交易相关的样本、对应的非内幕交易样本及其特征指标作为样本数据集；步骤2：利用粒子群优化算法优化参数后的支持向量机对样本数据集进行学习和分类；步骤3：确定最优的分类面和分类向量；步骤4：获得测试目标样本并收集测试目标数据集，根据最优分类面对测试目标的特征指标进行估计并分类，判别测试样本是否存在内幕交易并输出判别结果；步骤5：判断测试目标是否违背决策函数的KKT条件；步骤5.1：若违背决策函数的KKT条件，则执行步骤6；步骤5.2：若不违背决策函数的KKT条件，则执行步骤7；步骤6：将测试目标及其是否内幕交易的标签加入样本数据...

【专利技术属性】
技术研发人员：邓尚昆，王晨光，粟智豪，王明月，
申请(专利权)人：三峡大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人