一种预测股价收益率分布的代价函数计算方法技术

技术编号：20821454 阅读：60 留言：0更新日期：2019-04-10 06:21

本发明专利技术公开了一种预测股价收益率分布的代价函数计算方法，S101、采集数据：预先采集常规训练数据，其中，因子作为特征信息，收益率作为目标信息；S103、等分区间：将步骤S101所得目标信息的分布区间，分成n等分，对应分别记为R1,R2,...,Rn；S105、样本采集：将步骤S101所得目标信息对应分配到步骤S103的n等分，并统计n等分中各区间样本的数量，分别记为N1,N2,...,Nn；S107、确定样本：将步骤S105中所得N1,N2,...,Nn筛选出最大值NX，代入公式

全部详细技术资料下载

【技术实现步骤摘要】
一种预测股价收益率分布的代价函数计算方法
本专利技术涉及股价收益
，具体来说，涉及一种预测股价收益率分布的代价函数计算方法。
技术介绍
股票收益是股票股息和因拥有股票所有权而获得的超出股票实际购买价格的收益。投资者购买股票最关心的是能获得多少收益。具体来说，就是红利和股票市价的升值部分。公司发放红利，大致有三种形式，现金红利，股份红利、财产红利。一般大多数公司都是发放现金股利的，不发放现金红利的主要是那些正在迅速成长的公司，它们为了公司的扩展。需要暂存更多的资金以适应进一步的需要，这种做法常常为投资者所接受。由于股息是股票的名义收益，而股票价格则是经常变化的，因此比较起来，股票持有者对股票价格变动带来的预期收益比对股息更为关心。股价收益率绝大多数情况下的波动范围都很小，只是少数情况下波动会放大，因此收益率的分布具有很高的峰度，分布极不平衡，在进行回归建模进行股价预测的时候，受到大量小波动率训练样本的影响，导致训练得到的模型预测的结果也缺失波动性。传统解决不平衡问题的方法主要有上采样和下采样两种，在分类问题中，常用的还有代价敏感损失函数的方法，下采样的方法会丢失大量的信息，上采样的方法也会有大量重复的数据，容易导致过拟合，同时，采样的方法会导致股价预测的样本变得不连续，而不具有时间序列的特征，而分类问题中的解决方法在具有连续数据类型的问题中尚不能直接拿来使用，而是需要将连续数据转化为离散化的数据，然后设计代价敏感损失函数进行建模，股价的收益率具有尖峰肥尾的特征，其分布具有严重的不平衡性，使用机器学习进行股价回归和预测时，预测结果倾向于分布在均值附近，实...

【技术保护点】
1.一种预测股价收益率分布的代价函数计算方法，其特征在于，包括以下步骤：S101、采集数据：预先采集常规训练数据，其中，因子作为特征信息，收益率作为目标信息；S103、等分区间：将步骤S101所得目标信息的分布区间，按区间范围分成n等分，对应分别记为R1,R2,...,Rn；S105、样本采集：将步骤S101所得目标信息对应分配到步骤S103的n等分，并统计n等分中各区间样本的数量，分别记为N1,N2,...,Nn；S107、确定样本：将步骤S105中所得N1,N2,...,Nn筛选出最大值NX，代入公式

【技术特征摘要】
1.一种预测股价收益率分布的代价函数计算方法，其特征在于，包括以下步骤：S101、采集数据：预先采集常规训练数据，其中，因子作为特征信息，收益率作为目标信息；S103、等分区间：将步骤S101所得目标信息的分布区间，按区间范围分成n等分，对应分别记为R1,R2,...,Rn；S105、样本采集：将步骤S101所得目标信息对应分配到步骤S103的n等分，并统计n等分中各区间样本的数量，分别记为N1,N2,...,Nn；S107、确定样本：将步骤S105中所得N1,N2,...,Nn筛选出最大值NX，代入公式获取样本...

【专利技术属性】
技术研发人员：江寅，朱传瑞，
申请(专利权)人：安徽磐众信息科技有限公司，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人