一种基于机器学习的金融领域数据预测方法、设备及介质技术

技术编号：33554269 阅读：21 留言：0更新日期：2022-05-26 22:50

本发明专利技术涉及一种基于机器学习的金融领域数据预测方法，包括：步骤S1、获取样本数据并进行数据预处理；步骤S2、采用多种机器学习模型对预处理后的样本数据进行分类；采用分类评估指标以及拟合网格图对分类结果进行评估，从中选取两个表现最为出色的机器学习模型；步骤S3、利用基于单特征AUC模型的特征工程筛选最优特征，并采用选出的机器学习模型进行训练，选取分类效果最佳的模型作为最终预测模型；步骤S4、采用SMOTE算法进行数据均衡化处理，优化最终预测模型；步骤S5、采用优化后的最终预测模型对金融领域数据进行预测，得到数据预测结果。与现有技术相比，本发明专利技术具有预测准确率高的优点。的优点。的优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习的金融领域数据预测方法、设备及介质

[0001]本专利技术涉及数据预测领域，尤其是涉及一种基于机器学习的金融领域数据预测方法、设备及介质。

技术介绍

[0002]金融领域的财务危机是一种动态可持续的过程。一家能够达到上市要求的公司，说明其经营状况在一定的时期和程度上都是良好的，所以不会立即陷入财务危机的状况。文献研究表明，进入破产状态的英国公司，从经营状态良好到发生财务风险，最终走向破产最少需要三年时间。这一情况同样也适用于美国公司。这两类公司的共同点在于，公司在申请破产的前两年，就停止提供财务报表。在中国，上市企业连续两年的净利润为负值，就会被标注出来，做特别处理，即被标注ST；而一家上市企业连续三年的净利润为负值，则会收到退市警告，即标注*ST。上市公司陷入财务困境，将会给包括股东、经理、投资者、债权人、供应商、客户等利益相关者带来负面影响，情节严重的会给中国社会经济带来不良的波动。随着这些不良影响带来的是高昂代价，这种代价使得在公司遭遇财务危机之前进行相应的预警十分重要。
[0003]针对以上情况，需要设计一种准确性高的金融领域数据预测方法，以应对金融领域企业的财务危机。

技术实现思路

[0004]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供了一种预测准确性高的基于机器学习的金融领域数据预测方法、设备及介质。
[0005]本专利技术的目的可以通过以下技术方案来实现：
[0006]根据本专利技术的第一方面，提供了一种基于机器学习的金融领域数据预测...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的金融领域数据预测方法，其特征在于，包括：步骤S1、获取样本数据并进行数据预处理；步骤S2、采用多种机器学习模型对预处理后的样本数据进行分类；采用分类评估指标以及拟合网格图对分类结果进行评估，从中选取两个表现最为出色的机器学习模型；步骤S3、利用基于单特征AUC模型的特征工程筛选最优特征，并采用选出的机器学习模型进行训练，选取分类效果最佳的模型作为最终预测模型；步骤S4、采用SMOTE算法进行数据均衡化处理，优化最终预测模型；步骤S5、采用优化后的最终预测模型对金融领域数据进行预测，得到数据预测结果。2.根据权利要求1所述的一种基于机器学习的金融领域数据预测方法，其特征在于，所述步骤S1中数据预处理具体为：S11、样本数据空值处理、样本数据标准化处理；S12、引入t
‑
SNE降维算法对样本数据进行降维可视化，去除无效数据。3.根据权利要求2所述的一种基于机器学习的金融领域数据预测方法，其特征在于，所述引入t
‑
SNE降维算法对样本数据进行降维可视化具体为：1)将样本数据点之间的相似度转化为条件概率，原始空间中样本数据点的相似度采用高斯联合分布表示，嵌入空间中样本数据点的相似度由学生t分布表示；2)将原始空间和嵌入空间的联合概率分布的KL散度作为损失函数，通过梯度下降算法最小化损失函数来评估嵌入效果的好坏；基于将降维可视化结果去除无效样本数据。4.根据权利要求1所述的一种基于机器学习的金融领域数据预测方法，其特征在于，所述步骤S2中的分类评估指标包括准确率、精确率、召回率、F1得分以及AUC值。5.根据权利要求1所述的一种基于机器学习的金融领域数据预测方法，其特征在于，所述步骤S2中多种机器学习模型包括支持向量机SVM模型、逻辑回归模型、随机森林模型、XGBoot模型以及BP神经网络模型。6.根据权利要求5所述的一种基于机器学习的金融领域数据预测方法，其特征在于，所述步骤S3中利用基于单...

【专利技术属性】
技术研发人员：杨韫涵，
申请(专利权)人：中银金融科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人