一种基于核函数的特征选择方法及装置制造方法及图纸

技术编号：34693640 阅读：13 留言：0更新日期：2022-08-27 16:28

本发明专利技术公开了一种基于核函数的特征选择方法及装置，方法包括：对第一数据集进行转置处理，得到第二数据集；基于所述第二数据集诱导出聚类算法所依赖的距离函数；基于所述距离函数，采用k

全部详细技术资料下载

【技术实现步骤摘要】
一种基于核函数的特征选择方法及装置

[0001]本专利技术涉及数据处理技术，更具体的说，是涉及一种基于核函数的特征选择方法及装置。

技术介绍

[0002]随着移动智能和物联网的飞速发展，人类产生的数据量正在呈指数级增长,大数据、人工智能应用也层出不穷。大数据、人工智能应用依赖于数据建模，建模效果依赖于特征选择。由于数据量巨大，特征维度多，目前特征选择方法多是基于SVD(Singular Value Decomposition,奇异值分解)、PCA(Principal Component Analysis，一种数据降维方式)、LDA(Linear Discriminant Analysis，线性判别分析)的数据降维技术，这些方法可以降低特征间的多重相关关系，提升模型泛化能力，但是其缺点也很明显，会让模型变得难以解释，不能满足金融领域模型可解释性的需求。

技术实现思路

[0003]有鉴于此，本专利技术提供如下技术方案：
[0004]一种基于核函数的特征选择方法，包括：
[0005]对第一数据集进行转置处理，得到第二数据集；
[0006]引入核函数，并基于所述第二数据集诱导出聚类算法所依赖的距离函数；
[0007]基于所述距离函数，采用k
‑
中心聚类算法得到所述核函数建模的特征。
[0008]可选的，还包括：
[0009]基于所述建模的特征和模型评价指标，确定参数最优的核函数。
[0010]可选的，所述基于所述建模的特征和模型评价指标...

【技术保护点】

【技术特征摘要】
1.一种基于核函数的特征选择方法，其特征在于，包括：对第一数据集进行转置处理，得到第二数据集；引入核函数，并基于所述第二数据集诱导出聚类算法所依赖的距离函数；基于所述距离函数，采用k
‑
中心聚类算法得到所述核函数建模的特征。2.根据权利要求1所述核函数的特征选择方法，其特征在于，还包括：基于所述建模的特征和模型评价指标，确定参数最优的核函数。3.根据权利要求2所述的核函数的特征选择方法，其特征在于，所述基于所述建模的特征和模型评价指标，确定参数最优的核函数，包括：对于引入的核函数，基于模型指标，通过不断的参数调优，通过循环执行所述基于所述第二数据集诱导出聚类算法所依赖的距离函数和所述基于所述距离函数，采用k
‑
中心聚类算法得到建模的特征的步骤，确定参数最优的核函数。4.根据权利要求2所述的基于核函数的特征选择方法，其特征在于，在所述基于所述建模的特征和模型评价指标，确定参数最优的核函数后，还包括：基于所述模型评价指标确定最优的聚类数k。5.根据权利要求4所述的基于核函数的特征选择方法，其特征在于，所述基于所述模型评价指标确定最优的聚类数k，包括：基于所述最优的核函数和所述模型评价指标，对所述k

【专利技术属性】
技术研发人员：袁宇，
申请(专利权)人：中国银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人