特征选择方法及装置、网络设备的识别方法及装置制造方法及图纸

技术编号:42047025 阅读:28 留言:0更新日期:2024-07-16 23:28
本发明专利技术公开了一种特征选择方法及装置、网络设备的识别方法及装置。涉及人工智能领域,特征选择方法包括:获取目标数据集;在目标数据集为多分类数据集的情况下,根据目标数据集确定多个二分类数据集集合,其中,每个二分类数据集集合包括多个二分类数据集,不同二分类数据集集合中的二分类数据集所对应的正负样本比例区间不同;根据多个二分类数据集集合对目标数据集所使用的特征集合进行特征选择,得到第一目标特征集合,其中,第一目标特征集合中的特征用于训练预设的机器学习模型,以通过训练好的机器学习模型进行数据处理。本发明专利技术解决了相关技术在多分类情况下,基于单个数据集进行特征选择,存在特征选择的准确度低的技术问题。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,具体而言,涉及一种特征选择方法及装置、网络设备的识别方法及装置


技术介绍

1、在人工智能领域,机器学习是从海量的数据中发掘隐含的数据规律的一种常用的技术手段。通过将大量原始数据作为训练样本,来训练机器学习模型,可以高效的发掘出这些数据中隐含的数据规律,并基于发掘出的数据规律来进行数据处理。

2、在对模型进行训练之前,需要基于数据集进行特征选择以确定用于模型训练的特征。目前,在相关技术中,无论是面对二分类还是多分类问题,均基于单个数据集进行特征选择,从而存在特征选择的准确度低的问题。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本专利技术实施例提供了一种特征选择方法及装置、网络设备的识别方法及装置,以至少解决相关技术在多分类情况下,基于单个数据集进行特征选择,存在特征选择的准确度低的技术问题。

2、根据本专利技术实施例的一个方面,提供了一种特征选择方法,包括:获取目标数据集,其中,目标数据集包括多个样本数据以及每个样本数据本文档来自技高网...

【技术保护点】

1.一种特征选择方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述目标数据集确定多个二分类数据集集合,包括:

3.根据权利要求1或2所述的方法,其特征在于,根据所述多个二分类数据集集合对所述目标数据集所使用的特征集合进行特征选择,得到第一目标特征集合,包括:

4.根据权利要求3所述的方法,其特征在于,根据所述多个二分类数据集集合进行特征重要性计算,得到所述特征集合中每个特征的第一特征重要性,包括:

5.根据权利要求3所述的方法,其特征在于,根据所述第一特征集合确定多个第二特征集合,包括:

6.根据权利要...

【技术特征摘要】

1.一种特征选择方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述目标数据集确定多个二分类数据集集合,包括:

3.根据权利要求1或2所述的方法,其特征在于,根据所述多个二分类数据集集合对所述目标数据集所使用的特征集合进行特征选择,得到第一目标特征集合,包括:

4.根据权利要求3所述的方法,其特征在于,根据所述多个二分类数据集集合进行特征重要性计算,得到所述特征集合中每个特征的第一特征重要性,包括:

5.根据权利要求3所述的方法,其特...

【专利技术属性】
技术研发人员:甄建静龚左叶万朝华孙彦芬杨佳磊
申请(专利权)人:山石网科通信技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1