样本对象确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36562405 阅读:16 留言:0更新日期:2023-02-04 17:17
本申请提供一种样本对象确定方法、装置、电子设备及存储介质。该方法包括:获取特征数据集合;将样本对象的特征属性映射在预先设置的多维坐标系中,得到样本对象在多维坐标系中的多维坐标点;根据多维坐标点,分别对所述样本对象在多维坐标系中不同数量的基准点下进行第一聚类处理和第二聚类处理,得到第一聚类结果和第二聚类结果;根据第一聚类结果和第二聚类结果,确定目标聚类结果;根据目标聚类结果,确定样本对象中属于目标分类的待测样本对象,以及待测样本数据;对待测样本数据进行检测处理,确定异常样本数据,以及目标样本对象。本申请的方法,提高了找出存在电费异常的通信局站的效率。局站的效率。局站的效率。

【技术实现步骤摘要】
样本对象确定方法、装置、电子设备及存储介质


[0001]本申请涉及机器学习
,尤其涉及一种样本对象确定方法、装置、电子设备及存储介质。

技术介绍

[0002]通信局站用于为通信企业存放服务器,从而为用户以及员工提供IT服务(IT service,信息
服务)。
[0003]目前,通信局站在运行使用时,也会产生电费,通信局站的电费一般可以通过抄表度数的方式获取到,但在获取电费时,通信局站可能存在因有部分电表异常或者抄表度数错误的问题,在出现问题后,需要对所有的通信局站进行筛查。
[0004]然而,在进行筛查时,由于通信局站数量庞大,可能会存在筛查困难的问题,因此,无法快速、准确的找出存在电费异常的通信局站,影响了整个企业对成本的控制,无法满足企业的维持正常运营的需求。

技术实现思路

[0005]本申请提供一种样本对象确定方法、装置、电子设备及存储介质,用以解决无法快速、准确的找出存在电费异常的通信局站,影响了整个企业对成本的控制,无法满足企业的维持正常运营的需求的问题。
[0006]第一方面,本申请提供一种样本对象确定方法,包括:
[0007]获取特征数据集合,特征数据集合包括样本对象、样本对象的特征属性以及样本对象的样本数据,其中,样本对象有多个,特征属性包括多个特征信息;
[0008]将样本对象的特征属性映射在预先设置的多维坐标系中,得到样本对象在多维坐标系中的多维坐标点;
[0009]根据多维坐标点,分别对样本对象在多维坐标系中不同数量的基准点下进行第一聚类处理和第二聚类处理,得到第一聚类结果和第二聚类结果;
[0010]根据第一聚类结果和第二聚类结果,确定目标聚类结果;
[0011]根据目标聚类结果,确定样本对象中属于目标分类的待测样本对象,以及待测样本对象的待测样本数据;
[0012]对待测样本数据进行检测处理,确定待测样本数据中的异常样本数据,以及与异常样本数据对应的目标样本对象。
[0013]在本申请实施例中,获取特征数据集合,包括:
[0014]获取初始特征数据集合,初始特征数据集合包括初始样本对象、初始样本对象的初始特征属性以及初始样本对象的初始样本数据,其中,初始样本对象有多个,初始特征属性包括多个初始特征信息;
[0015]对初始特征数据集合进行清洗处理,得到特征数据集合。
[0016]在本申请实施例中,在对初始特征数据集合进行清洗处理,得到特征数据集合,包
括:
[0017]确定初始特征属性中的异常初始特征信息;
[0018]根据异常初始特征信息,确定初始样本对象中的异常样本对象和待调整样本对象;
[0019]对初始特征数据集中的异常样本对象进行删除处理,得到初始调整特征数据集;
[0020]对初始调整特征数据集中的待调整样本对象进行调整处理,得到特征数据集合。
[0021]在本申请实施例中,初始特征数据集合包括比对样本对象;
[0022]对初始调整特征数据集中的待调整样本对象进行调整处理,得到特征数据集合,包括:
[0023]确定待调整样本对象中异常特征信息的信息类型,异常特征信息为特征信息中处于异常状态的特征信息;
[0024]根据信息类型,确定比对样本对象中的比对特征信息,比对特征信息为与异常特征信息的信息类型对应的特征信息;
[0025]根据比对特征信息,对初始调整特征数据集中的待调整样本对象进行调整处理,得到特征数据集合。
[0026]在本申请实施例中,当多维坐标系包括n个第一基准点,n为大于1的正整数时,对样本对象进行第一聚类处理,得到第一聚类结果,包括:
[0027]根据第一基准点和多维坐标点,确定第一基准点的第一样本对象集合,第一样本对象集合包括第一样本对象,第一样本对象为多维坐标系中与第一基准点的坐标距离满足预设要求的样本对象;
[0028]根据第一样本对象集合,确定第一样本对象在多维坐标系中的第一质心点;
[0029]根据第一质心点与第一基准点之间的位置关系,重复根据第一基准点和多维坐标点,确定第一基准点的第一样本对象集合的步骤,直至第一质心点与第一基准点满足位置关系,得到第一聚类结果。
[0030]在本申请实施例中,当多维坐标系包括m个第二基准点,m为不等于n的正整数时,对样本对象进行第二聚类处理,得到第二聚类结果,包括:
[0031]根据第二基准点和多维坐标点,确定第二基准点的第二样本对象集合,第二样本对象集合包括第二样本对象,第二样本对象为多维坐标系中与第二基准点的坐标距离满足预设要求的样本对象;
[0032]根据第二样本对象集合,确定第二样本对象在多维坐标系中的第二质心点;
[0033]根据第二质心点与第二基准点之间的位置关系,重复根据第二基准点和多维坐标点,确定第二基准点的第二样本对象集合的步骤,直至第二质心点与第二基准点满足位置关系,得到第二聚类结果。
[0034]在本申请实施例中,根据第一聚类结果和第二聚类结果,确定目标聚类结果,包括:
[0035]根据第一聚类结果,获取第一轮廓系数;
[0036]根据第二聚类结果,获取第二轮廓系数;
[0037]比对第一轮廓系数和第二轮廓系数:
[0038]当第一轮廓系数大于第二轮廓系数,确定第一聚类结果为目标聚类结果;
[0039]当第一轮廓系数小于第二轮廓系数,确定第二聚类结果为目标聚类结果。
[0040]在本申请实施例中,对待测样本数据进行检测处理,确定待测样本数据中的异常样本数据,以及与异常样本数据对应的目标样本对象,包括:
[0041]确定待测样本数据的疏离程度;
[0042]根据疏离程度,确定待测样本数据中的异常样本数据;
[0043]根据异常样本数据,确定与异常样本数据对应的目标样本对象。
[0044]第二方面,本申请提供一种样本对象确定装置,包括:
[0045]获取模块,用于获取特征数据集合,特征数据集合包括样本对象、样本对象的特征属性以及样本对象的样本数据,其中,样本对象有多个,特征属性包括多个特征信息;
[0046]得到模块,用于将样本对象的特征属性映射在预先设置的多维坐标系中,得到样本对象在多维坐标系中的多维坐标点;
[0047]聚类处理模块,用于根据多维坐标点,分别对样本对象在多维坐标系中不同数量的基准点下进行第一聚类处理和第二聚类处理,得到第一聚类结果和第二聚类结果;
[0048]第一确定模块,用于根据第一聚类结果和第二聚类结果,确定目标聚类结果;
[0049]第二确定模块,用于根据目标聚类结果,确定样本对象中属于目标分类的待测样本对象,以及待测样本对象的样本数据;
[0050]第三确定模块,用于对待测样本对象的样本数据进行检测处理,确定待测样本对象的样本数据中的异常样本数据,以及与异常样本数据对应的目标样本对象。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种样本对象确定方法,其特征在于,所述方法包括:获取特征数据集合,所述特征数据集合包括样本对象、所述样本对象的特征属性以及所述样本对象的样本数据,其中,所述样本对象有多个,所述特征属性包括多个特征信息;将所述样本对象的特征属性映射在预先设置的多维坐标系中,得到所述样本对象在所述多维坐标系中的多维坐标点;根据所述多维坐标点,分别对所述样本对象在所述多维坐标系中不同数量的基准点下进行第一聚类处理和第二聚类处理,得到第一聚类结果和第二聚类结果;根据所述第一聚类结果和所述第二聚类结果,确定目标聚类结果;根据所述目标聚类结果,确定所述样本对象中属于目标分类的待测样本对象,以及所述待测样本对象的待测样本数据;对所述待测样本数据进行检测处理,确定所述待测样本数据中的异常样本数据,以及与所述异常样本数据对应的目标样本对象。2.根据权利要求1所述的方法,其特征在于,所述获取特征数据集合,包括:获取初始特征数据集合,所述初始特征数据集合包括初始样本对象、所述初始样本对象的初始特征属性以及所述初始样本对象的初始样本数据,其中,所述初始样本对象有多个,所述初始特征属性包括多个初始特征信息;对所述初始特征数据集合进行清洗处理,得到所述特征数据集合。3.根据权利要求2所述的方法,其特征在于,在对所述初始特征数据集合进行清洗处理,得到所述特征数据集合,包括:确定所述初始特征属性中的异常初始特征信息;根据所述异常初始特征信息,确定所述初始样本对象中的异常样本对象和待调整样本对象;对所述初始特征数据集中的所述异常样本对象进行删除处理,得到初始调整特征数据集;对所述初始调整特征数据集中的所述待调整样本对象进行调整处理,得到所述特征数据集合。4.根据权利要求3所述的方法,其特征在于,所述初始特征数据集合包括比对样本对象;所述对所述初始调整特征数据集中的所述待调整样本对象进行调整处理,得到所述特征数据集合,包括:确定所述待调整样本对象中异常特征信息的信息类型,所述异常特征信息为所述特征信息中处于异常状态的特征信息;根据所述信息类型,确定所述比对样本对象中的比对特征信息,所述比对特征信息为与所述异常特征信息的信息类型对应的特征信息;根据所述比对特征信息,对所述初始调整特征数据集中的所述待调整样本对象进行调整处理,得到所述特征数据集合。5.根据权利要求1所述的方法,其特征在于,当所述多维坐标系包括n个第一基准点,所述n为大于1的正整数时,对所述样本对象进行第一聚类处理,得到第一聚类结果,包括:根据所述第一基准点和所述多维坐标点,确定所述第一基准点的第一样本对象集合,
所述第一样本对象集合包括第一样本对象,所述第一样本对象为所述多维坐标系中与所述第一基准点的坐标距离满足预设要求的样本对象;根据所述第一样本对象集合,确定所述第一样本对象在所述多维坐标系中的第一质心点;根据所述第一质心点与所述第一基准点之间的位置关系,重复根据所述第一基准点和所述多维坐标点,确定所述第一基准点的第一样本对象集合的步骤,直至所述第一质心点与所述第一基准点满足所述位置关系,得到第一...

【专利技术属性】
技术研发人员:熊建胜董莹莹李坤树李红云孙洋洋蒋迅婕
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1