【技术实现步骤摘要】
本专利技术涉及基于dbscan-cgan-xgboost模型在不平衡数据上生成累次违规人员用户画像的方法,其属于用户画像生成的。
技术介绍
1、不平衡数据分类问题在各个应用领域备受关注,尤其在累次违规人员预测、欺诈检测、疾病监测以及故障检测领域中。不平衡数据分类是指数据分布明显不平衡,其中多数类是指样本数目多的类,相反样本数目少的类便是少数类。少数类数据远小于多数类数据,同时各类别所占的数据比例分布不均匀。在正常数据样本中,少数类样本数目过少,样本类别不均衡将导致样本量少的分类所包含的特征过少,并很难从中提取规律;即使得到分类模型,也容易产生过度依赖与有限的数据样本而导致过拟合问题,这就使得分类器的学习性能和准确率显著下降。当模型应用到新的数据上时,模型的准确性会很差。而恰恰在现实生活中,人们关注的重点就是少数类样本的预测结果,如累次违规人员预测中,人们对违规人员释放后回归正常的关注度远远低于再违规行为的关注度。
2、由于采用的broward数据集存在着少数类数据样本远小于多数类数据样本,同时各类别所占的数据比例分布不均匀的
...【技术保护点】
1.基于DBSCAN-cGAN-XGBoost模型在不平衡数据上生成累次违规人员用户画像的方法,其特征在于,包括以下步骤:
【技术特征摘要】
1.基于dbscan-cgan-xgboost模型在不平衡数据...
【专利技术属性】
技术研发人员:田生伟,郑泽林,杨启萌,李沁峣,李永庆,张其洲,黄火辉,
申请(专利权)人:新疆大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。