【技术实现步骤摘要】
异常行为识别和风险模型库的建立方法、装置及电子设备
本专利技术实施例涉及无线通信
,尤其涉及一种异常行为识别和风险模型库的建立方法、装置及电子设备。
技术介绍
随着物联网的发展,物联网卡的行为中也隐含一些安全问题,比如电话诈骗、流量盗用、薅羊毛等。针对这些问题,现有技术提出了以下方法:第一种方法,提出基于大数据平台进行属性约简方法,同时以Hadoop开源平台为基础,构建了移动用户行为模式分析平台;第二种方法,引入粗糙集理论预处理客户基础信息,并以核心客户离网预警模型为例,给出变精度粗糙集属性约简算法,筛选出模型关键变量。然而,第一种方法在对用户行为特征数据进行约简时,往往会在约简过程中丢失一些重要的数据,降低了对风险场景中异常行为识别的准确率;第二种方法在选取测试数据时忽略了运营商运营过程中的海量数据量,这一方面由于测试数据样本量较少降低了识别准确度,另一方面在面对海量测试数据时,难以应对且效率较低。因此,如何准确识别风险场景中的异常行为,仍然需要进一步的解决方案。
技术实现思路
本 ...
【技术保护点】
1.一种风险模型库的建立方法,其特征在于,所述方法应用于分布式文件系统,包括:/n获取风险场景的多组异常行为特征数据及对应的异常分类标签,一组异常行为特征数据中包括多个异常行为特征数据;/n分别将所述多组异常行为特征数据进行离散化处理,得到所述多组异常行为特征数据中的多个异常行为特征数据对应的风险特征值;/n分别对所述多组异常行为特征数据中的多个异常行为特征数据对应的风险特征类别,进行属性约简,以使得基于所述属性约简后的风险特征类别集合和对应的风险特征值,确定的异常分类标签的准确率满足预设条件;/n基于所述属性约简后的风险特征类别集合、风险特征值和对应的异常分类标签之间的关 ...
【技术特征摘要】
1.一种风险模型库的建立方法,其特征在于,所述方法应用于分布式文件系统,包括:
获取风险场景的多组异常行为特征数据及对应的异常分类标签,一组异常行为特征数据中包括多个异常行为特征数据;
分别将所述多组异常行为特征数据进行离散化处理,得到所述多组异常行为特征数据中的多个异常行为特征数据对应的风险特征值;
分别对所述多组异常行为特征数据中的多个异常行为特征数据对应的风险特征类别,进行属性约简,以使得基于所述属性约简后的风险特征类别集合和对应的风险特征值,确定的异常分类标签的准确率满足预设条件;
基于所述属性约简后的风险特征类别集合、风险特征值和对应的异常分类标签之间的关系,建立风险模型库。
2.如权利要求1所述的方法,其特征在于,所述分布式文件系统包括多个数据节点;
分别对所述多组异常行为特征数据中的多个异常行为特征数据对应的风险特征类别,进行属性约简,以使得基于所述属性约简后的风险特征类别和对应的风险特征值,确定的异常分类标签的准确率满足预设条件,包括:
将所述多组异常行为特征数据中的多个异常行为特征数据对应的特征值等分为N个数据块,并对所述N个数据块进行编号,N为大于或等于3的正整数,所述N个数据块包括数据块X1~数据块XN;
按照所述N个数据块的编号顺序,分别对所述N个数据块进行二等分,得到2*N个数据块,所述2*N个数据块包括数据块X1,1、数据块X1,2~数据块XN,1、数据块XN,2;
将所述2*N个数据块中的数据块X1,1、数据块X1,2和数据块Xi,2分配给第一个数据节点,以及将所述2*N个数据块中的数据块X2,1、数据块X2,2和数据块Xi,2分配给第二个数据节点,其中,i∈[3,N];
将数据块Xa,1和数据块Xa,2中满足指定条件的一个数据块、数据块Xk,1和数据块Xk,2分配给第k个数据节点,其中,a∈[1,N],且a≠k,k为大于或等于3的正整数;
分别对所述多个数据节点中分配的数据,进行属性约简,以使得基于所述属性约简后的风险特征类别集合和对应的风险特征值,确定的异常分类标签的准确率满足预设条件。
3.如权利要求2所述的方法,其特征在于,分别对所述多个数据节点中分配的数据,进行属性约简,以使得基于所述属性约简后的风险特征类别集合和对应的风险特征值,确定的异常分类标签的准确率满足预设条件,包括:
对指定数量的测量精度进行初始化处理,所述测量精度为基于约简后的风险特征类别和对应的风险特征值确定的异常分类标签的准确率;
针对所述多个风险特征类别依次循环执行第一操作、第二操作和第三操作;
从所述属性约简后的风险特征类别集合和对应的风险特征值中,确定测量精度满足预设条件的风险特征类别集合;
其中,所述第一操作包括:
将k1赋值为1,从所述多个风险特征类别中选取多组特征类别,其中一组风险特征类别包括k1个风险特征类别;
分别基于所述多组风险特征类别中的各组风险特征类别包括的k1个风险特征类别,确定所述多组风险特征类别对应的多个第一测量精度;
将所述第一测量精度按照数值大小从大到小排列,并从所述多个第一测量精度中选取排名靠前的所述指定数量的第一测量精度;
当所述k1为小于或等于所述多个风险特征类别的数量的正整数时,将所述k1进行加一操作;
所述第二操作包括:
将k2赋值为k1+1,从所述多个风险特征类别中选取多组风险特征类别,其中一组风险特征类别包括k2个特征类别;
分别基于所述多组风险特征类别中的各组风险特征类别包括的k2个风险特征类别,确定所述多组风险特征类别对应的多个第二测量精度;
将所述第二测量精度按照数值大小从大到小排列,并从所述多个第二测量精度中选取排名靠前的所述指定数量的第二测量精度;
当所述k2为小于或等于所述多个风险特征类别的数量的正整数时,将所述k2进行加一操作;
所述第三操作包括:
基于所述指定数量的第一测量精度和所述指定数量的第二测量精度,选取排名靠前的指定数量的测量精度,赋值给所述指定数量的测量精度。
4.如权利要求1...
【专利技术属性】
技术研发人员:赵俊,王伟杰,许鑫伶,刘钢庭,鲁银冰,李启文,何洋,王丹弘,任姣姣,刘浩明,
申请(专利权)人:中国移动通信集团广东有限公司,中移杭州信息技术有限公司,中国移动通信集团有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。