物联网窜卡用户识别方法和装置制造方法及图纸

技术编号:20082097 阅读:363 留言:0更新日期:2019-01-15 02:59
本发明专利技术提供一种物联网窜卡用户识别方法和装置,通过从多个待测卡的通信数据中,获取各所述待测卡对应的行为特征数据和用户标识,所述待测卡为待测的物联网卡;以预设的窜卡识别模型对各所述待测卡对应的所述行为特征数据进行处理,确定各所述待测卡为窜卡或正常卡;根据各所述用户标识对应的窜卡占比,在所有所述用户标识中确定窜卡用户标识,所述窜卡占比是指所述用户标识对应的所述窜卡的数量在所述用户标识对应的卡总数量中的占比,提高了物联网窜卡识别的准确性和可靠性。

User Identification Method and Device for Channeling Card in Internet of Things

The invention provides a method and device for user identification of Internet of Things channeling cards, which acquires the corresponding behavior characteristic data and user identification of each card through the communication data of multiple cards to be tested, and the card to be tested is the Internet of Things card to be tested; and processes the behavior characteristic data corresponding to each card to be tested with the preset card identification model, and determines that each card to be tested is the network card to be tested. A channeling card or a normal card; according to the proportion of channeling cards corresponding to the user identification, the channeling card user identification is determined in all the user identification. The proportion of channeling cards refers to the proportion of the number of channeling cards corresponding to the user identification in the total number of cards corresponding to the user identification, which improves the accuracy and reliability of the identification of channeling cards in the Internet of Things.

【技术实现步骤摘要】
物联网窜卡用户识别方法和装置
本专利技术涉及数据处理技术,尤其涉及一种物联网窜卡用户识别方法和装置。
技术介绍
物联网窜卡与传统意义上的窜卡不同,物联网窜卡是指实际用途与登记注册用途不匹配的情况。物联网类卡号通常是用户物联网类业务需求,例如大量的数据流量业务和少量的通话业务,运营商在售出此类物联网卡时要求用户对物联网卡的业务范围和用途进行登记注册,从而享受物联网卡套餐的优惠。但物联网窜卡用户将购买的物联网卡用于电话卡或其他非物联网业务中,导致物联网卡的实际业务使用范围超出了原本规定的范围,扰乱了物联网卡市场的正常秩序。现有的物联网窜卡识别方法,通常是将用户购买物联网卡时的注册登记信息与实际消费进行对比,如果不一致则将该用户确认为物联网窜卡用户。然而,用户购买物联网卡时的注册登记的文本信息,填写内容通常有很多错误和不规范,参考价值低,导致物联网窜卡用户识别不准确。
技术实现思路
本专利技术提供一种物联网窜卡用户识别方法和装置,提高物联网窜卡用户识别的准确性。根据本专利技术的第一方面,提供一种一种物联网窜卡用户识别方法,包括:从多个待测卡的通信数据中,获取各所述待测卡对应的行为特征数据和用户标识,所述待测卡为待测的物联网卡;以预设的窜卡识别模型对各所述待测卡对应的所述行为特征数据进行处理,确定各所述待测卡为窜卡或正常卡;根据各所述用户标识对应的窜卡占比,在所有所述用户标识中确定窜卡用户标识,所述窜卡占比是指所述用户标识对应的所述窜卡的数量在所述用户标识对应的卡总数量中的占比。可选地,在第一方面的一种可能实现方式中,在所述以预设的窜卡识别模型对各所述待测卡对应的所述行为特征数据进行处理,确定各所述待测卡为窜卡或正常卡之前,还包括:根据预存储的窜卡用户的第一行为特征信息和预设的第一分类模型,获得窜卡信息样本和正常信息样本;以所述窜卡信息样本和所述正常信息样本作为训练样本,对多个不同的初始分类模型分别进行训练,得到多个不同的子分类模型;根据所述多个不同的子分类模型,获得窜卡识别模型。可选地,在第一方面的另一种可能实现方式中,所述根据预存储的窜卡用户的第一行为特征信息和预设的第一分类模型,获得窜卡信息样本和正常信息样本,包括:获取预存储的窜卡用户的第一行为特征信息和未知类型用户的第二行为特征信息;以预设的第一分类模型对所述第一行为特征信息和第二行为特征信息进行处理,获得第一分类和第二分类,且所述第一分类对应的所述第一行为特征信息的数量大于所述第二分类对应的所述第一行为特征信息的数量;将所述第一分类对应的所述第一行为特征信息,确定为窜卡信息样本;将所述第二分类对应的所述第二行为特征信息,确定为正常信息样本。可选地,在第一方面的再一种可能实现方式中,所述根据所述多个不同的子分类模型,获得窜卡识别模型,包括:将所述多个不同的子分类模型的处理结果加权求和,并以所述加权求和的结果相对于分类阈值的大小,确定为窜卡识别模型的处理结果;其中,若所述加权求和的结果大于或等于所述分类阈值,则所述窜卡识别模型的处理结果为窜卡;若所述加权求和的结果小于所述分类阈值,则所述窜卡识别模型的处理结果为正常卡。可选地,在第一方面的又一种可能实现方式中,所述多个不同的初始分类模型包括:随机分离初始模型、近邻初始模型和逻辑回归初始模型。可选地,在第一方面的又一种可能实现方式中,所述根据各所述用户标识对应的窜卡占比,在所有所述用户标识中确定窜卡用户标识,包括:在所有所述用户标识中,将与大于占比阈值的窜卡占比对应的用户标识,确定为窜卡用户标识。可选地,在第一方面的又一种可能实现方式中,所述从多个待测卡的通信数据中,获取各所述待测卡对应的行为特征数据和用户标识,包括:从多个待测卡的通信数据中,获取各所述待测卡对应的用户标识以及在预设时间段内产生的以下至少一类数据:上行流量、下行流量、短信数量、语音通话主呼叫时长、语音通话被呼叫时长。根据本专利技术的第二方面,提供一种物联网窜卡用户识别装置,包括:行为特征数据采集模块,用于从多个待测卡的通信数据中,获取各所述待测卡对应的行为特征数据和用户标识,所述待测卡为待测的物联网卡;处理模块,用于以预设的窜卡识别模型对各所述待测卡对应的所述行为特征数据进行处理,确定各所述待测卡为窜卡或正常卡;窜卡用户标识确定模块,用于根据各所述用户标识对应的窜卡占比,在所有所述用户标识中确定窜卡用户标识,所述窜卡占比是指所述用户标识对应的所述窜卡的数量在所述用户标识对应的卡总数量中的占比。可选地,在第二方面的一种可能实现方式中,所述处理模块,在所述以预设的窜卡识别模型对各所述待测卡对应的所述行为特征数据进行处理,确定各所述待测卡为窜卡或正常卡之前,还用于根据预存储的窜卡用户的第一行为特征信息和预设的第一分类模型,获得窜卡信息样本和正常信息样本;以所述窜卡信息样本和所述正常信息样本作为训练样本,对多个不同的初始分类模型分别进行训练,得到多个不同的子分类模型;根据所述多个不同的子分类模型,获得窜卡识别模型。可选地,在第二方面的另一种可能实现方式中,所述处理模块,具体用于获取预存储的窜卡用户的第一行为特征信息和未知类型用户的第二行为特征信息;以预设的第一分类模型对所述第一行为特征信息和第二行为特征信息进行处理,获得第一分类和第二分类,且所述第一分类对应的所述第一行为特征信息的数量大于所述第二分类对应的所述第一行为特征信息的数量;将所述第一分类对应的所述第一行为特征信息,确定为窜卡信息样本;将所述第二分类对应的所述第二行为特征信息,确定为正常信息样本。可选地,在第二方面的再一种可能实现方式中,所述处理模块,具体用于将所述多个不同的子分类模型的处理结果加权求和,并以所述加权求和的结果相对于分类阈值的大小,确定为窜卡识别模型的处理结果;其中,若所述加权求和的结果大于或等于所述分类阈值,则所述窜卡识别模型的处理结果为窜卡;若所述加权求和的结果小于所述分类阈值,则所述窜卡识别模型的处理结果为正常卡。可选地,在第二方面的又一种可能实现方式中,所述多个不同的初始分类模型包括:随机分离初始模型、近邻初始模型和逻辑回归初始模型。可选地,在第二方面的又一种可能实现方式中,所述窜卡用户标识确定模块,具体用于在所有所述用户标识中,将与大于占比阈值的窜卡占比对应的用户标识,确定为窜卡用户标识,所述窜卡占比是指所述用户标识对应的所述窜卡的数量在所述用户标识对应的卡总数量中的占比。可选地,在第二方面的又一种可能实现方式中,所述行为特征数据采集模块,用于从多个待测卡的通信数据中,获取各所述待测卡对应的用户标识以及在预设时间段内产生的以下至少一类数据:上行流量、下行流量、短信数量、语音通话主呼叫时长、语音通话被呼叫时长。根据本专利技术的第三方面,提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现本专利技术第一方面及第一方面各种可能设计的所述的物联网窜卡用户识别方法。根据本专利技术的第四方面,提供一种服务器,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行本专利技术第一方面及第一方面各种可能设计的所述方法。本专利技术提供的一种物联网窜卡用户识别方法和装置,通过从多个待测卡的通信数据中,获取各所述待测卡对应本文档来自技高网...

【技术保护点】
1.一种物联网窜卡用户识别方法,其特征在于,包括:从多个待测卡的通信数据中,获取各所述待测卡对应的行为特征数据和用户标识,所述待测卡为待测的物联网卡;以预设的窜卡识别模型对各所述待测卡对应的所述行为特征数据进行处理,确定各所述待测卡为窜卡或正常卡;根据各所述用户标识对应的窜卡占比,在所有所述用户标识中确定窜卡用户标识,所述窜卡占比是指所述用户标识对应的所述窜卡的数量在所述用户标识对应的卡总数量中的占比。

【技术特征摘要】
1.一种物联网窜卡用户识别方法,其特征在于,包括:从多个待测卡的通信数据中,获取各所述待测卡对应的行为特征数据和用户标识,所述待测卡为待测的物联网卡;以预设的窜卡识别模型对各所述待测卡对应的所述行为特征数据进行处理,确定各所述待测卡为窜卡或正常卡;根据各所述用户标识对应的窜卡占比,在所有所述用户标识中确定窜卡用户标识,所述窜卡占比是指所述用户标识对应的所述窜卡的数量在所述用户标识对应的卡总数量中的占比。2.根据权利要求1所述的方法,其特征在于,在所述以预设的窜卡识别模型对各所述待测卡对应的所述行为特征数据进行处理,确定各所述待测卡为窜卡或正常卡之前,还包括:根据预存储的窜卡用户的第一行为特征信息和预设的第一分类模型,获得窜卡信息样本和正常信息样本;以所述窜卡信息样本和所述正常信息样本作为训练样本,对多个不同的初始分类模型分别进行训练,得到多个不同的子分类模型;根据所述多个不同的子分类模型,获得窜卡识别模型。3.根据权利要求2所述的方法,其特征在于,所述根据预存储的窜卡用户的第一行为特征信息和预设的第一分类模型,获得窜卡信息样本和正常信息样本,包括:获取预存储的窜卡用户的第一行为特征信息和未知类型用户的第二行为特征信息;以预设的第一分类模型对所述第一行为特征信息和第二行为特征信息进行处理,获得第一分类和第二分类,且所述第一分类对应的所述第一行为特征信息的数量大于所述第二分类对应的所述第一行为特征信息的数量;将所述第一分类对应的所述第一行为特征信息,确定为窜卡信息样本;将所述第二分类对应的所述第二行为特征信息,确定为正常信息样本。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述多个不同的子分类模型,获得窜卡识别模型,包括:将所述多个不同的子分类模型的处理结果加权求和,并以所述加权求和的结果相对于分类阈值的大小,确定为窜卡识别模型的处理结果;其中,若所述加权求和的结果大于或等于所述分类阈值,则所述窜卡识别模型的处理结果为窜卡;若所述加权求和的结果小于所述分类阈值,则所述窜卡识别模型的处理结果为正常卡。5.根据权利要求4所述的方法,其特征在于,所述多个不同的初始分类模型包括:随机分离初始模型、近邻初始模型和逻辑回归初始模型。6.根据权利要求1所述的方法,其特征在于,所述根据各所述用户标识对应的窜卡占比,在所有所述用户标识中确定窜卡用户标识,包括:在所有所述用户标识中,将与大于占比阈值的窜卡占比对应的用户标识,确定为窜卡用户标识。7.根据权利要求1所述的方法,其特征在于,所述从多个待测卡的通信数据中,获取各所述待测卡对应的行为特征数据和用户标识,包括:从多个待测卡的通信数据中,获取各所述待测卡对应的用户标识以及在预设时间段内产生的以下至少一类数据:上行流量、下行流量、短信数量、语音通话主呼叫时长、语音通话被呼叫时长。8.一种物联网窜卡用户识别装置,其特征在于,包括:行为特征...

【专利技术属性】
技术研发人员:许丹丹张溶芳刘楠许海翔顾芳王元光
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1