养卡识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:39289074 阅读:13 留言:0更新日期:2023-11-07 10:58
本发明专利技术提供一种养卡识别方法、装置、电子设备和存储介质,其中方法包括:基于样本号码集的指标数据,从待识别号码集中确定出行为特征对应的目标号码;基于所述目标号码,确定养卡号码;其中,所述行为特征包括联合养卡行为特征,所述联合养卡行为特征对应的目标号码是联合养卡群体对应的号码,所述联合养卡群体是基于所述待识别号码集的号码轨迹相似度和所述待识别号码集的号码轨迹相似度对应的相似度阈值,进行对比得到的;所述相似度阈值是基于所述样本号码集的号码轨迹相似度、所述指标数据和贪心算法的损失函数进行迭代训练得到的。本发明专利技术提高了养卡识别的准确性和高效性。本发明专利技术提高了养卡识别的准确性和高效性。本发明专利技术提高了养卡识别的准确性和高效性。

【技术实现步骤摘要】
养卡识别方法、装置、电子设备和存储介质


[0001]本专利技术涉及通信
,尤其涉及一种养卡识别方法、装置、电子设备和存储介质。

技术介绍

[0002]养卡指的是渠道代理商为了从运营商处获取酬金返利,把卡养起来当做真实用户使用,而养卡号码并没有真正被使用。养卡行为造成了业务蓬勃发展的假象,浪费了有限且宝贵的号码资源,使得营销资源被占用,运营商损失了酬金,更妨碍其他用户享受优惠政策,给业务运营及管理带来很多问题。基于此,需要进行养卡识别,以确定养卡号码,从而打击养卡行为。
[0003]目前,大多人工自定义养卡识别规则,从而根据养卡识别规则,识别渠道代理商的养卡行为,并确定养卡号码。然而,人工自定义的养卡识别规则存在滞后性和局限性,导致养卡识别的准确率不高。

技术实现思路

[0004]本专利技术提供一种养卡识别方法、装置、电子设备和存储介质,用以解决现有技术中养卡识别的准确率不高的缺陷,实现高准确率的养卡识别。
[0005]本专利技术提供一种养卡识别方法,包括:
[0006]基于样本号码集的指标数据,从待识别号码集中确定出行为特征对应的目标号码;
[0007]基于所述目标号码,确定养卡号码;
[0008]其中,所述行为特征包括联合养卡行为特征,所述联合养卡行为特征对应的目标号码是联合养卡群体对应的号码,所述联合养卡群体是基于所述待识别号码集的号码轨迹相似度和所述待识别号码集的号码轨迹相似度对应的相似度阈值,进行对比得到的;
[0009]所述相似度阈值是基于所述样本号码集的号码轨迹相似度、所述指标数据和贪心算法的损失函数进行迭代训练得到的。
[0010]根据本专利技术提供的一种养卡识别方法,所述相似度阈值基于如下方式迭代训练得到:
[0011]确定当前迭代轮次的样本相似度阈值;
[0012]基于所述样本号码集的号码轨迹相似度和所述样本相似度阈值,从所述样本号码集中确定出联合养卡社区对应的第一号码集和非联合养卡社区对应的第二号码集;
[0013]基于所述第一号码集和所述第二号码集的指标距离,以及所述损失函数,对所述样本相似度阈值进行更新,得到下一迭代轮次的样本相似度阈值,并将所述下一迭代轮次作为所述当前迭代轮次,直至所述当前迭代轮次为最后的迭代轮次,以得到所述相似度阈值,所述指标距离是基于所述指标数据确定的。
[0014]根据本专利技术提供的一种养卡识别方法,所述指标距离包括主被叫次数的距离、流
量的距离和开机天数的距离中的至少一种。
[0015]根据本专利技术提供的一种养卡识别方法,所述联合养卡群体基于如下方式确定:
[0016]从所述待识别号码集中确定出当前对比轮次的第一待对比号码和第二待对比号码;
[0017]基于所述第一待对比号码在第一预设时间段内所通信的第一基站的基站数、所述第二待对比号码在第一预设时间段内所通信的第二基站的基站数,以及所述第一待对比号码和所述第二待对比号码在第一预设时间段内所通信的共同基站的基站数,确定所述第一待对比号码和所述第二待对比号码的号码轨迹相似度,所述第一待对比号码和所述第二待对比号码的号码轨迹相似度包括所述共同基站与所述第一基站的相似度、所述共同基站与所述第二基站的相似度和所述共同基站的出现天数中的至少一种;
[0018]将所述第一待对比号码和所述第二待对比号码的号码轨迹相似度与所述相似度阈值,进行对比得到对比结果;
[0019]返回从所述待识别号码集中确定出当前对比轮次的第一待对比号码和第二待对比号码的步骤,直至所述当前对比轮次为最后的对比轮次;
[0020]基于所述待识别号码集的各所述对比结果,确定所述联合养卡群体。
[0021]根据本专利技术提供的一种养卡识别方法,所述对端号码渠道集中行为特征对应的目标号码基于如下方式确定:
[0022]确定所述待识别号码集中各待识别号码的对端号码,以及所述各待识别号码的对端号码所处的第一目标渠道;
[0023]从所述各待识别号码集中确定出当前分析轮次的待分析号码,并基于所述各待识别号码的对端号码和所述第一目标渠道,确定所述待分析号码的对端号码在各渠道的号码数,以及所述待分析号码的对端号码在各渠道的号码占比;
[0024]在所述号码数和所述号码占比均满足第一预设条件的情况下,将所述待分析号码作为所述对端号码渠道集中行为特征对应的目标号码,所述第一预设条件是基于所述指标数据确定的;
[0025]返回从所述各待识别号码集中确定出当前分析轮次的待分析号码的步骤,直至所述当前分析轮次为最后的分析轮次。
[0026]根据本专利技术提供的一种养卡识别方法,所述行为特征还包括渠道异常行为特征,所述渠道异常行为特征对应的目标号码基于如下方式确定:
[0027]确定所述待识别号码集中各待识别号码所处的第二目标渠道;
[0028]基于所述各待识别号码、所述第二目标渠道和第二预设条件,确定所述渠道异常行为特征对应的目标号码;
[0029]其中,所述第二预设条件包括以下至少一种:
[0030]在同一渠道上且同一国际移动设备识别码IMEI的第一号码的号码数大于第一预设阈值的情况下,所述第一号码为渠道异常行为特征对应的目标号码;
[0031]在同一渠道上且同一基站的第二号码的号码数大于第二预设阈值的情况下,所述第二号码为渠道异常行为特征对应的目标号码;
[0032]在同一渠道上且同一第一对端号码的第三号码的号码数大于第三预设阈值的情况下,所述第三号码为渠道异常行为特征对应的目标号码,所述第一对端号码为所述第三
号码所通信最多的号码;
[0033]在同一渠道上且具有互打行为的第四号码的号码数大于第四预设阈值,以及大于第五预设阈值的情况下,所述第四号码为渠道异常行为特征对应的目标号码,所述第五预设阈值是基于目标放号量与预设百分比相乘得到的,所述目标放号量为所述第四号码所处的渠道在第二预设时间段内的放号量;
[0034]所述第一预设阈值、所述第二预设阈值、所述第三预设阈值、所述第四预设阈值和所述预设百分比,是基于所述指标数据确定的。
[0035]根据本专利技术提供的一种养卡识别方法,所述行为特征还包括沉默行为特征,所述沉默行为特征对应的目标号码基于如下方式确定:
[0036]确定所述待识别号码集中各待识别号码的通话主叫时长、通话被叫时长、使用流量;
[0037]从所述待识别号码集中确定出所述通话主叫时长小于或等于预设主叫时长阈值,且所述通话被叫时长小于或等于预设被叫时长阈值,且所述使用流量小于或等于预设流量阈值的第五号码,将所述第五号码作为所述沉默行为特征对应的目标号码;
[0038]其中,所述预设主叫时长阈值、所述预设被叫时长阈值和所述预设流量阈值是基于所述指标数据确定的。
[0039]根据本专利技术提供的一种养卡识别方法,所述行为特征还包括正常号码行为特征,所述正常号码行为特征对应的目标号码基于如下方式确定:
[0040本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种养卡识别方法,其特征在于,包括:基于样本号码集的指标数据,从待识别号码集中确定出行为特征对应的目标号码;基于所述目标号码,确定养卡号码;其中,所述行为特征包括联合养卡行为特征,所述联合养卡行为特征对应的目标号码是联合养卡群体对应的号码,所述联合养卡群体是基于所述待识别号码集的号码轨迹相似度和所述待识别号码集的号码轨迹相似度对应的相似度阈值,进行对比得到的;所述相似度阈值是基于所述样本号码集的号码轨迹相似度、所述指标数据和贪心算法的损失函数进行迭代训练得到的。2.根据权利要求1所述的养卡识别方法,其特征在于,所述相似度阈值基于如下方式迭代训练得到:确定当前迭代轮次的样本相似度阈值;基于所述样本号码集的号码轨迹相似度和所述样本相似度阈值,从所述样本号码集中确定出联合养卡社区对应的第一号码集和非联合养卡社区对应的第二号码集;基于所述第一号码集和所述第二号码集的指标距离,以及所述损失函数,对所述样本相似度阈值进行更新,得到下一迭代轮次的样本相似度阈值,并将所述下一迭代轮次作为所述当前迭代轮次,直至所述当前迭代轮次为最后的迭代轮次,以得到所述相似度阈值,所述指标距离是基于所述指标数据确定的。3.根据权利要求2所述的养卡识别方法,其特征在于,所述指标距离包括主被叫次数的距离、流量的距离和开机天数的距离中的至少一种。4.根据权利要求1所述的养卡识别方法,其特征在于,所述联合养卡群体基于如下方式确定:从所述待识别号码集中确定出当前对比轮次的第一待对比号码和第二待对比号码;基于所述第一待对比号码在第一预设时间段内所通信的第一基站的基站数、所述第二待对比号码在第一预设时间段内所通信的第二基站的基站数,以及所述第一待对比号码和所述第二待对比号码在第一预设时间段内所通信的共同基站的基站数,确定所述第一待对比号码和所述第二待对比号码的号码轨迹相似度,所述第一待对比号码和所述第二待对比号码的号码轨迹相似度包括所述共同基站与所述第一基站的相似度、所述共同基站与所述第二基站的相似度和所述共同基站的出现天数中的至少一种;将所述第一待对比号码和所述第二待对比号码的号码轨迹相似度与所述相似度阈值,进行对比得到对比结果;返回从所述待识别号码集中确定出当前对比轮次的第一待对比号码和第二待对比号码的步骤,直至所述当前对比轮次为最后的对比轮次;基于所述待识别号码集的各所述对比结果,确定所述联合养卡群体。5.根据权利要求1所述的养卡识别方法,其特征在于,所述行为特征还包括对端号码渠道集中行为特征,所述对端号码渠道集中行为特征对应的目标号码基于如下方式确定:确定所述待识别号码集中各待识别号码的对端号码,以及所述各待识别号码的对端号码所处的第一目标渠道;从所述各待识别号码集中确定出当前分析轮次的待分析号码,并基于所述各待识别号码的对端号码和所述第一目标渠道,确定所述待分析号码的对端号码在各渠道的号码数,
以及所述待分析号码的对端号码在各渠道的号码占比;在所述号码数和所述号码占比均满足第一预设条件的情况下,将所述待分析号码作为所述对端号码渠道集中行为特征对应的目标号码,所述第一预设条件是基于所述指标数据确定的;返回从所述各待识别号码集中确定出当前分析轮次的待分析号码的步骤,直至所述当前分析轮次为最后的分析轮次。6.根据权利要求1所述的养卡识别方法,其特征在于,所述行为特征还包括渠道异常行为特征,所述渠道异常行为特征对应的目标号码基于如下方式确定:确定所述待识别号码集中各待识别号码所处的第二目标渠道;基于所述各待识别号码、所述第二目标渠道和第二预设条件,确定所述渠道异常行为特征对应的目标号码;其中,所述第二预设条件包括以下至少一种:在同一渠道上且同一国际移动设备识别码IMEI的第一号码的号码数大...

【专利技术属性】
技术研发人员:彭文新陈雅娟陈辉张晓川杨旭谢伟斌麦健
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1