一种号码的识别方法、装置及可读存储介质制造方法及图纸

技术编号:37291448 阅读:13 留言:0更新日期:2023-04-21 03:22
本发明专利技术提供一种号码的识别方法、装置及可读存储介质,所述方法包括:获取欺诈号码黑名单以及正常号码白名单;将所述黑名单中的欺诈号码以及白名单中的正常号码作为种子数据,根据预先获得的图数据库提取每个种子数据对应的特征;基于提取的特征训练分类模型,得到训练好的分类模型;根据预先设置的专家规则对所述分类模型得到的正常号码节点的通信结构进行分析,得到正常号码通信图谱;基于所述正常号码通信图谱对待识别号码进行识别。该方法、装置及可读存储介质能够解决现有的识别方法存在误判误检的情形,容易影响用户感知的问题。题。题。

【技术实现步骤摘要】
表示x1对应的权重,ω
n
表示x
n
对应的权重,b为偏差系数,y为对应的类别。
[0017]进一步地,所述根据预先设置的专家规则对所述分类模型得到的正常号码节点的通信结构进行分析,得到正常号码通信图谱,具体包括:
[0018]基于所述分类模型提取出图数据库中类别为正常号码的节点以及相邻关系的节点;
[0019]根据所述专家规则对提取出的类别为正常号码的节点以及相邻关系的节点的通信结构进行分析,得到所述正常号码通信图谱。
[0020]进一步地,所述基于所述正常号码通信图谱对待识别号码进行识别,具体包括:
[0021]若所述待识别号码位于所述正常号码通信图谱中,则确定所述待识别号码为正常号码。
[0022]进一步地,所述方法还包括:
[0023]根据所述正常号码通信图谱扩充所述白名单。
[0024]第二方面,本专利技术提供一种号码的识别装置,包括:
[0025]黑白名单获取模块,用于获取欺诈号码黑名单以及正常号码白名单;
[0026]特征提取模块,与所述黑白名单获取模块连接,用于将所述黑名单中的欺诈号码以及白名单中的正常号码作为种子数据,根据预先获得的图数据库提取每个种子数据对应的特征;
[0027]分类模型训练模块,与所述特征提取模块连接,用于基于提取的特征训练分类模型,得到训练好的分类模型;
[0028]通信图谱生成模块,与所述分类模型训练模块连接,用于根据预先设置的专家规则对所述分类模型得到的正常号码节点的通信结构进行分析,得到正常号码通信图谱;
[0029]号码识别模块,与所述通信图谱生成模块连接,用于基于所述正常号码通信图谱对待识别号码进行识别。
[0030]第三方面,本专利技术提供一种号码的识别装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现上述第一方面所述的号码的识别方法。
[0031]第四方面,本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的号码的识别方法。
[0032]本专利技术提供的号码的识别方法、装置及可读存储介质,首先获取欺诈号码黑名单以及正常号码白名单;并将所述黑名单中的欺诈号码以及白名单中的正常号码作为种子数据,根据预先获得的图数据库提取每个种子数据对应的特征;然后基于提取的特征训练分类模型,得到训练好的分类模型;再根据预先设置的专家规则对所述分类模型得到的正常号码节点的通信结构进行分析,得到正常号码通信图谱;最后基于所述正常号码通信图谱对待识别号码进行识别。本申请通过图数据库对正常用户号码的通信行为特征进行研究,能够得到正常号码通信图谱,通过正常号码通信图谱能够实现正常号码的识别,降低在欺诈识别场景中的误判率,提升用户感知,解决了现有的识别方法存在误判误检的情形,容易影响用户感知的问题。
附图说明
[0033]图1为本专利技术实施例1的一种号码的识别方法的流程图;
[0034]图2为本专利技术实施例2的一种号码的识别装置的结构示意图;
[0035]图3为本专利技术实施例3的一种号码的识别装置的结构示意图。
具体实施方式
[0036]为使本领域技术人员更好地理解本专利技术的技术方案,下面将结合附图对本专利技术实施方式作进一步地详细描述。
[0037]可以理解的是,此处描述的具体实施例和附图仅仅用于解释本专利技术,而非对本专利技术的限定。
[0038]可以理解的是,在不冲突的情况下,本专利技术中的各实施例及实施例中的各特征可相互组合。
[0039]可以理解的是,为便于描述,本专利技术的附图中仅示出了与本专利技术相关的部分,而与本专利技术无关的部分未在附图中示出。
[0040]可以理解的是,本专利技术的实施例中所涉及的每个单元、模块可仅对应一个实体结构,也可由多个实体结构组成,或者,多个单元、模块也可集成为一个实体结构。
[0041]可以理解的是,在不冲突的情况下,本专利技术的流程图和框图中所标注的功能、步骤可按照不同于附图中所标注的顺序发生。
[0042]可以理解的是,本专利技术的流程图和框图中,示出了按照本专利技术各实施例的系统、装置、设备、方法的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可代表一个单元、模块、程序段、代码,其包含用于实现规定的功能的可执行指令。而且,框图和流程图中的每个方框或方框的组合,可用实现规定的功能的基于硬件的系统实现,也可用硬件与计算机指令的组合来实现。
[0043]可以理解的是,本专利技术实施例中所涉及的单元、模块可通过软件的方式实现,也可通过硬件的方式来实现,例如单元、模块可位于处理器中。
[0044]实施例1:
[0045]本实施例提供一种号码的识别方法,如图1所示,该方法包括:
[0046]步骤S101:获取欺诈号码黑名单以及正常号码白名单。
[0047]在本实施例中,黑名单中存储有事先通报的欺诈号码,白名单中存储有高忠诚度高价值套餐的正常号码。电信运营商可以定时或不定时的将已知的欺诈号码保存至黑名单,将高忠诚度高价值套餐的正常号码保存至白名单中。
[0048]步骤S102:将所述黑名单中的欺诈号码以及白名单中的正常号码作为种子数据,根据预先获得的图数据库提取每个种子数据对应的特征。
[0049]在本实施例中,以黑名单中的欺诈号码以及白名单中的正常号码作为种子数据,提取每一个数据的特征,提取的特征如表1所示,包括:对端是否为欺诈号码、对端是否为疑似欺诈号码、对端是否为正常号码、出度、入度以及最小共同邻居数。
[0050]表1,提取的特征
[0051][0052]其中,“对端是否为欺诈号码”表示当前号码的对端号码是否为黑名单中的欺诈号码,取值为{0,1},1代表是,0代表不是;“对端是否为疑似欺诈号码”表示当前号码的对端号码是否为黑名单中的疑似欺诈号码,取值为{0,1},1代表是,0代表不是;“对端是否为正常号码”表示当前号码的对端号码是否为白名单中的号码,取值为{0,1},1代表是,0代表不是;“出度”表示相应号码作为主叫拨出的电话次数;“入度”表示相应号码作为被叫接听的电话次数;“最小共同邻居数”表示相应号码与图数据库中相邻号码节点的最小共同邻居数,如A与B有通话关系,B与C有通话关系,A与C有通话关系,那么A的最小共同邻居数为1。
[0053]可选地,所述将所述黑名单中的欺诈号码以及白名单中的正常号码作为种子数据,根据预先获得的图数据库提取每个种子数据对应的特征之前,所述方法还可以包括:
[0054]采集所有手机号码对应的通话话单数据,所述通话话单数据包括主叫号码、被叫号码、通话日期和归属地;
[0055]以所述通话话单数据中的主叫号码、被叫号码作为实体,所述归属地作为实体的属性,以通话行为作为关系,所述通话日期作为通话关系的属性,将通话话单数据存储至所述图数据库中。
[0056]在本实施例中,为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种号码的识别方法,其特征在于,包括:获取欺诈号码黑名单以及正常号码白名单;将所述黑名单中的欺诈号码以及白名单中的正常号码作为种子数据,根据预先获得的图数据库提取每个种子数据对应的特征;基于提取的特征训练分类模型,得到训练好的分类模型;根据预先设置的专家规则对所述分类模型得到的正常号码节点的通信结构进行分析,得到正常号码通信图谱;基于所述正常号码通信图谱对待识别号码进行识别。2.根据权利要求1所述的方法,其特征在于,所述将所述黑名单中的欺诈号码以及白名单中的正常号码作为种子数据,根据预先获得的图数据库提取每个种子数据对应的特征之前,所述方法还包括:采集所有手机号码对应的通话话单数据,所述通话话单数据包括主叫号码、被叫号码、通话日期和归属地;以所述通话话单数据中的主叫号码、被叫号码作为实体,所述归属地作为实体的属性,以通话行为作为关系,所述通话日期作为通话关系的属性,将通话话单数据存储至所述图数据库中。3.根据权利要求2所述的方法,其特征在于,所述提取的特征包括:对端是否为欺诈号码、对端是否为疑似欺诈号码、对端是否为正常号码、出度、入度以及最小共同邻居数,其中,所述出度表示相应号码作为主叫拨出的电话次数,所述入度表示相应号码作为被叫接听的电话次数,所述最小共同邻居数表示相应号码与所述图数据库中相邻号码节点的最小共同邻居数。4.根据权利要求3所述的方法,其特征在于,所述分类模型符合如下公式:y=ω1x1+


n
x
n
+b其中,n为提取的特征总数,x1表示第1个提取的特征,x
n
表示第n个提取的特征,ω1表示x1对应的权重,ω
n
表示x
n
对应的权重,b为偏差系数,y为对应的类别。5.根据权利要求1所述的方法...

【专利技术属性】
技术研发人员:张立彤侯洁琼徐雷万翔宇白肖璇刘杰柯阳
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1