【技术实现步骤摘要】
仿冒号码识别方法、装置和计算机可读存储介质
本专利技术涉及数据处理领域,特别涉及一种仿冒号码识别方法、装置和计算机可读存储介质。
技术介绍
近年来,仿冒公检法、运营商、银行、快递号码的仿冒号码类诈骗在电信诈骗中占了很大比例,同时诈骗金额巨大,社会影响恶劣。仿冒号码类诈骗通常都是在国外发起呼叫,通过修改主叫号码,使得号码的后面几位与国内号码一样或者类似来迷惑用户,进而实施诈骗。相关技术中采用的仿冒算法通常是利用号码的左匹配和右匹配或者精确匹配,召回率较低。
技术实现思路
专利技术人对相关技术进行分析后发现,一个国际通话通常要经过几个国家及运营商的电信网络,在沿途网络号码规范过程中,主叫号码通常会发生一些变化,因此这些方法的识别效果较差。本专利技术实施例所要解决的一个技术问题是:提高仿冒号码识别的召回率。根据本专利技术一些实施例的第一个方面,提供一种仿冒号码识别方法,包括:检测待识别号码与被仿号码库中用户号码字段的最长用户号码公共子串以及相应的匹配号码的匹配用户号码字段 ...
【技术保护点】
1.一种仿冒号码识别方法,包括:/n检测待识别号码与被仿号码库中用户号码字段的最长用户号码公共子串以及相应的匹配号码的匹配用户号码字段;/n检测待识别号码与匹配号码的区号字段的最长区号公共子串;/n根据最长用户号码公共子串与匹配用户号码字段的用户号码相似度、最长区号公共子串与匹配号码的区号字段的区号相似度计算待识别号码与所述匹配号码的相似度;/n根据相似度和预设的仿冒号码阈值范围确定待识别号码是否为仿冒号码。/n
【技术特征摘要】
1.一种仿冒号码识别方法,包括:
检测待识别号码与被仿号码库中用户号码字段的最长用户号码公共子串以及相应的匹配号码的匹配用户号码字段;
检测待识别号码与匹配号码的区号字段的最长区号公共子串;
根据最长用户号码公共子串与匹配用户号码字段的用户号码相似度、最长区号公共子串与匹配号码的区号字段的区号相似度计算待识别号码与所述匹配号码的相似度;
根据相似度和预设的仿冒号码阈值范围确定待识别号码是否为仿冒号码。
2.根据权利要求1所述的仿冒号码识别方法,其中,根据用户号码相似度以及用户号码权重、区号相似度以及区号权重计算待识别号码与所述匹配号码的相似度。
3.根据权利要求1所述的仿冒号码识别方法,其中,检测待识别号码中所述最长用户号码公共子串之前的部分与匹配的用户号码字段对应的区号字段的最长区号公共子串。
4.根据权利要求1~3中任一项所述的仿冒号码识别方法,其中,所述根据相似度和预设的仿冒号码阈值范围确定待识别号码是否为仿冒号码包括:
在所述相似度属于仿冒号码阈值范围、并且所述最长用户号码公共子串的首位不位于所述匹配用户号码字段的首位的情况下,判定所述待识别号码不为仿冒号码。
5.一种仿冒号码识别装置,包括:
最长用户号码公共子串检测模块,被配置为检测待识别号码与被仿号码库中用户号码字段的最长用户号码公共子串以及相应的匹配号码的匹配用户号码字段;
最长区号公共子串检测模块,被配置为检测待识别号码与匹配号码的...
【专利技术属性】
技术研发人员:张慧嫦,李力卡,赖琮霖,许盛宏,张青,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。