短信号码归属信息的识别方法、装置及存储介质制造方法及图纸

技术编号:20801261 阅读:33 留言:0更新日期:2019-04-06 15:06
本发明专利技术公开了一种短信号码归属信息的识别方法,包括如下步骤:提取若干个初始号码组成初始号码集;将初始号码的最后一位未经替换的字符替换为替代变量,得到替代号码;将重合度小于预设重合度的替代号码对应的初始号码放入中间号码集;将重合度不小于预设重合度的替代号码进行合并,将合并后的合并号码放入中间号码集;将中间号码集中的所有号码作为更新后的初始号码;迭代至所述中间号码集中的所有号码被替代变量替换的次数为N,选取迭代后得到的中间号码集中所有号码的前缀号码,作为输出号码集;识别输出号码集中各个前缀号码对应的归属信息。本发明专利技术公开的短信号码归属信息的识别方法能够判断大量短信号码的归属信息,提高用户的信息获取效率和准确度。

Recognition Method, Device and Storage Medium of Short Message Number Attribution Information

The invention discloses a method for identifying the attribution information of short message numbers, which comprises the following steps: extracting several initial numbers to form an initial set of numbers; replacing the last unsubstituted character of the initial number with an alternative variable to obtain an alternative number; putting the initial number corresponding to the substitute number whose coincidence degree is less than the preset coincidence degree into the intermediate set; and putting the coincidence degree into the intermediate set of numbers; The substitution numbers with preset coincidence degree are merged, and the merged numbers are put into the intermediate number set; all the numbers in the intermediate number set are taken as the updated initial numbers; the number of times that all the numbers in the iteration to the intermediate number set are replaced by the substitution variables is N, and the prefix numbers of all the numbers in the intermediate number set obtained after the iteration are selected as the output number set; Do not output the attribution information corresponding to each prefix number in the set of numbers. The method for identifying the attribution information of short message numbers disclosed by the invention can judge the attribution information of a large number of short message numbers and improve the efficiency and accuracy of information acquisition of users.

【技术实现步骤摘要】
短信号码归属信息的识别方法、装置及存储介质
本专利技术涉及短信号码识别
,尤其涉及一种短信号码归属信息的识别方法、装置及存储介质。
技术介绍
随着大数据技术的发展,用户收到的来自各个企业的推送短信也日益增多。在现有技术中,短信是由短代或运营商进行发出的,当用户收到短信时,移动终端显示的短信来源都是一个具体的号码,导致用户无法确认该短信的来源,也无法判断该短信的来源是否与短信内容相符。
技术实现思路
本专利技术实施例提供一种短信号码归属信息的识别方法,能够判断大量短信号码的归属信息,提高用户的信息获取效率和准确度。本专利技术实施例一提供一种短信号码归属信息的识别方法,包括如下步骤:S1:提取若干个初始号码组成初始号码集;S2:将所述初始号码的最后一位未经替换的字符替换为替代变量,得到替代号码;将所述替代号码放入替代号码集;将所述替代号码集中重合度小于预设重合度的替代号码对应的初始号码放入中间号码集;将所述替代号码集中重合度不小于预设重合度的替代号码进行合并,将合并后的合并号码放入中间号码集;将所述中间号码集中的所有号码作为更新后的初始号码;S3:对步骤S2进行迭代,直至所述中间号码集中的所有号码被替代变量替换的次数为N,选取迭代后得到的中间号码集中所有号码的前缀号码,作为输出号码集;其中,N为不小于零的整数,所述前缀号码为排列在所述替代变量之前的号段;S4:识别所述输出号码集中各个前缀号码对应的归属信息。作为上述方案的改进,所述重合度具体为:在所述替代号码集中,未经所述替代变量替换的号段相同的替代号码出现的频数。作为上述方案的改进,步骤S1还包括:将所述初始号码集拆分为若干个子初始号码集,将所述若干个子初始号码集分别分配至多个处理模块中,并将各个所述子初始号码集中的号码更新为各个处理模块的初始号码。本专利技术实施例二对应提供了一种短信号码归属信息的识别装置,包括:处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如本专利技术实施例一所述的短信号码归属信息的识别方法。本专利技术实施例三对应提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如本专利技术实施例一所述的短信号码归属信息的识别方法。本专利技术实施例提供的一种短信号码归属信息的识别方法、装置及存储介质与现有技术相比,具有如下有益效果:基于重合度的判断通过迭代的方法对大量的号码进行有选择性地合并,能够判断大量短信号码的归属信息,提高用户的信息获取效率和准确度,从而缩短了用户确认该短信的来源的时间,并能够在收到短信的同时判断该短信号码的归属信息是否与短信内容相符,避免因无法判断短信归属而无法判断诈骗短信和垃圾短信造成用户的损失。附图说明图1是本专利技术实施例一提供的一种短信号码归属信息的识别方法的流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,是本专利技术一实施例提供的一种短信号码归属信息的识别方法的流程示意图,包括以下步骤:S1:提取若干个初始号码组成初始号码集;S2:将初始号码的最后一位未经替换的字符替换为替代变量,得到替代号码;将替代号码放入替代号码集;将替代号码集中重合度小于预设重合度的替代号码对应的初始号码放入中间号码集;将替代号码集中重合度不小于预设重合度的替代号码进行合并,将合并后的合并号码放入中间号码集;将中间号码集中的所有号码作为更新后的初始号码;S3:对步骤S2进行迭代,直至中间号码集中的所有号码被替代变量替换的次数为N,选取迭代后得到的中间号码集中所有号码的前缀号码,作为输出号码集;其中,N为不小于零的整数,前缀号码为排列在替代变量之前的号段;S4:识别输出号码集中各个前缀号码对应的归属信息。进一步的,重合度具体为:在替代号码集中,未经替代变量替换的号段相同的替代号码出现的频数。进一步的,步骤S1还包括:将初始号码集拆分为若干个子初始号码集,将若干个子初始号码集分别分配至多个处理模块中,并将各个子初始号码集中的号码更新为各个处理模块的初始号码。在一个具体的实施例中,企业发送短信是使用企业某一专属号段+随机几位号码的方式进行发送,初始号码集为:{100085126,100085215,100085428,100085691,100085688,1069111243,1069111293,1069111241,1069111249,1069111783,1069111747,1069111764,1022158197},替代变量为X,预设的重合度为4,N为3。执行步骤S2,可得替代号码集{1008512X,10008521X,10008542X,10008569X,10008568X,106911124X,106911129X,106911124X,106911124X,106911178X,106911174X,106911176X,102215819X},此时替代号码集中不存在重合度不小于4的替代号码,将替代号码放入中间号码集,并将中间号码集中的所有号码作为更新后的初始号码。执行步骤S3,对步骤S2进行第一次迭代,得到{1000851X6,1000852X5,1000854X8,1000856X1,1000856X8,10691112X3,10691112X3,10691112X1,10691112X9,10691117X3,10691117X7,10691117X4,10221581X7},此时对替代号码集中重合度大于预设重合度的替代号码进行合并,合并后的合并号码为10691112XX,进一步可以得到中间号码集{10691112XX,100085126,100085215,100085428,100085691,100085688,1069111783,1069111747,1069111764,1022158197}。将上一中间号码集中的号码更新为初始号码,进行第二次迭代,得到{1069111XXX,100085X26,100085X15,100085X28,100085X91,100085X88,1069111X83,1069111X47,1069111X64,1022158X97},此时对替代号码集中重合度大于预设重合度的替代号码进行合并,合并后的合并号码为1069111XXX和100085XXX,进一步可以得到中间号码集{1069111XXX,100085XXX,1022158197}。此时,中间号码集中的所有号码被替代变量替换的次数已到达3次。选取中间号码集{1069111XXX,100085XXX,1022158197}中所有号码的前缀号码,得到输出号码集{1069111,100085,1022158197}。识别号码1069111,100085,1022158197对应的归属信息,该归属信息可以为企业,例如xx通讯集团有限公司,xx银行,本文档来自技高网...

【技术保护点】
1.一种短信号码归属信息的识别方法,其特征在于,包括如下步骤:S1:提取若干个初始号码组成初始号码集;S2:将所述初始号码的最后一位未经替换的字符替换为替代变量,得到替代号码;将所述替代号码放入替代号码集;将所述替代号码集中重合度小于预设重合度的替代号码对应的初始号码放入中间号码集;将所述替代号码集中重合度不小于预设重合度的替代号码进行合并,将合并后的合并号码放入中间号码集;将所述中间号码集中的所有号码作为更新后的初始号码;S3:对步骤S2进行迭代,直至所述中间号码集中的所有号码被替代变量替换的次数为N,选取迭代后得到的中间号码集中所有号码的前缀号码,作为输出号码集;其中,N为不小于零的整数,所述前缀号码为排列在所述替代变量之前的号段;S4:识别所述输出号码集中各个前缀号码对应的归属信息。

【技术特征摘要】
1.一种短信号码归属信息的识别方法,其特征在于,包括如下步骤:S1:提取若干个初始号码组成初始号码集;S2:将所述初始号码的最后一位未经替换的字符替换为替代变量,得到替代号码;将所述替代号码放入替代号码集;将所述替代号码集中重合度小于预设重合度的替代号码对应的初始号码放入中间号码集;将所述替代号码集中重合度不小于预设重合度的替代号码进行合并,将合并后的合并号码放入中间号码集;将所述中间号码集中的所有号码作为更新后的初始号码;S3:对步骤S2进行迭代,直至所述中间号码集中的所有号码被替代变量替换的次数为N,选取迭代后得到的中间号码集中所有号码的前缀号码,作为输出号码集;其中,N为不小于零的整数,所述前缀号码为排列在所述替代变量之前的号段;S4:识别所述输出号码集中各个前缀号码对应的归属信息。2.如权利要求1所述的一种短信号码归属信息的识别方法,其...

【专利技术属性】
技术研发人员:段雨洛吴小山屈金强
申请(专利权)人:珠海市小源科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1