一种基于风险识别的信息处理方法及装置制造方法及图纸

技术编号:13332767 阅读:44 留言:0更新日期:2016-07-12 02:09
本申请公开了一种基于风险识别的信息处理方法及装置,该方法包括:将待识别信息中包含的字符划分成不同的字符集合,分别确定各字符集合对应的分量风险值,根据各字符集合对应的分量风险值,确定所述待识别信息的综合风险值,根据所述综合风险值,对所述待识别信息进行处理。本申请将待识别信息中含有相应含义的字符划分成不同的字符集合,确定了各字符集合分别对应的分量风险值后,就可以准确确定该待识别信息对应的综合风险值,而不依赖于主观判断,在确定各字符集合对应的分量风险值时,由预先保存的已识别信息作为基础,因而可以更准确地反映出待识别信息的实际价值度。

【技术实现步骤摘要】

本申请涉及计算机
,尤其涉及一种基于风险识别的信息处理方法及装置
技术介绍
随着信息技术的发展,用户所使用的通信设备中的移动用户号码薄号码(MobileDirectoryNumber,MDN,也即手机号码),已经成为一种重要的用户身份标识信息,用户不仅可以使用该号码进行注册、登录等操作,还可以将该号码与相应的网络账户绑定,以进行验证等重要网络操作。目前,用户所使用的手机号码有被盗取的风险,被盗取的手机号码将对用户的网络操作产生极大威胁,易造成用户的损失。现有技术中,对于在网站中注册或绑定的手机号码而言,服务器会对用户的手机号码进行风险识别,以确定出手机号码被盗取的风险大小,从而进行相应的风险防控措施。对手机号码进行风险识别,通常有两种方法:一种是对手机号码进行价值度识别。另一种是对手机号码进行危险度识别。对手机号码进行价值度识别,一般是根据手机号码中所包含的数字的顺序、含义,推断出该手机号码的价值度,通常,手机号码中出现较多连续的数字,或重复出现相同的数字,则其价值度较高,如:手机号码出现连号:13912345678,或出现重号:13888886666,这样的手机号码的价值度往往高于普通手机号码。价值度较高的手机号码易被作为盗取对象,所以,将针对价值度较高的手机号码进行相应风控操作,如:提升安全监控级别等。对手机号码进行危险度识别,一般是监测与某一手机号码相绑定的账户,是否出现过违规操作(如:盗用他人账户或其他恶意网络行为等),如果出现,则将该手机号码标定为高危险度手机号码,并针对该高危险度手机号码进行相应风控操作,如:记录为黑名单号码,阻止该手机号码进行绑定或注册。但是,上述对手机号码进行识别的方法仍存在缺陷。具体地:对手机号码进行价值度识别,通常依赖于主观判断,以手机号码中数字的含义来判定手机号码的价值度,不具有规范的判定标准,不能充分、准确地反映出手机号码的实际价值度。对手机号码进行危险度识别,标定为高危险度的手机号码,可能被用户丢弃,并在一定时间后,被电信运营商回收,再次分配给其他用户继续使用,由于该手机号码已被网络运营商记录为黑名单,那么,新分配到该手机号码的用户,将不能在相应的网站上进行注册或绑定,造成误判,严重影响用户的网络操作。
技术实现思路
本申请实施例提供一种基于风险识别的信息处理方法及装置,用以解决对信息的风险识别准确性较差的问题。本申请实施例提供的一种基于风险识别的信息处理方法,包括:将待识别信息中包含的字符划分成不同的字符集合;分别确定各字符集合对应的分量风险值;根据各字符集合对应的分量风险值,确定所述待识别信息的综合风险值;根据所述综合风险值,对所述待识别信息进行处理。本申请实施例提供的一种基于风险识别的信息处理装置,包括:字符划分模块,用于将待识别信息中包含的字符划分成不同的字符集合;分量风险值模块,用于分别确定各字符集合对应的分量风险值;综合风险值模块,用于根据各字符集合对应的分量风险值,确定所述待识别信息的综合风险值;处理模块,用于根据所述综合风险值,对所述待识别信息进行处理。本申请实施例提供一种基于风险识别的信息处理方法及装置,将待识别信息中含有相应含义的字符划分成不同的字符集合,确定了各字符集合分别对应的分量风险值后,就可以准确确定该待识别信息对应的综合风险值,而不依赖于主观判断,在确定各字符集合对应的分量风险值时,由预先保存的已识别信息作为基础,因而可以更准确地反映出待识别信息的实际价值度。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本申请实施例提供的基于风险识别的信息处理过程示意图;图2为本申请实施例提供的确定各字符集合对应的分量风险值时方法一的过程示意图;图3本申请实施例提供的确定各字符集合对应的分量风险值时方法二的过程示意图;图4本申请实施例提供的确定各字符集合对应的分量风险值时方法三的过程示意图;图5为本申请实施例提供的基于风险识别的信息处理装置结构示意图;图6为本申请实施例提供的确定第一分量风险值时分量风险值模块的结构示意图;图7为本申请实施例提供的确定第二分量风险值时分量风险值模块的结构示意图;图8为本申请实施例提供的确定第三分量风险值时分量风险值模块的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为本申请实施例提供的基于风险识别的信息处理过程,该过程具体包括以下步骤:S101:将待识别信息中包含的字符划分成不同的字符集合。在本申请实施例的场景中,用户注册了账户信息(如:网络账户)后,会将该用户自身的用户信息与该账户信息进行绑定,用以在相应操作时进行识别认证。故本申请实施例中的所述待识别信息,具体为:与账户信息相绑定的、用于进行认证识别的用户信息。该待识别信息包括但不限于:用户的手机号码、证件号码等。通常,上述待识别信息中所包含的字符具有一定的含义。以手机号码为例:11位手机号码13812348888中,前三位数字“138”代表手机号码的属性类型,通过这三位数字,可以确定出该手机号码所属的电信运营商以及相应的业务类型。第四至七位的四位数字“1234”,为归属位置寄存器(HomeLocationRegister,HLR)识别码,通过这四位数字,可以确定出该手机号码对应的用户信息(如:手机号码的归属位置信息、呼叫优先级信息等)。最后四位数字“8888”,代表用户编号,通过这四位数字,可以确定具体的某一用户。可见,对于手机号码而言,其中包含的数字具有相应的含义。因此,在上述步骤S101中,可以将待识别信息中具有一定含义的字符划分成不同的字符集合。需要说明的是,在上述步骤S101中,将字符划分成字符集合的方式,具体可以是,将待识别信息中指定位置上的字符,分入一个字符集合。那么,针对所述待识别信息中不同指定位置上的字符,将这些字符分入不同的字符集合,便得到多个不同的字符集合。本文档来自技高网
...

【技术保护点】
一种基于风险识别的信息处理方法,其特征在于,包括:将待识别信息中包含的字符划分成不同的字符集合;分别确定各字符集合对应的分量风险值;根据各字符集合对应的分量风险值,确定所述待识别信息的综合风险值;根据所述综合风险值,对所述待识别信息进行处理。

【技术特征摘要】
1.一种基于风险识别的信息处理方法,其特征在于,包括:
将待识别信息中包含的字符划分成不同的字符集合;
分别确定各字符集合对应的分量风险值;
根据各字符集合对应的分量风险值,确定所述待识别信息的综合风险值;
根据所述综合风险值,对所述待识别信息进行处理。
2.如权利要求1所述的方法,其特征在于,将待识别信息中包含的字符
划分成不同的字符集合,具体包括:
将待识别信息中指定位置上的字符,分入一个字符集合,其中,各字符集
合的合集包含待识别信息中的所有字符,至少两个字符集合存在交集。
3.如权利要求1所述的方法,其特征在于,分别确定各字符集合对应的
分量风险值,具体包括:
按照所述待识别信息中各字符的先后顺序,将所述字符集合中的字符进行
排列,得到该字符集合对应的字符序列;
在预先保存的各已识别的正常信息中,确定具有相同字符序列的信息的占
比,作为第一占比;
在预先保存的各已识别的非正常信息中,确定具有相同字符序列的信息的
占比,作为第二占比;
确定所述第一占比与所述第二占比的比值;
根据所述比值确定所述字符集合对应的第一分量风险值。
4.如权利要求3所述的方法,其特征在于,根据所述比值确定所述字符
集合对应的第一分量风险值,具体包括:
确定所述比值的对数值;
根据所述对数值确定所述字符集合对应的第一分量风险值。
5.如权利要求4所述的方法,其特征在于,根据所述对数值确定所述字
符集合对应的第一分量风险值,具体包括:
将所述对数值与预设的调节常数之和,作为所述字符集合对应的第一分量
风险值。
6.如权利要求1所述的方法,其特征在于,分别确定各字符集合对应的
分量风险值,具体包括:
按照所述待识别信息中各字符的先后顺序,将所述字符集合中的字符进行
排列,得到该字符集合对应的字符序列;
在预先保存的各已识别信息中,确定含有该字符序列的已识别信息对应的
各账户信息;
确定各账户信息的业务等级;
根据各账户信息的业务等级,统计不同业务等级的账户信息的数量;
在各账户信息中,分别确定不同业务等级的账户信息的占比;
根据各账户信息的业务等级,以及不同业务等级的账户信息的占比,确定
所述字符集合对应的第二分量风险值。
7.如权利要求1所述的方法,其特征在于,分别确定各字符集合对应的
分量风险值,具体包括:
按照所述待识别信息中各字符的先后顺序,将所述字符集合中的字符进行
排列,得到该字符集合对应的字符序列;
识别所述字符序列中的特征字符;
当识别出特征字符时,确定该特征字符的权重值和特征值;
根据所述特征字符的权重值和特征值,确定所述字符集合对应的第三分量
风险值;
其中,所述特征字符包括重复字符和/或顺序字符。
8.如权利要求7所述的方法,其特征在于,确定该特征字符的权重值和
特征值,具体包括:
确定所述特征字符出现在该字符序列中的概率;
根据该概率确定所述特征字符的权重值;
针对所述特征字符进行分词,得到字符单元;
根据得到的字符单元的数量,确定所述特征字符的特征值。
9.如权利要求1所述的方法,其特征在于,所述待识别信息具体为:待
识别手机号码;
所述字符集合具体为:由所述待识别手机号码中包含的若干数字所构成的
数字集合。
10.如权利要求9所述的方法,其特征在于,将待识别身份信息中包含的
字符划分成不同的字符集合,具体包括:
将待识别的手机号码中包含的前三位数字,划分成第一字符集合;
将待识别的手机号码中包含的前七位数字,划分成第二字符集合;
将待识别的手机号码中包含的后八位数字,划分成第三字符集合。
11.如权利要求10所述的方法,其特征在于,分别确定各字符集合对应
的分量风险值,具体包括:
针对第一字符集合,按照所述待识别手机号码中各数字的先后顺序,将所
述第一字符集合中的数字进行排列,得到该第一字符集合对应的第一数字序列;
采用公式确定所述第一字符集合对应的第一分量风险值;
其中,S1为所述第一字符集合对应的第一分量风险值;
p1为:在预先保存的各已识别的正常手机号码中,含有第一数字序列的手
机号码的占比;
p2为:在预先保存的各已识别的非正常手机号码中,含有第一数字序列的
手机号码的占比;
C为预设的调节常数值。
12.如权利要求10所述的方法,其特征在于,分别确定各字符集合对应
的分量风险值,具体包括:
针对第二字符集合,按照所述待识别手机号码中各数字的先后顺序,将所
述第二字符集合中的数字进行排列,得到该第二字符集合对应的第二数字序列;
在预先保存的各已识别信息中,确定含有该第二数字序列的已识别手机号
码对应的各账户信息;
确定各账户信息的业务等级;
采用公式S2=∑(w(i)*Prob(i))确定所述第二字符集合对应的第
二分量风险值;
其中,S2为所述第二字符集合对应的第二分量风险值;
w(i)表示:确定的各业务等级中的第i种业务等级为w(i);
Prob(i)为:第i种业务等级的账户信息在确定的各账户信息中的占比。
13.如权利要求10所述的方法,其特征在于,分别确定各字符集合对应
的分量风险值,具体包括:
针对第三字符集合,按照所述待识别手机号码中各数字的先后顺序,将所
述第三字符集合中的数字进行排列,得到该第三字符集合对应的第三数字序列;
识别第三数字序列中的重复数字和/或顺序数字;
当识别出重复数字时,针对所述重复数字进行分词,得到不同的数字单元,
采用公式确定所述重复数字的特征值;
其中,Sc为重复数字的特征值;
tfj为对重复数字进行分词后,得到的字符单元的数量;
j表示第j种分词方法,且采用第j种分词方法得到的每个数字单元中包含
的字符的数量均为j;
n为该重复数字中包含的数字的数量;
当识别出顺序数字时,确定该顺序数字中包含的字符的数量,采用公式
Ss(n′)=Sc(n′-1)确定所述顺序数字的特征值;
其中,Ss为顺序数字的特征值;
n’为所述顺序数字中包括的字符的数量;
采用公式S3=w(Sc+Ss+1)确定所述第三字符集合对应的第三分量风
险值;
其中,S3为所述第三字符集合对应的第三分量风险值;
w为识别出的所述重复数字和顺序数字出现在第三数字序列中的概率值的
倒数。
14.如权利要求1~13任一所述的方法,其特征在于,根据各字符集合对
应的分量风险值,确定所述待识别信息的综合风险值,具体包括:
将所述各字符集合对应的分量风险值进行几何平均,得到所述待识别信息
的综合风险值。
15.一种基于风险识别的信息处理装置,其特征在于,包括:
字符划分...

【专利技术属性】
技术研发人员:郑丹丹林述民
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1