一种基于移动终端数据的用户异常行为检测方法技术

技术编号:21089359 阅读:21 留言:0更新日期:2019-05-11 09:53
本发明专利技术涉及一种基于移动终端数据的用户异常行为检测方法,包括:步骤S100,获取H个用户的移动终端数据集合X=[X1,X2,...,XH],其中Xi=[Xi1,Xi2,…,Xim]

A User Abnormal Behavior Detection Method Based on Mobile Terminal Data

【技术实现步骤摘要】
一种基于移动终端数据的用户异常行为检测方法
本专利技术涉及信息处理技术,尤其涉及一种用户终端信息的处理方法。
技术介绍
同类型群体的异常行为检测,一方面有利于个体的异常提醒,便于个体及时调整生活和工作作息等,另一方面,也可以从该群体中识别出区别于同类人员的不同行为,便于在实际生活和工作环境中进行预警。然而现有的异常行为检测方法对个体的历史数据和群体的历史平均数据等的依赖性较强,且由于所述群体的历史平均数据通常为固定值,因此无法适应同类群体中人员行为的趋势性行为变化,很容易将新的非异常行为判定为异常行为,导致异常行为识别效率低。
技术实现思路
为解决上述技术问题,本专利技术公开了一种基于移动终端数据的用户异常行为检测方法,包括:步骤S100,获取H个用户的移动终端数据集合X=[X1,X2,...,XH],其中Xi=[Xi1,Xi2,…,Xim]T为第i个用户的移动终端数据,包括m个特征数值,所述m个特征包括以下任一项或其任意组合:所述移动终端安装的软件类型数量、每种软件类型的APP安装数量、所述APP使用频率、所述APP使用开始时间、所述APP使用结束时间,1≤i≤H,m≥1;步骤S200,根据所述数据集合X获取所述H个用户的行为异常值G=[G1,G2,…,GH],其中Gi为第i个用户的行为异常值;步骤S300,基于Gi获取第i个用户的行为异常概率Pi,如果Pi大于第一判断阈值T,则将H个用户中的第i个用户判断为异常用户。附图说明图1是本专利技术基于移动终端数据的用户异常行为检测方法的流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,将结合附图对本专利技术作进一步地详细描述。这种描述是通过示例而非限制的方式介绍了与本专利技术的原理相一致的具体实施方式,这些实施方式的描述是足够详细的,以使得本领域技术人员能够实践本专利技术,在不脱离本专利技术的范围和精神的情况下可以使用其他实施方式并且可以改变和/或替换各要素的结构。因此,不应当从限制性意义上来理解以下的详细描述。本专利技术公开了一种基于移动终端数据的用户异常行为检测方法,其中本领域技术人员可以理解,所述移动终端可以为手机、PAD等智能终端,且所述移动终端的具体类型不影响本专利技术的保护范围。此外,在移动终端中,设置有用于获取所述移动终端状态信息(安装的APP、APP使用频率/间隔、APP启动时间以及APP关闭时间等)的接口,本领域技术人员可以理解,通过调用所述接口可以获取所述移动终端的APP安装情况、APP使用频率/间隔、APP启动时间以及APP关闭时间等。图1是本专利技术基于移动终端数据的用户异常行为检测方法流程图,如图1所示,该方法包括:步骤S100,获取H个用户的移动终端数据集合X=[X1,X2,...,XH],其中Xi=[Xi1,Xi2,…,Xim]T为第i个用户的移动终端数据,包括m个特征数值,所述m个特征包括以下任一项或其任意组合:所述移动终端安装的软件类型数量、每种软件类型的APP安装数量、所述APP使用频率、所述APP使用开始时间、所述APP使用结束时间,1≤i≤H,m≥1。根据本专利技术,所述软件类型为软件类型表格(或者软件类型白名单)中指定的多种软件类型,通过调用移动终端的相关调用接口,获取所述移动终端已安装软件信息,并将该软件信息和所述软件类型表格中的软件类型进行匹配,且本领域技术人员可以知悉,现有技术中存在多种方法用于将软件信息和软件类型表格中的软件类型进行匹配,包括使用软件名称、和/或软件标签等。例如对于学生类用户,所述软件类型表格中包括的软件类型依次为学习类软件、阅读类软件和运动类软件,当某个学生用户的移动终端上安装有2个学习类软件和1个运动类软件,且学习软件的使用开始时间为07:00,使用结束时间为20:00,运动类软件的使用开始时间为21:00,使用结束时间为22:00,则通过采集该用户的终端数据可得到的Xi=[2,2,0,1,07:00,20:00,00:00,00:00,21:00,22:00]T,其中所述Xi中的每个特征数值依次对应的特征为:所述移动终端安装的软件类型数据、学习类软件的APP安装数量、阅读类软件的APP安装数量、运动类软件的APP安装数量、学习类软件的使用开始时间、学习类软件的使用结束时间、阅读类软件的使用开始时间、阅读类软件的使用结束时间、运动类软件的使用开始时间、运动类软件的使用结束时间。且本领域技术人员可知,以上所举例子仅为示范性例子,不作为限定本专利技术权利要求保护范围的唯一示例。本领域技术人员还知晓,需要对获取的用户的移动终端数据Xi或数据集合X进行数值化处理,即将所述数据集合X中用户的移动终端数据转化为可处理的数值,例如对软件的使用开始时间和使用结束时间进行数值化处理时,可以将当前时间转换为当前时间和参考时间的以秒为单位的差值,等等,且本领域技术人员知悉,所述使用开始时间和使用结束时间的转换方式有多种,其具体采用的转换方式不影响本专利技术保护范围。进一步,对数值化后的数据集合X进行数据归一化处理,以便于平衡各个特征在所述异常行为检测过程中的作用,例如归一化后新的其中,所述H可自定义设置,优选地,H≥2000。进一步地,所述数据集合X由集成在移动终端内的SDK采集。步骤S200,根据所述数据集合X获取所述H个用户的行为异常值G=[G1,G2,…,GH],其中Gi为第i个用户的行为异常值。根据本专利技术,第i个用户的行为异常值反应了第i个用户的移动终端数据Xi与其他H-1个用户的移动终端数据的差异。根据本专利技术的一个实施例,例如但是,在本专利技术优选的实施例中,其中D(i,j)为第i个用户的移动终端数据Xi和第j个用户的移动终端数据Xj的相似度,Ri(N)为D(i,:)中的第N个非零最小值,Rj(N)为D(j,:)中的第N个非零最小值,N≥1。该优选的实施例中,小规模的测试表明,与实际的用户行为之间具有相对较好的匹配性。根据本专利技术的的优选实施例,进一步的,所述Ri(N)为N的函数,示例性的,若D(i,:)=(0,1,1,2,4),则当N=1时,Ri(1)=1,当N=2时,Ri(2)=2。根据本专利技术的另一个实施例,进一步的,所述Ri(N)为N的函数,示例性的,若D(i,:)=(0,0.25,0.25,0.5,0.8),则当N=1时,Ri(1)=0.25,当N=2时,Ri(2)=0.5。根据本专利技术,N的取值可自定义设置,优选地,N=1或2。步骤S300,基于Gi获取第i个用户的行为异常概率Pi,如果Pi大于第一判断阈值T,则将H个用户中的第i个用户判断为异常用户。在该步骤中,基于所述Gi获取第i个用户的行为异常概率Pi=f(Gi),其中一个实施例中,归一化后的Xij的取值范围为[0,1],因此,Pi=Gi;另一个优选的实施例中,此时函数f将第i个用户的行为异常值Gi转换为0-1之间的概率值。优选地,所述第一判断阈值T的取值范围为[0.6,0.92],优选为0.85。且通过试验可知,当所述第一判断阈值T取值为0.85时,可显著提高用户异常行为识别的准确率。优选地,所述步骤S300还包括输出异常用户的用户ID,例如,所述输出异常用户的用户ID可以为N在不同取值下输出的异常用户的用户,一个实施例中,输出异常用户的用户ID为N=1时获取的异常用本文档来自技高网...

【技术保护点】
1.一种基于移动终端数据的用户异常行为检测方法,其特征在于,包括:步骤S100,获取H个用户的移动终端数据集合X=[X1,X2,...,XH],其中Xi=[Xi1,Xi2,…,Xim]

【技术特征摘要】
1.一种基于移动终端数据的用户异常行为检测方法,其特征在于,包括:步骤S100,获取H个用户的移动终端数据集合X=[X1,X2,...,XH],其中Xi=[Xi1,Xi2,…,Xim]T为第i个用户的移动终端数据,包括m个特征数值,所述m个特征包括以下任一项或其任意组合:所述移动终端安装的软件类型数量、每种软件类型的APP安装数量、所述APP使用频率、所述APP使用开始时间、所述APP使用结束时间,1≤i≤H,m≥1;步骤S200,根据所述数据集合X获取所述H个用户的行为异常值G=[G1,G2,…,GH],其中Gi为第i个用户的行为异常值;步骤S300,基于Gi获取第i个用户的行为异常概率Pi,如果Pi大于第一判断阈值T,则将H个用户中的第i个用户判断为异常用户。2.根据权利要求1所述的检测方法,其特征在于,所述第一判断阈值T的取值范围为[0.6,0.92],优选为0.85。...

【专利技术属性】
技术研发人员:叶政君尹雅露毕树超陈津来叶新江方毅
申请(专利权)人:浙江每日互动网络科技股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1