【技术实现步骤摘要】
一种基于移动数据的易受诈人群画像构建方法
[0001]本专利技术属于数据挖掘领域,涉及一种基于移动数据的易受诈人群画像构建方法。
技术介绍
[0002]手机在使用过程中留下的位置数据、上网数据、社交数据在一定程度上能够反映出人们的生活习惯和社交模式。目前在电信反欺诈领域较多针对欺诈方数据构建用户画像,对于受害方的研究通常仅仅利用受害者的年龄、性别等基础属性进行分析,亦或对于具体案例通过笔录等方式研究受害人心理。目前的研究忽视了对受害方更为广泛的二元空间行为特征的分析,因此本专利技术提出易受诈人群画像概念以及易受诈人群画像的构建方法,不仅能够提高对易受诈人群信息行为的管理效率,而且有助于相关人员理解易受诈人群以制定精准反诈策略。
技术实现思路
[0003]有鉴于此,本专利技术的目的在于提供一种基于移动数据的易受诈人群画像构建方法,采用移动通信大数据结合用户画像技术,分析受害人的行为特征,提高画像的准确性和完整性,有助于制定精准反诈措施、优化宣传对象的范围,从而实现反诈。
[0004]为达到上述目的,本专利技术提供如下技术方案:
[0005]一种基于移动数据的易受诈人群画像构建方法,具体包括以下步骤:
[0006]S1:提取用户网络信息空间特征;
[0007]S2:提取用户物理空间行为特征;
[0008]S3:获取用户二元空间融合特征,即对用户网络信息空间特征和物理空间行为特征进行特征融合,并对用户二元空间融合特征进行筛选,得到最优特征子集;
[0009]S ...
【技术保护点】
【技术特征摘要】
1.一种基于移动数据的易受诈人群画像构建方法,其特征在于,该方法具体包括以下步骤:S1:提取用户网络信息空间特征;S2:提取用户物理空间行为特征;S3:获取用户二元空间融合特征,即对用户网络信息空间特征和物理空间行为特征进行特征融合,并对用户二元空间融合特征进行筛选,得到最优特征子集;S4:根据最优特征子集生成用户画像。2.根据权利要求1所述的易受诈人群画像构建方法,其特征在于,步骤S1中,提取用户网络信息空间特征,具体包括以下步骤:S11:利用受电信诈骗用户手机号码与正常用户手机号码关联数据库中的相关数据模型,提取用户基础属性信息、通话记录信息、短信记录信息和上网记录信息;S12:使用数字标记用户基础信息,按时间维度汇总通话行为、短信行为和上网行为。3.根据权利要求1所述的易受诈人群画像构建方法,其特征在于,步骤S2中,提取用户物理空间行为特征,具体包括以下步骤:S21:将受电信诈骗用户手机号码与正常用户手机号码关联数据库中的相关数据模型,提取用户接入基站数据和基站经纬度信息,使用第三方电子地图引入POI信息;S22:根据用户轨迹数据中相邻两点的间隔权值,和轨迹数据的局部时空密度大小识别用户的停留点;S23:对每一个停留点赋予一个语义信息,将停留点半径R内最多的POI类型赋予给该停留点;S24:按时间汇总用户访问各POI类型区域的次数。4.根据权利要求3所述的易受诈人群画像构建方法,其特征在于,步骤S22中,所述间隔权值γ
c
的计算公式为:其中,表示相邻两位置点的距离间隔归一化值,表示相邻两位置点的时间间隔归一化值;所述局部时空密度ρ
i
的计算公式为:其中,dist(x
i
,x
j
)为x
i
到x
j
的地面距离,x
i
、x
j
分别表示轨迹中两个位置点,t
i
、t
j
分别表示轨迹中两个位置点的时间戳,n表示一条轨迹中数据点的总数,σ值设为1;停留点识别方法为:对γ
c
执行聚类簇数k=2的Kmeans算法聚为两类,将γ
c
值较大类的γ
c
最小值作为γ
c_th
,将间隔权值小于γ
c_th
的点删除,将相邻的两个删除位置之间的所有点划分为一个候选停留点,然后在每个候选停留点中对ρ
i
执行k=2的Kmeans算法聚为两类,将ρ
i
值较小类的ρ
i
最大值作为ρ
i_th
,候选停留点中存在大于ρ
i_th
的时空密度则为实际停留点。5.根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。