一种异常账号的识别方法和装置制造方法及图纸

技术编号:32237142 阅读:16 留言:0更新日期:2022-02-09 17:41
本发明专利技术公开了一种异常账号的识别方法,包括以下步骤:获取目标账号第一起点位置数据;所述第一起点位置数据为当前订单的起点位置数据;通过预存的核密度估计模型训练所述第一起点位置数据,并输出所述第一起点位置数据的第一核密度估计值;所述核密度估计模型是以目标账号的历史订单的起点位置数据而建立的;将所述第一核密度估计值发送至预设分类器,以识别目标账号是否为为异常账号。本申请的核密度估计模型是以目标账号的历史订单的起点位置数据而建立的,建立模型获取的数据噪声小,避免了模型训练过程出现过拟合和泛化性不足的情况,使得机器学习模型给出的结果与实际情况相对准确,且维护简单。且维护简单。且维护简单。

【技术实现步骤摘要】
一种异常账号的识别方法和装置


[0001]本专利技术属于大数据处理
,具体涉及一种异常账号的识别方法和装置。

技术介绍

[0002]在网约车领域,网约车平台通常通过补贴的方式来保持旗下司机和乘客的粘性,每完成一定的订单后,网约车平台将会给与司机和乘客一定金额的补贴。但是存在司机和乘客根据平台的补贴规则进行刷单骗取补贴的行为。例如,司机利用不同的手机号码分别绑定乘客端和司机端,通过乘客端下单,司机端接单,完成一单没有真实乘客的订单而获得平台的补贴。
[0003]为了避免司机的刷单行为,通常通过获取某司机账号历史订单下,相同乘客连续多次下单的行为识别刷单账号,但是这种方法容易被司机寻他经而规避。此外,为了进一步识别刷单账号,平台通过分析某司机历史订单中的行车轨迹,通过行车轨迹的经纬度特征作为识别信息,并通过统计和分析找出该司机的特定位置节点,对特定位置节点的经纬度特征建立数学模型进一步判断该司机是否存在刷单行为。虽然通过行车轨迹建立数学模型简单、方便,但是由于每个订单中的经纬度特征较多,获取到的经纬度特征中存在大量噪声,容易使机器学习模型训练过程出现过拟合和泛化性不足的情况,使得机器学习模型给出的结果与实际情况相差较大。

技术实现思路

[0004]本专利技术的目的是要解决上述的技术问题,提供一种异常账号的识别方法和装置。
[0005]为了解决上述问题,本专利技术按以下技术方案予以实现的:
[0006]第一方面,本专利技术提供了一种异常账号的识别方法,包括以下步骤:
[0007]获取目标账号第一起点位置数据;所述第一起点位置数据为当前订单的起点位置数据;
[0008]通过预存的核密度估计模型训练所述第一起点位置数据,并输出所述第一起点位置数据的第一核密度估计值;所述核密度估计模型是以目标账号的历史订单的起点位置数据而建立的;
[0009]将所述第一核密度估计值发送至预设分类器,以识别目标账号是否为为异常账号。
[0010]结合第一方面,本专利技术还提供了第一方面的第1种实施方式,所述核密度估计模型是通过以下方法获得,包括:
[0011]获取目标账号第二起点位置数据,建立起点位置数据集;所述第二起点位置数据为历史订单的起点位置数据;
[0012]通过预设分布函数和预设带宽对起点位置数据集中每个第二起点位置数据进行核密度估计,生成所述起点位置数据集对应的核密度估计函数。
[0013]结合第一方面,本专利技术还提供了第一方面的第2种实施方式,所述预设分布函数为
高斯核函数,,所述核密度估计函数的表达式为:
[0014][0015]式中,f(x,y)为核密度估计值,n为第二起点位置数据的个数,h为预设带宽,(x
i
,y
i
)为第i个第二起点位置数据的经纬度。
[0016]结合第一方面,本专利技术还提供了第一方面的第3种实施方式,将所述第一核密度估计值发送至预设的分类器前,还包括以下步骤:
[0017]获取目标账号的第一辅助识别数据;所述第一辅助识别数据为当前订单的辅助识别数据;所述辅助识别数据包括:订单金额、订单时间,订单结束地点,订单行驶距离,订单持续时长,使用优惠券信息,订单折扣信息。
[0018]将第一辅助识别数据发送至所述分类器。
[0019]结合第一方面,本专利技术还提供了第一方面的第4种实施方式,所述预设分类器是通过以下方法获得,包括:
[0020]获取第二核密度估计值和第二辅助识别数据;所述第二核密度估计值是以历史订单中起点位置数据为输入在核密度估计模型中训练所得;所述第二辅助识别数据为历史订单的辅助识别数据;
[0021]将所述第二核密度估计值和所述第二辅助识别数据作为输入,通过学习模型训练预设分类器;所述学习模型为xgboost分类模型。
[0022]结合第一方面,本专利技术还提供了第一方面的第5种实施方式,通过学习模型训练预设分类器,具体为:
[0023]将获取的所述第二核密度估计值和所述第二辅助识别数据按照预设比值分割为训练样本和测试样本;
[0024]在所述学习模型中训练所述训练样本,生成初步分类器;
[0025]以测试样本作为所述初步分类规则输入并生成评价指标,将所述评价指标与预设评价指标范围进行对比;若所述评价指标在预设评价指标范围内,则所述初步分类器为所述预设分类器;若所述评价指标不在预设评价指标范围内,则重新生成初步分类器。
[0026]结合第一方面,本专利技术还提供了第一方面的第6种实施方式,所述评价指标的判断公式为:
[0027][0028]式中,F
β
为评价指标,r为召回率,p为精准率,β表示召回率的权重为精准率的β倍。
[0029]第二方面,本专利技术提供了一种异常账号的识别装置,包括:
[0030]第一获取模块,所述第一获取模块用于获取目标账号第一起点位置数据;所述第一起点位置数据为当前订单的起点位置数据;
[0031]训练模块,所述训练模块用于通过预存的核密度估计模型训练所述第一起点位置数据,并输出所述第一起点位置数据的第一核密度估计值;所述核密度估计模型是以目标账号的历史订单的起点位置数据而建立的;
[0032]第一发送模块,所述第一发送模块用于将所述第一核密度估计值发送至预设分类
器,以识别目标账号是否为为异常账号。
[0033]结合第二方面,本专利技术还提供了第二方面的第1种实施方式,所述核密度估计模型是通过以下方法获得,包括:
[0034]获取目标账号第二起点位置数据,建立起点位置数据集;所述第二起点位置数据为历史订单的起点位置数据;
[0035]通过预设分布函数和预设带宽对起点位置数据集中每个第二起点位置数据进行核密度估计,生成所述起点位置数据集对应的核密度估计函数。
[0036]结合第二方面,本专利技术还提供了第二方面的第2种实施方式,还包括:
[0037]第二获取模块,所述第二获取模块用于获取目标账号的第一辅助识别数据;所述第一辅助识别数据为当前订单的辅助识别数据;所述辅助识别数据包括:订单金额、订单时间,订单结束地点,订单行驶距离,订单持续时长,使用优惠券信息,订单折扣信息。
[0038]第二发送模块,所述第二发送模块用于将第一辅助识别数据发送至所述分类器。
[0039]与现有技术相比,本专利技术的有益效果是:
[0040]本申请实施例中,通过将当前订单的起点位置数据通过预存的核密度估计模型训练,输出当前订单的起点位置数据的核密度估计值,通过分类器识别该账号是否为异常账号。本申请通过计算当前订单的起点位置在目标账号中的发生概率,若该目标账号在这个起点位置的接单概率超出分类器中预设阈值时,可判定该账号为异常账号。相比于现有技术,本申请的核密度估计模型是以目标账号的历史订单的起点位置数据而建立的,建立模型获取的数据噪声小,避免了模型训练过程出现过拟合和泛化性不足的情况,使得机器学习模型给出的结果与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常账号的识别方法,其特征在于,包括以下步骤:获取目标账号第一起点位置数据;所述第一起点位置数据为当前订单的起点位置数据;通过预存的核密度估计模型训练所述第一起点位置数据,并输出所述第一起点位置数据的第一核密度估计值;所述核密度估计模型是以目标账号的历史订单的起点位置数据而建立的;将所述第一核密度估计值发送至预设分类器,以识别目标账号是否为为异常账号。2.根据权利要求1所述的一种异常账号的识别方法,其特征在于,所述核密度估计模型是通过以下方法获得,包括:获取目标账号第二起点位置数据,建立起点位置数据集;所述第二起点位置数据为历史订单的起点位置数据;通过预设分布函数和预设带宽对起点位置数据集中每个第二起点位置数据进行核密度估计,生成所述起点位置数据集对应的核密度估计函数。3.根据权利要求2所述的一种异常账号的识别方法,其特征在于,所述预设分布函数为高斯核函数,所述核密度估计函数的表达式为:式中,f(x,y)为核密度估计值,n为第二起点位置数据的个数,h为预设带宽,(x
i
,y
i
)为第i个第二起点位置数据的经纬度。4.根据权利要求1所述的一种异常账号的识别方法,其特征在于,将所述第一核密度估计值发送至预设的分类器前,还包括以下步骤:获取目标账号的第一辅助识别数据;所述第一辅助识别数据为当前订单的辅助识别数据;所述辅助识别数据包括:订单金额、订单时间,订单结束地点,订单行驶距离,订单持续时长,使用优惠券信息,订单折扣信息。将第一辅助识别数据发送至所述分类器。5.根据权利要求1

4中任一项所述的一种异常账号的识别方法,其特征在于,所述预设分类器是通过以下方法获得,包括:获取第二核密度估计值和第二辅助识别数据;所述第二核密度估计值是以历史订单中起点位置数据为输入在核密度估计模型中训练所得;所述第二辅助识别数据为历史订单的辅助识别数据;将所述第二核密度估计值和所述第二辅助识别数据作为输入,通过学习模型训练预设分类器;所述学习模型为xgboost分类模型。6.根据权利要求5所述的...

【专利技术属性】
技术研发人员:徐晓东
申请(专利权)人:广州宸祺出行科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1