一种识别打车业务中刷单用户的方法和系统技术方案

技术编号:15052006 阅读:38 留言:0更新日期:2017-04-05 23:02
一种识别打车业务中刷单用户的方法和系统,所述方法包括有:提取打车订单中用户的手机号码、以及订单的开始和完成时间,然后向用户手机号码所属的电信运营服务器获取所述手机号码在订单的开始和完成时间之间的所在基站小区的位置数据,并判断所述基站小区的位置数据在订单的开始和完成时间之间是否发生变化,如果否,则所述用户是刷单用户,其中,用户是司机或乘客。本发明专利技术属于移动互联网技术领域,能有效识别打车业务中的刷单用户,降低企业损失,同时降低系统误判,提高识别效率。

【技术实现步骤摘要】

本专利技术涉及一种识别打车业务中刷单用户的方法和系统,属于移动互联网

技术介绍
目前乘客可以便捷地通过手机发布打车需求,打车业务平台接收乘客手机发送的打车请求,并将该打车请求的订单推送给终端,司机可以使用终端抢单,并与乘客直接沟通,大大提高了打车效率。由于O2O行业细分领域众多,竞争都非常激烈,市场参与者大多通过大量的现金注入来留住客户,打车业务的商家对用户提供了很多优惠补贴,因此存在有部分的刷单用户通过刷单行为来完成打车订单,以套取利润,这些刷单行为包括如下:1、熟人互刷,相互下单,刷单用户之间建立群组,相互下单;2、一人拥有多台机器配合司机刷单:刷单者购买多个廉价手机号码和改造的智能手机,一部手机可以支持大量账户的身份验证,并且假冒成不同的手机用户,同时通过软件修改行车轨迹。专利申请CN201510284601.4(专利名称:GPS坐标作弊的检测方法及装置,申请日:2015-05-28,申请人:北京嘀嘀无限科技发展有限公司)公开了一种GPS坐标作弊的检测方法,包括:获取终端在预设时间段内的全球定位系统GPS坐标信息;获取采用基站定位技术或WiFi定位技术得到的所述终端在所述预设时间段内的第一坐标信息;获得所述GPS坐标信息与所述第一坐标信息的偏差,并将所述偏差与第一预设阈值进行比较;若所述偏差大于等于第一预设阈值,则判定所述GPS坐标信息为伪造坐标信息。该技术方案仅限于识别用户是否对GPS坐标进行了修改,由于刷单用户的行为存在多样性,修改GPS坐标只是其中的一种刷单行为,如果仅依据用户的GPS坐标来识别刷单用户,并不能有效识别出打车业务中绝大多数的刷单用户。因此,针对多样化的刷单行为,如何有效识别打车业务中的刷单用户,降低企业损失,同时降低系统误判,提高识别效率,已成为了当前急需解决的技术问题。
技术实现思路
有鉴于此,本专利技术的目的是提供一种识别打车业务中刷单用户的方法和系统,能有效识别打车业务中的刷单用户,降低企业损失,同时降低系统误判,提高识别效率。为了达到上述目的,本专利技术提供了一种识别打车业务中刷单用户的方法,包括有:步骤A、提取打车订单中用户的手机号码、以及订单的开始和完成时间,然后向用户手机号码所属的电信运营服务器获取所述手机号码在订单的开始和完成时间之间的所在基站小区的位置数据,并判断所述基站小区的位置数据在订单的开始和完成时间之间是否发生变化,如果否,则所述用户是刷单用户,其中,用户是司机或乘客。为了达到上述目的,本专利技术还提供了一种识别打车业务中刷单用户的系统,包括有:位置识别装置,用于提取打车订单中用户的手机号码、以及订单的开始和完成时间,然后向用户手机号码所属的电信运营服务器获取所述手机号码在订单的开始和完成时间之间的所在基站小区的位置数据,并判断所述基站小区的位置数据在订单的开始和完成时间之间是否发生变化,如果否,则所述用户是刷单用户,其中,用户是司机或乘客。与现有技术相比,本专利技术的有益效果是:由于用户手机在电信运营商侧的所在基站小区的位置信息是唯一且不可更改的,本专利技术基于用户手机所在基站小区的位置数据来识别刷单用户,并不限于用户的GPS坐标信息,因此能有效识别出打车业务中的各种刷单行为,技术方案实施简单而有效;在根据位置数据识别刷单用户的同时,本专利技术还可以辅以分析用户的通话记录、通话行为或司机信用等多种技术方案,从而对刷单用户作进一步甄选,有效降低系统误判,提高识别效率。附图说明图1是本专利技术通过计算司机的信用评分来识别其中的刷单用户的流程图。图2是图1步骤G2的具体计算流程图。图3是本专利技术一种识别打车业务中刷单用户的系统的组成结构示意图。图4是信用识别装置的组成结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步的详细描述。为了描述方便,假定司机手机为D,乘客手机为C。多数正常乘客的情况,C和D从上车到下车的时间段内,两部手机的位置轨迹基本一致。而对于刷单用户则不是这样,C的物理位置没有变化,只是通过手机客户端软件对手机位置信息进行伪造,模拟C的GPS位置发生了变化,并把数据上报给打车业务平台,以骗取补贴。然而,无论刷单者的手机客户端软件如何改造,电信运营商侧所记录的手机号码的位置数据(即手机所在基站小区的位置数据)是唯一且不可更改的,也就是说某一个时间点,手机处于电信运营商的某个基站的覆盖之下。基于这一原理,我们可以从电信运营商侧获取手机所在基站小区的位置(CELLID)数据,并判断在打车的时间段内,C或D的CELLID是否发生变化,如果没有变化则可以确定该号码属于刷单用户。因此,本专利技术一种识别打车业务中刷单用户的方法,包括有:步骤A、提取打车订单中用户(包括司机或乘客)的手机号码、以及订单的开始和完成时间,然后向用户手机号码所属的电信运营服务器获取所述手机号码在订单的开始和完成时间之间的所在基站小区的位置数据,并判断所述基站小区的位置数据在订单的开始和完成时间之间是否发生变化?如果否,则所述用户是刷单用户。由于电信运营商所记录的手机号码的位置数据为其所在基站小区的位置数据,精度较小,即便属于同一位置也有一定的误差,所以本专利技术可以根据位置数据之间的差值(即两个位置数据之间的距离值)是否在一定误差范围内来判断是否属于同一位置。步骤A可以直接根据用户手机号码在订单的开始和完成这两个时间点的位置数据进行判断,进一步包括有:步骤A1、向用户手机号码所属的电信运营服务器获取所述手机号码在订单的开始和完成时间点的所在基站小区的位置数据,并判断所述两个时间点的基站小区的位置数据的差值是否小于一定的位置差阈值?如果是,则说明用户手机在订单的开始和完成时间点的实际位置不变,所述用户是刷单用户。其中,位置差阈值可以根据实际业务情况而灵活设定。为了有效降低系统误判,本专利技术还可以在实施步骤A的同时,结合采用以下的1种或多种技术方案来有效提高识别效率。正常的手机号码在一天之内会有位置的变化,比如机主会外出工作、旅游等,而刷单用户的手机通常长期放置于一个固定的位置,仅仅用于刷单,也就是说这类手机的位置数据在长时间(如一天24小时)内不会变化,因此,本专利技术还可以包括有:步骤B、从用户手机号码所属的电信运营服务器获取所述手机号码在一定时间周期(如24小时)内的所在基站小区的位置数据,并判断所述时间周期内的基站小区的位置数据相互之间的差值是否都小于一定的位置差阈值?如果是,则所述用户是刷单用户。例如,本专利技术可以查本文档来自技高网
...

【技术保护点】
一种识别打车业务中刷单用户的方法,其特征在于,包括有:步骤A、提取打车订单中用户的手机号码、以及订单的开始和完成时间,然后向用户手机号码所属的电信运营服务器获取所述手机号码在订单的开始和完成时间之间的所在基站小区的位置数据,并判断所述基站小区的位置数据在订单的开始和完成时间之间是否发生变化,如果否,则所述用户是刷单用户,其中,用户是司机或乘客。

【技术特征摘要】
1.一种识别打车业务中刷单用户的方法,其特征在于,包括有:
步骤A、提取打车订单中用户的手机号码、以及订单的开始和完成时间,然后向用户手
机号码所属的电信运营服务器获取所述手机号码在订单的开始和完成时间之间的所在基站小
区的位置数据,并判断所述基站小区的位置数据在订单的开始和完成时间之间是否发生变化,
如果否,则所述用户是刷单用户,其中,用户是司机或乘客。
2.根据权利要求1所述的方法,其特征在于,步骤A进一步包括有:
步骤A1、向用户手机号码所属的电信运营服务器获取所述手机号码在订单的开始和完成
时间点的所在基站小区的位置数据,并判断所述两个时间点的基站小区的位置数据的差值是
否小于一定的位置差阈值,如果是,则所述用户是刷单用户。
3.根据权利要求1所述的方法,其特征在于,还包括有:
步骤B、从用户手机号码所属的电信运营服务器获取所述手机号码在一定时间周期内的
所在基站小区的位置数据,并判断所述时间周期内的基站小区的位置数据相互之间的差值是
否都小于一定的位置差阈值,如果是,则所述用户是刷单用户。
4.根据权利要求1所述的方法,其特征在于,还包括有:
步骤C1、用户手机上的打车客户端装置在订单的开始或完成时间读取用户手机的GPS位
置数据,并将所述GPS位置数据上报给打车业务平台;
步骤C2、向用户手机号码所属的电信运营服务器查询所述手机号码在订单的开始或完成
时间的所在基站小区的位置数据,然后判断在同一时间点的打车业务平台所记录的用户手机
的GPS位置数据和其所在基站小区的位置数据的差值是否小于一定的位置差阈值,如果否,
则所述用户是刷单用户。
5.根据权利要求1所述的方法,其特征在于,还包括有:
步骤D1、提取打车订单中司机和乘客的手机号码、以及订单的开始或完成时间,然后向
司机和乘客的手机号码所属的电信运营服务器分别获取司机和乘客的手机号码在订单的开始
或完成时间的所在基站小区的位置数据,并判断所述司机和乘客的基站小区的位置数据的差
值是否小于一定的位置差阈值,如果否,则继续下一步;如果是,则本流程结束;
步骤D2、提取司机和乘客的历史通话记录,判断司机和乘客的手机号码在一段时间周期
内的通信次数是否超过频繁通信次数的阈值,如果是,则司机和乘客是刷单用户。
6.根据权利要求1所述的方法,其特征在于,还包括有:
步骤E、提取司机和乘客的历史通话记录,并判断是否存在有重复的通话号码、且重复
的通话号码数大于通话圈交叉数阈值,如果是,则司机和乘客是刷单用户。
7.根据权利要求1所述的方法,其特征在于,还包括有:
步骤F、根据用户的历史通话记录,计算用户的若干个历史通话指标值,并逐一比较每
个历史通话指标值是否低于对应的通话指标阈值,然后统计低于通话指标阈值的历史通话指
标值个数,并判断所述个数是否超过指标值数阈值,如果是,则所述用户是刷单用户,所述
历史通话指标值包括但不限于:DOU、MOU、通话次数、短信量平均值、月交往圈个数、月基
站使用数。
8.根据权利要求1所述的方法,其特征在于,还包括有:
步骤G1、选定若干个信用指标,所述信用指标包括但不限于:手机用户在网时长、使用
状态、手机套餐使用情况、手机上网累积时长、手机月通话时长、手机号码实名制信息、消
费能力、欠费额度和欠费记录、最近活跃地理位置;
步骤G2、选定多个样本用户,提取所有样本用户的信用指标值,并根据样本用户的信用
指标值来计算每个信用指标的权重值;
步骤G3、根据司机的信用指标值和每个信用指标的权重值,计算每个司机的信用评分,
并从中选取多个信用评分低的司机为刷单用户。
9.根据权利要求8所述的方法,其特征在于,步骤G2进一步包括有:
步骤G21、根据信用指标值和信用评分的正负相关性,对所有样本用户的每个信用指标
值进行调整,即当信用指标值和信用评分是正相关时,所述信用指标值的调整计算公式是:
当信用指标值和信用评分是负相关时,所述信用指标值的调
整计算公式是:其中,xij是第i个样本用户的第j个信用指标
值,min(xj)是第j个信用指标在所有样本用户中的最小值,max(xj)是第j个信用指标在所
有样本用户中的最大值;
步骤G22、计算所有样本用户的每个信用指标值在信用指标下出现的概率:
其中,m是选定的样本用户总数;
步骤G23、计算每个信用指标的权重值:其中,wj是第j个信用指

\t标的权重值,n是信用指标总数,ej是第j个信用指标的熵值,ej的计算公式进一步如下:
ej=-Σi=1m(f(xij)+1)*ln(f(xij)+1)ln(m+1).]]>10.根据权利要求8所述的方法,其特征在于,步骤G3进一步包括有:
计算每个司机的信用评分:其中,wj是第j个信用指标的权重
值,uj是司机的第j个信用指标值,然后将所有司机的信用评分按照从低到高的次序进行排
序,最后从排在首位的司机开始、顺序选取Ns×s%个司机,所选取的司机即是打车业务中
的刷单用户,其中,Ns是所有司机总数,s%是刷单用户比例阈值。
11.一种识别打车业务中刷单用户的系统,其特征在于...

【专利技术属性】
技术研发人员:王玉龙廖建新赵海秀徐童王晶尚云婷赵忠平
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1