一种对加油卡的套现行为进行识别的方法技术

技术编号:21453903 阅读:76 留言:0更新日期:2019-06-26 04:46
本发明专利技术提供一种对加油卡的套现行为进行识别的方法,包括:收集加油卡的加油交易记录;根据加油卡的加油交易记录对所述加油卡的加油行为进行统计,得到所述加油卡在各种维度下的加油行为分布情况;计算所述加油卡在各种维度下的加油行为分布情况的熵值;根据各个熵值分析所述加油卡在各种维度下的加油行为选择的确定性,其中熵值越小,加油行为选择的确定性越强,综合所述加油卡在各种维度下的加油行为选择的确定性来判断所述加油卡是否具有套现行为的嫌疑。本发明专利技术通过对加油卡的加油交易记录进行分析,能够识别出有可能是模仿用户的加油行为进行套现的加油卡。

【技术实现步骤摘要】
一种对加油卡的套现行为进行识别的方法
本专利技术涉及管理、监督或预测目的的数据处理技术,尤其涉及一种对加油卡的套现行为进行识别的方法。
技术介绍
随着加油卡的迅猛发展,在成品油零售中,通过加油卡进行支付的比率逐年攀升。同时,石化销售企业设定的促销活动大多基于加油卡实施,使得消费者利用加油卡加油会得到许多返利利好,例如通过刷卡支付获得奖励、折扣优惠以及累积积分兑换礼品等。然而,在加油卡促进了成品油的业务增长的同时,加油站员工利用加油卡进行套现的行为时有发生。加油站员工利用加油卡进行套现,该行为的主要表现是:加油站员工利用私自办理的加油卡为现金用户进行加油,从而将现金销售变为加油卡销售,进而达到将石化销售企业对加油卡客户的优惠让利占为己有的目的。最初,这种利用加油卡进行套现的行为具有比较明显的特征:刷卡次数频繁、刷卡时段特殊(例如深夜)、短时间连续刷卡以及刷卡金额较大等等。基于上述特征,对员工利用加油卡进行套现的行为进行排查,现行最有效的技术方案是一种基于预设条件的数据筛选系统:该系统存储了所有的加油卡的加油记录,通过人工添加利用加油卡套现行为所满足的必要条件(例如,每天刷卡次数大于3次),系统能够自动地筛选出符合预设条件的加油卡,从而缩小利用加油卡进行套现的行为的排查范围。现有的通过直接输入条件进行筛选的方式,要求使用者必须明确地定义利用加油卡进行套现的行为的特征。然而,利用加油卡进行套现的行为除了具有混乱的特征以外,并没有直接的能够明确定义的其他特征。因此,现有的通过直接输入数据条件进行筛选的方式并不能够精准地判断刷卡加油行为是否异常,排查的过程相对繁琐且排查的结果不够准确。而且,随着石化销售企业对利用加油卡进行套现的行为的重视,加油站员工利用加油卡进行套现的行为也变得更为隐蔽。加油站员工不再无节制地刷卡套现,而是力求模拟正常的加油卡的行为。例如,加油站员工知晓每天刷卡次数过多会招致怀疑,于是将利用加油卡进行套现的行为控制在每张加油卡每天3次以内。这样一来,上述系统所需要预设的数据条件就会变得更加复杂,逐渐难以实施。对于这种没有明显特征的违规行为,石化销售企业只能结合监控录像进行人工抽查。然而,这种单纯地通过人工抽查的方法费时又费力,其效率和效果均无法满足现实的管理需求。因此除了对基层工作人员进行定期的思想教育之外,目前尚无行之有效的解决方法。因此,亟需一种能够对加油卡的套现行为进行识别的方法。
技术实现思路
为了解决上述问题,本专利技术提供一种能够对加油卡的套现行为进行识别的方法。所述识别方法包括:数据收集步骤,收集加油卡的加油交易记录;数据统计步骤,根据加油卡的加油交易记录对利用所述加油卡的加油行为进行统计,得到所述加油卡在各种维度下的加油行为分布情况;熵值计算步骤,计算所述加油卡在各种维度下的加油行为分布情况的熵值;分析判断步骤,根据各个熵值分析所述加油卡在各种维度下的加油行为选择的确定性,其中熵值越小,加油行为选择的确定性越强,综合所述加油卡在各种维度下的加油行为选择的确定性来判断所述加油卡是否具有套现行为的嫌疑。根据本专利技术的一个实施例,所述加油交易记录包括加油卡号、加油站代码、油品代码、加油量、加油日期以及加油时间。根据本专利技术的一个实施例,所述维度包括以下至少一种维度:加油站的维度、油品的维度以及加油量的维度。根据本专利技术的一个实施例,若所述维度包括加油站的维度,则所述加油卡在加油站的维度下的加油行为分布情况通过该加油卡在各个加油站的消费次数与该加油卡的全部消费次数的比值来描述;若所述维度包括油品的维度,则所述加油卡在油品的维度下的加油行为分布情况通过该加油卡关于各种油品的消费次数与该加油卡的全部消费次数的比值来描述;若所述维度包括加油量的维度,则为所述加油卡的单次加油量设置油量区间,所述加油卡在加油量的维度下的加油行为分布情况通过该加油卡的单次加油量落入各个油量区间内的次数与该加油卡的全部消费次数的比值来描述。根据本专利技术的一个实施例,优选通过以下方式设置油量区间:收集所述加油卡的单次加油量的全部记录,通过按分位数划分记录来设置油量区间,其中0分位为记录中的最小值,1分位为记录中的最大值。更优选地,选取记录的[0分位、0.25分位、0.5分位、0.75分位、1分位]作为间隔,设置四个油量区间。根据本专利技术的一个实施例,在熵值计算步骤中,基于下式计算所述加油卡在一种维度下的加油行为分布情况的熵值:e=-sum(pi*log(pi))其中,e表示熵值;pi,i=1,2,…,n为一组描述所述加油卡在一种维度下的加油行为分布情况的百分比比值,其总和为1。根据本专利技术的一个实施例,所述分析判断步骤包括:设置熵值区间,所述熵值区间用来表征加油行为选择的确定性的强弱;根据所述加油卡在各种维度下的加油行为分布情况的熵值,确定所述加油卡在各种维度下的熵值所属的熵值区间;判断所述加油卡在各种维度下的熵值区间是否与嫌疑卡在各种维度下的熵值区间一致;若一致,则判断所述加油卡是具有套现行为嫌疑的嫌疑卡。根据本专利技术的一个实施例,所述熵值区间包括第一区间、第二区间和第三区间:所述第一区间为0≤熵值<第一阈值,用于表征加油行为具有一种或两种固定偏好;所述第二区间为第一阈值≤熵值<第二阈值,用于表征加油行为具有两种以上固定偏好;所述第三区间为第二阈值≤熵值,用于表征加油行为没有固定偏好。根据本专利技术的一个实施例,所述嫌疑卡在各种维度下的熵值区间包括:在加油站的维度下的熵值区间为第一区间,在油品的维度下的熵值区间为第三区间,在加油量的维度下的熵值区间为第三区间。根据本专利技术的一个实施例,在分析判断步骤中,若加油卡是嫌疑卡,则进一步结合加油时间来判断嫌疑卡的嫌疑度:如果存在同一天内两次以上的加油记录,而且油品不同,则嫌疑卡的嫌疑度最高;如果存在同一天内两次以上的加油记录,但是油品相同,则嫌疑卡的嫌疑度次高。与现有技术相比,本专利技术具有如下优点或有益效果:1)现有技术(通过输入条件进行数据筛选的方式)要求使用者必须明确定义作弊行为的条件特征,实际上利用会员卡套现的行为除了具有混乱的特征以外,并无直接可明确定义的特征表现。故而直接输入数据条件进行筛选的方式并不能更精准的判断刷卡加油行为是否异常。本专利技术通过基于加油卡的加油交易记录得到加油卡在各种维度下的加油行为分布情况,进而根据加油行为分布情况分析加油卡在各种维度下的加油行为选择的确定性,综合加油卡在各种维度下的加油行为选择的确定性来判断所述加油卡是否具有套现行为的嫌疑,极大地缩小了排查范围,提升了排查效率,提高了排查结果的准确度。2)正常地使用加油卡刷卡加油的消费行为具有一定的稳定性和规律性,相对而言,异常地使用加油卡套现的消费行为就很混乱,然而这种混乱难以通过直接的预设条件来定义。本专利技术通过引用计算熵值的方式来描述行为的确定性程度,分析加油卡在各种维度下的加油行为选择对象(例如加油站、加油油品、单次加油量)的确定性,从而提高了排查结果的准确度。3)本专利技术通过分析加油卡在加油站点、加油油品、单次加油量等具有典型特征的维度下的加油行为分布情况,筛选出异常的加油卡,极大地缩小了排查范围,提升了排查效率。4)本专利技术通过收集所述加油卡的单次加油量的全部记录,按分位数划分记录,设置油量区间,使得每个油本文档来自技高网
...

【技术保护点】
1.一种对加油卡的套现行为进行识别的方法,其特征在于,包括:数据收集步骤,收集加油卡的加油交易记录;数据统计步骤,根据加油卡的加油交易记录对利用所述加油卡的加油行为进行统计,得到所述加油卡在各种维度下的加油行为分布情况;熵值计算步骤,计算所述加油卡在各种维度下的加油行为分布情况的熵值;分析判断步骤,根据各个熵值分析所述加油卡在各种维度下的加油行为选择的确定性,其中熵值越小,加油行为选择的确定性越强,综合所述加油卡在各种维度下的加油行为选择的确定性来判断所述加油卡是否具有套现行为的嫌疑。

【技术特征摘要】
1.一种对加油卡的套现行为进行识别的方法,其特征在于,包括:数据收集步骤,收集加油卡的加油交易记录;数据统计步骤,根据加油卡的加油交易记录对利用所述加油卡的加油行为进行统计,得到所述加油卡在各种维度下的加油行为分布情况;熵值计算步骤,计算所述加油卡在各种维度下的加油行为分布情况的熵值;分析判断步骤,根据各个熵值分析所述加油卡在各种维度下的加油行为选择的确定性,其中熵值越小,加油行为选择的确定性越强,综合所述加油卡在各种维度下的加油行为选择的确定性来判断所述加油卡是否具有套现行为的嫌疑。2.根据权利要求1所述的对加油卡的套现行为进行识别的方法,其特征在于,所述加油交易记录包括加油卡号、加油站代码、油品代码、加油量、加油日期以及加油时间。3.根据权利要求1所述的对加油卡的套现行为进行识别的方法,其特征在于,所述维度包括以下至少一种维度:加油站的维度、油品的维度以及加油量的维度。4.根据权利要求1所述的对加油卡的套现行为进行识别的方法,其特征在于:若所述维度包括加油站的维度,则所述加油卡在加油站的维度下的加油行为分布情况通过该加油卡在各个加油站的消费次数与该加油卡的全部消费次数的比值来描述;若所述维度包括油品的维度,则所述加油卡在油品的维度下的加油行为分布情况通过该加油卡关于各种油品的消费次数与该加油卡的全部消费次数的比值来描述;若所述维度包括加油量的维度,则为所述加油卡的单次加油量设置油量区间,所述加油卡在加油量的维度下的加油行为分布情况通过该加油卡的单次加油量落入各个油量区间内的次数与该加油卡的全部消费次数的比值来描述。5.根据权利要求4所述的对加油卡的套现行为进行识别的方法,其特征在于,通过以下方式为所述加油卡的单次加油量设置油量区间:收集所述加油卡的单次加油量的全部记录,通过按分位数划分记录来设置油量区间,其中0分位为记录中的最小...

【专利技术属性】
技术研发人员:罗娅闫克难李银萍
申请(专利权)人:石化盈科信息技术有限责任公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1