【技术实现步骤摘要】
一种基于通信数据的烟草串烟智能稽查方法
[0001]本专利技术涉及数据处理
,具体的说是一种基于通信数据的烟草串烟智能稽查方法。
技术介绍
[0002]根据《烟草专卖许可证管理办法》,烟草专卖局依照法定的权限、范围、条件和程序审批、发放烟草专卖许可证,并进行有效的监督管理。当前烟草售卖点每批次的卷烟配额是提前预订,每条烟出库前进行渠道喷码,通过烟草专卖公司进行分配调拨、运输配送。但因不同区域不同品牌的供需不同,不同区域同一卷烟存在销售差价,有不法烟贩在本地收烟后在其他区域销售,或将其它地区卷烟运输至本地销售,获取差价利润。
[0003]目前烟草专卖局稽查非法卷烟方式,依靠稽查人员现场检查卷烟上的喷码,查询产品和物流信息,如卷烟生产日期、批次、卷烟零售户订购等信息,并据此辨别产品真伪、防止卷烟非法流通等。但线下稽查依靠随机抽查或者市民举报,没有很好的方法为线下稽查提供指导,只能依靠人力频繁检查,售烟点多投入人力大,督查效果差。亟需探索外部数据能力与烟草内部数据的价值碰撞为烟草零售点的卷烟非法流通稽查提供数据支撑, ...
【技术保护点】
【技术特征摘要】
1.一种基于通信数据的烟草串烟智能稽查方法,其特征在于,包括如下步骤:S1、基于运营商大数据,采集已知烟贩与烟草零售网点的位置重叠与通信交往的预选指标数据;S2、选取已知烟贩和无串烟行为零售网点的预选指标数据作为正样本,选取已知烟贩和有串烟行为零售网点的预选指标数据作为负样本,根据正样本和负样本制作数据集;S3、对数据集中的预选指标数据进行筛选和归一化处理,得到最终指标数据;S4、基于数据集的最终指标数据,建立并训练逻辑回归模型,基于逻辑回归模型的输出概率预测零售网点有无串烟行为;S5、逻辑回归模型训练完成后,得到各个指标的权重W和阈值b,制作评分卡;S6、选取已知烟贩和待测零售网点的预选指标数据,执行步骤S3,得到最终指标数据,将最终指标数据输入完成训练的逻辑回归模型,预测待测零售网点有无串烟行为,随后通过评分卡,计算待测零售网点的评分,稽查人员根据评分对烟草零售网点进行线下稽查。2.根据权利要求1所述的一种基于通信数据的烟草串烟智能稽查方法,其特征在于,采集的预选指标数据包括:过去30天已知烟贩与零售网点的通话次数、通话天数、通话时长、短信条数,过去30天已知烟贩在零售网点所属区域的到访次数、停留时长,过去30天零售网点与高关联度烟贩的数量、关联度总分值、关联度平均分值。3.根据权利要求2所述的一种基于通信数据的烟草串烟智能稽查方法,其特征在于,引入公式score=ax+by+cz,其中,x、y、z分别为已知烟贩与零售网点的通话次数、短信条数、区域到访次数,a、b、c分别为前述三个指标的权重,且a+b+c=100,score为已知烟贩与零售网点的关联度;当计算所得关联度超过设定值时,认定已知烟贩为该零售网点的高关联度烟贩,找出该零售网点的所有高关联度烟贩,加和计算得到的关联度,得到零售网点与所有高关联度烟贩的关联度总分值,加和计算所得关联度后除以高关联度烟贩的数量,得到零售网点与高关联度烟贩的关联度平均分值。4.根据权利要求3所述的一种基于通信数据的烟草串烟智能稽查方法,其特征在于,设定a=30,b=20,c=50。5.根据权利要求1所述的一种基于通信数据的烟草串烟智能稽查方法,其特征在于,执行步骤S3,得到最终指标数据的具体过程如下:S3.1、针对数据集中的某一项指标数据,在其空值占比大于90%时,删除数据集中的该项指标数据;S3.2、采用等距分箱的方式,即按预选指标数据的取值范围等分,每组的组距相同,将连续变量指标分成指定离散箱体,针对某一项指标j,计算其每个箱体...
【专利技术属性】
技术研发人员:郭婉茹,
申请(专利权)人:浪潮通信信息系统有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。