一种基于大数据的确定抽检商家的方法技术

技术编号:19481532 阅读:52 留言:0更新日期:2018-11-17 10:42
本发明专利技术公开了一种基于大数据的确定抽检商家的方法,包括以下步骤:S1、根据市场监管平台中的数据,根据检查项目对市场中的所有商家进行分类,并计算每个商家的预测不合格率F(i);S2、根据每个商家的预测不合格率,计算每个商家的最终检查优先级F

【技术实现步骤摘要】
一种基于大数据的确定抽检商家的方法
本专利技术属于互联网大数据应用
,具体涉及一种基于大数据的确定抽检商家的方法。
技术介绍
加强食用农产品市场销售质量安全监督管理,是保证食用农产品质量安全的重要途径。为此,各地的集中交易市场都开始建立自己的实用农产品市场监管平台,以实现食用农产品质量信息、销售信息的信息化采集和记录。这类平台通常包括三类用户:市场监管方、销售者(商家)和购货者(买家)。其中,市场监管方包括了市场管理部门和政府的基层监管部门,他们可以通过平台对销售者的基础信息和每天的购销信息进行线上和线下(现场)的检查,并在平台上给出检查结果和相关的整改要求,例如摊主姓名、手机号、身份证号、经营证照、所述市场的经营领域和摊位号等,以及提供每天的购销信息,例如进货的农产品品种、总重量、单价、产地、购货凭证和质检情况等,销售的品种、单价、重量、金额等,以供市场监管方检查;购货者是指产品的购买者,他们可以在平台上对所购商品对应的销售者进行评价和评分,也可以在平台上对销售者进行投诉。例如,如图1所示是监管方进行现场检查时的平台界面,检查人员可以根据实际情况进行填报,最后得出是否合格的结论,如果不合格,平台可以根据检查情况自动生成哪些方面需要整改的要求,也可以由检查人员手动输入整改要求。对于市场监管方来说,每天进行现场检查所有摊位的情况工作量太大且效率较低,可能导致大量的重复劳动,传统的抽检方法是监管方每天按顺序或者随机抽取部分商家进行检查,这种方法的优点是简单易行,但是这种方式可能导致监管方对近期市场中正在发生的食品安全问题不能及时获知。大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化力的海量、高增长和多样化的信息资产。上述市场监管平台上的实时更新的各种数据信息即为大数据信息,为更加高效准确的对市场上的商家进行质量抽检,如何对上述平台的数据信息进行整合,使监管方能够根据其内容自动需要抽检的商家列表成为需要进一步思考的方向。
技术实现思路
针对现有技术中的上述不足,本专利技术提供的基于大数据的确定抽检商家的方法解决了传统市场商家抽检过程中不够准确、效率低下且实时食品质量安全不能及时获知的问题。为了达到上述专利技术目的,本专利技术采用的技术方案为:一种基于大数据的确定抽检商家的方法,包括以下步骤,S1、根据市场监管平台中的检查项目数据对市场中的所有商家进行分类,并计算每个商家的预测不合格率F(i);其中,i=1,2,...m,m表示市场中总的商家数;S2、根据每个商家的预测不合格率,计算每个商家的最终检查优先级F*(i);S3、将市场中多有商家按照F*(i)降序排列,将F*(i)值最大的K个商家自动生成商家列表,在完成现场检查后,将商家检查情况进行更新,并将相应数据存入市场监管平台;其中,K为监管方手动设置的当天需要现场检查的商家数目。进一步地,所述步骤S1具体为:S11、将市场中的所有商家按照所销售的产品的检查项目是否相同进行分类;S12、根据市场平台中的数据,以每类商家的历史检查记录为基础建立数据集D={D1,D2,…DL};其中,下标L表示属于同一类产品销售商家的数量;Di={(x1,y1),(x2,y2),…(xn,yn)}表示商家i的检查记录,xn表示第n次检查时该商家各项属性的情况,记为表示第n次检查时属性v的值,yn表示第n次检查的结果,若检查合格yn=0,否则yn=1;所述属性为监管方进行现场检查时的对应检查项目;S13、将每类商家的数据集D按照N:1的比例随机划分为训练集S和测试集T;其中,训练集S中的样本数是T中样本数的N倍;S14、基于每类商家的训练集S,使用逻辑回归模型为每类商家学习,得到一组不合格率预测模型{f(1),f(2),...,f(M)};其中,M为不合格预测模型的个数;S15、利用测试集T,对M个不合格率预测模型{f(1),f(2),...,f(M)}进行性能测试,将预测准确率最高的模型作为这类商家最终的不合格率预测模型,并记为F;S16、基于每类商家的最终不合格率预测模型,计算市场中每个商家的预测不合格率F(i)(i=1,2,…,m),其中m表示市场中总的商家数;其中,每个商家的预测不合格率F(i)的计算公式为:其中,表示商家i所述类别的最终不合格预测模型F中j的权重,b*表示F中的偏置项,表示当前商家i的属性j的值。进一步地,所述步骤S2中每个商家的最终检查优先级F*(i)的计算公式为:其中,F(i)表示每个商家的预测不合格率;Ti表示距离商家i最近一次现场检查的时间;γ∈(0,1)为监管方手动设置的不合格率阈值。进一步地,所述步骤S3中更新商家检查情况的方法具体为:将已经完成现场检查的商家的Ti设置为0,且将检查不合格的商家的F*(i)直接设置为γ,即将该商家在生成下一次的抽检商家列表时直接加入抽检商家列表。进一步地,所述步骤S14中训练第k不合格预测模型的方法具体为:其中k=1,2...M,M为不合格预测模型的个数;S141、为逻辑回归模型随机初始化一组权重及其偏置b(k);所述逻辑回归模型为:其中,xi表示训练集中第i个样本;表示在第k个预测模型中第v个属性的权重;S142、通过调整权重及其偏置b(k)参数,来优化逻辑回归模型,得到第k不合格预测模型。进一步地,所述步骤S142中,优化逻辑回归模型的方法具体为:通过均方差损失函数来度量预测模型结果f(k)(xi)与真实标记yi之间的误差,通过批量梯度下降法来最小化逻辑回归模型中的误差,得到第k不合格预测模型。所述均方差损失函数Z的计算公式为:其中,|S|表示训练集S中的样本数。本专利技术的有益效果为:本专利技术提供的基于大数据的确定抽检商家的方法根据监管平台中近期市场中实时发生的事件信息数据,每天对监管方自动生成当天需要进行现场检查的商家列表,有效的避免了传统市场商家抽检过程中不够准确、效率低下且实时食品类产品质量安全不能及时获知的问题。附图说明图1为本专利技术
技术介绍
中监管方进行现场检查时的平台界面。图2为本专利技术提供的实施例中基于大数据的确定抽检商家的方法流程图。图3为本专利技术提供的实施例中计算每个商家的预测不合格率方法流程图。图4为本专利技术提供的实施例中训练第k个商家不合格率预测模型方法流程图。具体实施方式下面对本专利技术的具体实施方式进行描述,以便于本
的技术人员理解本专利技术,但应该清楚,本专利技术不限于具体实施方式的范围,对本
的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本专利技术的精神和范围内,这些变化是显而易见的,一切利用本专利技术构思的专利技术创造均在保护之列。如图2所示,一种基于大数据的确定抽检商家的方法,包括以下步骤,S1、根据市场监管平台中的检查项目数据对市场中的所有商家进行分类,并计算每个商家的预测不合格率F(i);其中,i=1,2,…,m,m表示市场中总的商家数;如图3所示,上述步骤S1具体为:S11、将市场中的所有商家按照所销售的产品的检查项目是否相同进行分类;S12、根据市场平台中的数据,以每类商家的历史检查记录为基础建立数据集D={D1,D2,…DL};其中,下标L表示属于同一类产品销售商家的数量;Di={(x1,本文档来自技高网
...

【技术保护点】
1.一种基于大数据的确定抽检商家的方法,其特征在于,包括以下步骤,S1、根据市场监管平台中的检查项目数据对市场中的所有商家进行分类,并计算每个商家的预测不合格率F(i);其中,i=1,2,...m,m表示市场中总的商家数;S2、根据每个商家的预测不合格率,计算每个商家的最终检查优先级F*(i);S3、将市场中多个商家按照F*(i)降序排列,将F*(i)值最大的K个商家自动生成商家列表,在完成现场检查后,将商家检查情况进行更新,并将相应数据存入市场监管平台;其中,K为监管方手动设置的当天需要现场检查的商家数目。

【技术特征摘要】
1.一种基于大数据的确定抽检商家的方法,其特征在于,包括以下步骤,S1、根据市场监管平台中的检查项目数据对市场中的所有商家进行分类,并计算每个商家的预测不合格率F(i);其中,i=1,2,...m,m表示市场中总的商家数;S2、根据每个商家的预测不合格率,计算每个商家的最终检查优先级F*(i);S3、将市场中多个商家按照F*(i)降序排列,将F*(i)值最大的K个商家自动生成商家列表,在完成现场检查后,将商家检查情况进行更新,并将相应数据存入市场监管平台;其中,K为监管方手动设置的当天需要现场检查的商家数目。2.根据权利要求1所述的基于大数据的确定抽检商家的方法,其特征在于,所述步骤S1具体为:S11、将市场中的所有商家按照所销售的产品的检查项目是否相同进行分类;S12、根据市场平台中的数据,以每类商家的历史检查记录为基础建立数据集D={D1,D2,…DL};其中,下标L表示属于同一类产品销售商家的数量;Di={(x1,y1),(x2,y2),…(xn,yn)}表示商家i的检查记录,xn表示第n次检查时该商家各项属性的情况,记为表示第n次检查时属性v的值,yn表示第n次检查的结果,若检查合格yn=0,否则yn=1;所述属性为监管方进行现场检查时的对应检查项目;S13、将每类商家的数据集D按照N:1的比例随机划分为训练集S和测试集T;其中,训练集S中的样本数是T中样本数的N倍;S14、基于每类商家的训练集S,使用逻辑回归模型为每类商家学习,得到一组不合格率预测模型{f(1),f(2),...,f(M)};其中,M为不合格预测模型的个数;S15、利用测试集T,对M个不合格率预测模型{f(1),f(2),...,f(M)}进行性能测试,将预测准确率最高的模型作为这类商家最终的不合格率预测模型,并记为F;S16、基于每类商家...

【专利技术属性】
技术研发人员:高嵘丁熠赵良吉秦臻张黎邓伏虎赵洋
申请(专利权)人:成都博宇科技有限公司电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1