当前位置: 首页 > 专利查询>浙江大学专利>正文

基于深度玻尔兹曼机的电商网站违禁商品图片检测方法技术

技术编号:10472721 阅读:325 留言:1更新日期:2014-09-25 11:06
本发明专利技术公开了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测的方法。此方法由三个有效步骤组成:1)利用深度玻尔兹曼机模型对大量违禁商品图片样本以及负样本进行训练,得到较好的检测模型初始化参数,即违禁商品检测方法判别特征;2)利用反馈神经网络模型对步骤1)中所得参数进行微调,得到检测模型的最终参数;3)利用滑动窗口方法,对检测图片进行多尺度缩放,在不同尺度下进行滑动窗口操作,利用步骤2)中得到的模型检测每个窗口中是否存在违禁商品,最终判定待检测图片中是否包含违禁商品。通过DBM模型训练图像样本的过程,能够在保证训练速度的同时提取对数据有更本质刻画的特征,进而保证了目标检测的准确率和召回率。

【技术实现步骤摘要】

本专利技术属于计算机视觉领域,涉及电商网站中违禁商品图片检测方法。
技术介绍
随着电子商务的高速发展,越来越多的商品可以进行网上交易,一些法律违禁商 品,也在电子商务平台上日益活跃,如枪支、刀具、药品等。为了逃避法律责任追究,贩卖违 禁商品的卖家往往不会直接在商品名称上标注枪支、刀具等,而是将所卖物品以图片方式 呈现,给清查过程带来很大难度,在目前的工业应用中也没有成熟的方法。因此,电商网站 中违禁商品图片检测成为一个急需解决的问题。 传统的图片检测方法,特征提取都是基于浅层学习,使用深度学习方法进行图片 检测的研究很少。与浅层学习相比,深度学习能够提取更好的图片特征,对数据有更本质的 刻画,从而更利于图片的分类。 玻尔兹曼机是深度学习的一个典型应用。深度玻尔兹曼机(DBM, Deep Boltzmann Machine)模型是多个限制玻尔兹曼机(RBM,Restricted Boltzmann Machine)模型的叠加。 RBM模型是一个两层结构、对称连接、层内无连接、层间全连接的无自反馈的随机神经网络 模型,包括可见层和隐层。RBM模型在给定可见层(输入数据)时,各个隐层节点的激活概率 相互独立;反之,在给定隐层时,各个可见层节点的激活概率相互独立。多个RBM模型堆叠: 前一个RBM的隐层作为后一个RBM的可见层,构成DBM模型。
技术实现思路
本专利技术的主要目的是针对电商网站中出现的各类违禁商品图片,利用深度玻尔兹 曼机模型实现一种简单有效的检测方法,在保证训练时间不大幅增加的基础上,提升违禁 商品图片检测的准确率。 本专利技术提供了一种,包括 以下步骤: 1)采集图片数据,对图片数据进行预处理。 2)构建DBM模型,确定模型的层数,可见层、隐层节点数目。 3)训练DBM模型。 4)利用反向传播算法对步骤3)得到的DBM模型初始化参数微调。 5 )利用滑动窗口方法在待检测图片上检测违禁商品,统计待检测图片的所有尺度 所有窗口的判定结果,判断待检测图片中是否含有违禁商品,以及违禁商品位置。 所述的违禁商品图片检测方法适用于各类目标的检测,针对不同的检测目标,采 集不同的图片数据。 所述的采集图片数据,以刀具检测为例。图片大小为200*200像素,刀具占据图片 内容主体部分,图片数目10000张。 所述的图片数据预处理方法是将每张图片切分为只包含违禁商品的部分和只包 含背景的部分,统一缩放为28*28像素大小的灰度图片。只包含刀具的灰度图片作为模型 输入的正样本,只包含背景的灰度图片作为模型输入的负样本。取5000张的正样本和同等 数目的负样本作为模型的训练集,取1500张的正样本和同等数目的负样本作为模型的测 试集。 所述的构建DBM模型包括设置DBM模型层数,可见层、隐层节点数目。DBM层数 越多,模型泛化能力越强,但训练耗时也越多,兼顾模型精度和训练时间,将DBM模型层数 设置为3层;DBM模型可见层节点由图片样本本身28*28=784个像素以及图片中心区域 10*10=100个像素的组合构成,共884个节点,我们认为,样本图片的中心区域包含的信息 比边缘区域更丰富,叠加后能够增加中心区域部分的权重,利于DBM模型从图片样本中提 取更鲁棒的特征;DBM模型隐层1节点数目为3000个,相当于将884个节点的可见层映射 到3000个节点的隐层中,将可见层进一步展开,可以发现更多信息;隐层2节点数目为450 个,相当于对隐层1结果进行采样,从中总结出有用信息。 所述的训练DBM模型是采用吉布斯交叉采样方法逐层训练,迭代次数为70次。 所述的DBM模型初始化参数微调是在DBM模型第二层隐层上增加2个节点的输出 层,表示当前可见层接受的输入数据样本的所属类别,采用反向传播算法以及训练集、测试 集数据对DBM模型进行迭代训练,迭代次数为50次,得到DBM模型的最终参数,即违禁商品 图片检测的判别特征。 所述的滑动窗口方法是将待检测图片缩放到不同尺度,分别进行滑动窗口操作。 滑动窗口大小设置为28*28,与DBM模型训练集、测试集样本大小一致,滑动窗口步长设置 为2个像素,每次将滑动窗口中的图片内容转换为灰度图,作为DBM模型的可见层输入,结 合微调后的参数,计算输出层结果,判定该窗口中当前图片部分是否是刀具。 本专利技术在保证训练时间不大幅增加的基础上,提升了图片检测的准确率。 【附图说明】 图1是本专利技术一种流程 图。 图2是深度玻尔兹曼机模型结构图。 图3是检测违禁商品图片结果示意图。 【具体实施方式】 下面结合本专利技术中的附图,对本专利技术的技术方案进行清晰、完整地描述。基于本 专利技术的实施例,本领域普通技术人员在没有做创造性劳动的前提下所获得的所有其他实施 例,都属于本专利技术保护的范围。 本专利技术提供了一种,图1 展示了该方法的整体流程。具体实 施步骤如下: 步骤1,采集图片数据,对图片数据进行预处理。以刀具检测为例,采集图片数据为刀 具图片,图片大小为200*200像素。每张图片中违禁商品占据图片内容主体部分,图片数 目10000张。将每张图片切分为只包含违禁商品的部分和只包含背景的部分,统一缩放为 28*28大小的灰度图片。只包含违禁商品的灰度图片作为模型输入的正样本,只包含背景的 灰度图片作为模型输入的负样本。取5000张正样本和同等数目的负样本作为模型的训练 集,取1500张正样本和同等数目的负样本作为模型的测试集。 步骤2,构建DBM模型。如图2矩形框内模型结构所示,设定DBM模型层数为3层, 可见层节点数为884个,隐层1节点数为3000个,隐层2节点数目为450个。层与层之间 无向全连接,层内无连接。 步骤3,训练DBM模型。采用吉布斯交叉采样方法对DBM模型逐层训练,迭代次数 为70次,得到模型初始化参数。 步骤4,利用反向传播算法对步骤3得到的DBM模型的初始化参数微调。在DBM模 型隐层2上增加包含2个节点的输出层,如图2中顶部的2个节点,表示当前可见层接受的 输入数据样本的所属类别,采用反向传播算法以及训练集、测试集数据对DBM模型进行迭 代训练,迭代次数为50次,得到DBM模型的最终参数,即违禁商品图片检测的判别特征。 步骤5,利用滑动窗口方法在待检测图片上检测违禁商品。将图3中左侧两张图片 作为待检测图片,缩放到不同尺度,分别进行滑动窗口操作。滑动窗口大小设置为28*28, 与DBM模型训练集、测试集样本大小一致,滑动窗口步长设置为2个像素,每次将滑动窗口 中的图片内容转换为灰度图,作为DBM模型的可见层输入,结合微调后的参数,计算输出层 结果,判定该窗口中当前图片部分是否是违禁商品。然后统计待测图片所有滑动窗口结果, 判断待检测图片中是否含有违禁商品,以及违禁商品位置。检测结果如图3中右侧两张图 片所示,图片中违禁商品被识别出并用红色矩形框标识。 最后,以上所述仅为本专利技术较有代表性的实施例。本领域的普通技术人员可在不 脱离本专利技术的专利技术思想情况下,对上述实施例做出种种修改或变化,因而本专利技术的保护范 围并不被上述实施例所限,而应该是符合权利要求数本文档来自技高网...

【技术保护点】
基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于该方法包括如下步骤:1)采集图片数据,对图片数据进行预处理;2)构建DBM模型,确定模型的层数,可见层、隐层节点数目;3)训练DBM模型; 4)利用反向传播算法对步骤3)得到的DBM模型初始化参数微调;5)利用滑动窗口方法在待检测图片上检测违禁商品,统计待检测图片的所有尺度所有窗口的判定结果,判断待检测图片中是否含有违禁商品,以及违禁商品位置。

【技术特征摘要】
1. 基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其特征在于该方法包括 如下步骤: 1) 采集图片数据,对图片数据进行预处理; 2) 构建DBM模型,确定模型的层数,可见层、隐层节点数目; 3) 训练DBM模型; 4) 利用反向传播算法对步骤3)得到的DBM模型初始化参数微调; 5 )利用滑动窗口方法在待检测图片上检测违禁商品,统计待检测图片的所有尺度所有 窗口的判定结果,判断待检测图片中是否含有违禁商品,以及违禁商品位置。2. 根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其 特征在于:图片数据预处理的方法为:将每张图片切分为只包含违禁商品的部分和只包含 背景的部分,统一缩放为28*28像素大小的灰度图片:只包含刀具的灰度图片作为模型输 入的正样本,只包含背景的灰度图片作为模型输入的负样本;取5000张的正样本和同等数 目的负样本作为模型的训练集,取1500张的正样本和同等数目的负样本作为模型的测试 集。3. 根据权利要求1所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其 特征在于:所述的DBM模型层数设置为三层。4. 根据权利要求3所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其 特征在于:三层结构的DBM模型包含一个可见层和两个隐层:可见层用于接受样本输入,隐 层用于拟合样本分布。5. 根据权利要求4所述的基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,其 特征在于:所述的DBM模型可见...

【专利技术属性】
技术研发人员:陈纯阮莹宋明黎张瑞周星辰卜佳俊
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有1条评论
  • 来自[未知地区] 2014年12月10日 11:46
    尼尔斯·亨利克·戴维·玻尔NielsHenrikDavidBohr1885.10.7~1962.11.18)丹麦物理学家
    0
1