一种机器学习分类模型的建立方法、装置及系统制造方法及图纸

技术编号:17346734 阅读:23 留言:0更新日期:2018-02-25 12:12
本申请提供了一种机器学习分类模型的建立方法、装置及系统,其中,方法包括:检测产品图像中的包含产品主体的标注框;采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。采用本申请提供的这些技术方案,能够减少人工标注样本的工作量,增强分类模型的可实用性。

A method, device and system for the establishment of a machine learning classification model

The invention provides a method, including establishing device and system, machine learning classification model, methods: the box marked detection products of the image contains the main body of the product; the segmentation method based on label box, the box marked products within the main segmentation results, the first will be the first segmentation; the segmentation results and second segmentation results of the label as a sample, using the sample of deep learning training classification model. The application of these technical schemes can reduce the workload of manual annotation samples and enhance the practicability of the classification model.

【技术实现步骤摘要】
一种机器学习分类模型的建立方法、装置及系统
本申请涉及机器学习领域,特别涉及一种机器学习分类模型的建立方法、装置及系统。
技术介绍
近年来,图像分割方法在互联网的发展中发挥着非常重要的作用。由于互联网展现图像需要综合考虑美观度和点击率,尤其是在电子商务网站上。因此,网站设计师需要对图像中的主体进行适应性设计,如添加文字素材,颜色调整等等。而图像中的主体就是通过图像分割方法从原始的图像中分割出来的表征产品本身的部分。目前,常用的图像分割方法有两大类,一类是传统分割方法,另一类是基于深度学习的分割方法。其中,传统分割方法通常是以人为设计的特征(如颜色、纹理特征)为基础,通过机器学习一个分类模型,利用该分类模型进行图像分割。这类分类器仅以简单的、人为设计的颜色、纹理特征来进行分割,由于拍摄环境、拍摄角度、产品种类的多种多样化,导致该分类模型对互联网中的产品图像的分割效果并不理想。其中,基于深度学习的分割方法,利用像素级的图像样本,通过机器学习一个分类模型,但深度学习过程需要大量的人工标注的像素级的图像样本,另外,分类模型后期优化也依赖于人工标注的像素级的图像样本,大量的人工成本限制了基于深度学习的分割方法的实用性。
技术实现思路
本申请所要解决的技术问题是提供一种机器学习分类模型的建立方法,减少人工标注样本的工作量,增强分类模型的可实用性。另外,本申请还提供一种机器学习分类模型的建立装置和系统,以保证上述方法在实际中的实现以及应用。在本申请第一方面提供了一种机器学习分类模型的建立方法,该方法包括:检测产品图像中的包含产品主体的标注框;采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;统计产品图像对应的第一分割结果,将统计到的第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习得到一个分类模型。在本申请第一方面提供了一种机器学习分类模型的建立装置,该装置包括:检测单元,用于检测产品图像中的包含产品主体的标注框;粗分割单元,用于采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;训练单元,用于将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。在本申请第一方面提供了一种机器学习分类模型的建立系统,该系统包括:检测器、基于标注框的分类器和分类模型训练器;其中,检测器,用于检测产品图像中的包含产品主体的标注框;其中,基于标注框的分类器,用于采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;其中,分类模型训练器,用于将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。与现有技术相比,本申请提供的技术方案具有以下优点:本申请提供的技术方案,提出了半监督方法的方式进行模型学习,在学习时,不再直接采用大量的人工标注的像素级的产品图像作为样本,而是提出了以“少量人工标注的像素级的产品图像+大量产品主体的标注框”为样本进行模型学习的方式。其中,大量产品主体标注框是不需要通过人工方式,而是通过检测器机器检测就可以得到的样本。这种方式大大减少了学习模型需要的人工标注量,另外,采用基于标注框的分割方法对标注框内的产品主体进行分割得到的第一分割结果,能够保证第一分割结果作为样本数据的可靠性。本申请提供的技术方案提供的这种半监督学习方式,大大减少样本标注的工作量,为了学习到强大的分类模型,提出了采用像素级标注和标注框相结合的方式进行样本标注,因此,在本申请中,只需要提供少量的像素级的图像和大量只有标注框的数据,就可以学习到强大的分类模型,大大提高了深度学习分类模型的可实用性。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请提供的一种机器学习分类模型的建立方法实施例1的流程图;图2是本申请提供的服装类产品图像的检测结果示意图;图3是本申请提供的服装类产品图像的第一分割结果示意图;图4是本申请提供的一种机器学习分类模型的建立方法实施例2的流程图;图5是本申请提供的一种机器学习分类模型的建立方法实施例3的流程图;图6是本申请提供的一种机器学习分类模型的建立方法实施例4的流程图;图7是本申请提供的一种机器学习分类模型的建立方法实现过程的示意图;图8是本申请提供的一种机器学习分类模型的建立装置的结构图;图9是本申请提供的一种机器学习分类模型的建立系统的结构图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。参见图1,图1是本申请提供的一种机器学习分类模型的建立方法的流程图,如图1所示,该方法包括步骤101至步骤103;步骤101:检测产品图像中的包含产品主体的标注框。本申请实施例提供的方法可以适用于互联网领域中,在互联网领域产品图像的种类众多,为了适应于某一类产品图像的检测处理,预先针对产品类型创建对应的检测器。则步骤101在实现时,可以根据产品图像中产品归属的类型选择对应的检测器,进而利用该检测器对这一类型产品的产品图像进行检测处理,以检测得到包含产品主体的标注框。在本申请中,标注框是指能够标注出产品图像中产品主体区域的图框。为了方便本领域技术人员清楚地理解的本申请实施例提供的方法,接下来以电子商务网站上的服装类的产品图像为例对步骤101的实现进行解释说明。服装类的产品图像需要由服装检测器进行检测,而服装检测器可以通过任意一种方式生成:(1)采用R-CNN,R-CNN(Region-basedConvolutionalNeuralNetworks,基于区域的卷积神经网络)是一种通用物体检测器,R-CNN先对图像中可能是物体的区域进行过滤得到候选区域,再采用深度卷积神经网络对候选区域进行分类,最后综合各个区域的置信度得出物体的位置,将该位置以标记框的形式呈现。为了适应于服装类产品图像的检测场景,可以预先收集一些服装类的产品图像作为样本数据,利用这些样本数据重新训练R-CNN得到服装检测器。(2)采用DPM,DPM(DeformablePartModel,可变形部件模型)是一款非常实用的物体检测器,为了使DP本文档来自技高网...
一种机器学习分类模型的建立方法、装置及系统

【技术保护点】
一种机器学习分类模型的建立方法,其特征在于,所述方法包括:检测产品图像中的包含产品主体的标注框;采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。

【技术特征摘要】
1.一种机器学习分类模型的建立方法,其特征在于,所述方法包括:检测产品图像中的包含产品主体的标注框;采用基于标注框的分割方法,对所述标注框内的产品主体进行分割,得到第一分割结果;将所述第一分割结果和预先标注的第二分割结果作为样本,采用所述样本进行深度学习训练得到分类模型。2.根据权利要求1所述的机器学习分类模型的建立方法,其特征在于,所述方法还包括:利用所述分类模型对待分割的产品图像进行分割,得到第三分割结果。3.根据权利要求2所述的机器学习分类模型的建立方法,其特征在于,所述方法还包括:利用判别式模型对所述第三分割结果进行修正,得到第四分割结果。4.根据权利要求3所述的机器学习分类模型的建立方法,其特征在于,所述判别式模型包括:基于条件随机场理论的模型。5.根据权利要求2所述的机器学习分类模型的建立方法,其特征在于,所述方法还包括:计算所述待分割的产品图像对应的第三分割结果与所述待分割的产品图像中包含产品主体的标注框的交并比,并判断所述交并比是否小于预设交并比阈值;如果是,则将所述待分割的产品图像推送给后台人工维护系统。6.根据权利要求3所述的机器学习分类模型的建立方法,其特征在于,所述方法还包括:利用所述第四分割结果修正所述分类模型的参数,以实现对分类模型...

【专利技术属性】
技术研发人员:赵小伟高洋华先胜
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1