一种图像识别方法、装置及设备制造方法及图纸

技术编号:18658567 阅读:31 留言:0更新日期:2018-08-11 14:40
本申请实施例公开了一种图像识别方法、装置及设备,为了能够在实际应用中有效识别出纹理、结构、样式较为简易的logo、图形或图案等目标图像内容,服务器可获取包含目标图像内容的原始图像。考虑到用户在实际扫描/拍摄目标图像内容时,可能会受到拍摄角度、对焦、光照等多种条件的影响,故在本说明书实施例中可以针对目标图像内容进行倍增处理,倍增处理能够针对目标图像内容进行不同方式的变换处理,并得到大量的变换图像,从而扩充了训练样本的数量。

Image recognition method, device and device

The embodiment of the present application discloses an image recognition method, device and device. In order to effectively identify the target image content such as texture, structure, simple-styled logo, graphics or pattern in practical application, the server can obtain the original image containing the target image content. Considering that the user may be affected by various conditions such as shooting angle, focusing, illumination and so on when actually scanning/shooting the content of the target image, the multiplication processing can be performed for the content of the target image in the embodiment of this specification, and the multiplication processing can be performed in different ways for the content of the target image, and the result is obtained. To a large number of transform images, thus expanding the number of training samples.

【技术实现步骤摘要】
一种图像识别方法、装置及设备
本申请涉及计算机
,尤其涉及一种图像识别方法、装置及设备。
技术介绍
目前,针对图像的识别技术应用日益广泛,特别是应用于一些运行在移动端上的应用(Application,App)上。具体而言,上述应用通常会提供相应的拍摄功能,如:增强现实(AugmentedReality,AR)拍摄,该AR拍摄功能能够在识别出拍摄对象(如:商品外包装、宣传海报等)的基础上,通过移动终端展示AR内容(如:广告、动画、互动游戏、优惠券等)。这就需要较为精准地识别出上述的拍摄对象,并在此基础上展示相应的AR内容。上述的拍摄对象往往具有较为丰富的纹理,现有技术中,常采用特征点检测匹配的方式对拍摄对象进行较为精确地识别。对于纹理较为简单的图像(如:logo),难以实现较为精准地识别。基于现有技术,我们需要一种更为有效的针对纹理较为简单的图像进行识别的方式。
技术实现思路
本说明书实施例提供一种图像识别方法、装置及设备,用以提供一种针对纹理较为简单的图像进行有效识别的方式。本说明书实施例提供的一种图像识别方法,包括:获取原始图像;其中,所述原始图像中包含目标图像内容;根据所述目标图像内容进行倍增处理,生成多个变换图像;将所述变换图像作为训练样本进行模型训练,得到图像识别模型,以针对包含目标图像内容的待识别图像进行识别。本说明书实施例提供的一种图像识别装置,包括:获取模块,获取原始图像;其中,所述原始图像中包含目标图像内容;图像处理模块,根据所述目标图像内容进行倍增处理,生成多个变换图像;训练模块,将所述变换图像作为训练样本进行模型训练,得到图像识别模型,以针对包含目标图像内容的待识别图像进行识别。本说明书实施例提供的一种图像识别设备,所述设备包括:处理器、存储器,其中:所述存储器,存储图像识别程序;所述处理器,调用存储器中存储的图像识别程序,并执行:获取原始图像;其中,所述原始图像中包含目标图像内容;根据所述目标图像内容进行倍增处理,生成多个变换图像;将所述变换图像作为训练样本进行模型训练,得到图像识别模型,以针对包含目标图像内容的待识别图像进行识别。本说明书的实施例还提供一种非易失性计算机存储介质,用于针对简单图像进行识别,其中,所述的非易失性计算机存储介质存储有计算机可执行指令,所述计算机可执行指令设置为:获取原始图像;其中,所述原始图像中包含目标图像内容;根据所述目标图像内容进行倍增处理,生成多个变换图像;将所述变换图像作为训练样本进行模型训练,得到图像识别模型,以针对包含目标图像内容的待识别图像进行识别。本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:为了能够在实际应用中有效识别出纹理、结构、样式较为简易的logo、图形或图案等目标图像内容,服务器可获取包含目标图像内容的原始图像。考虑到用户在实际扫描/拍摄目标图像内容时,可能会受到拍摄角度、对焦、光照等多种条件的影响,故在本说明书实施例中可以针对目标图像内容进行倍增处理,倍增处理能够针对目标图像内容进行不同方式的变换处理,并得到大量的变换图像,从而扩充了训练样本的数量。进一步可以提升图像识别模型的识别准确度。对于本说明书实施例中的上述方法而言,其训练得到的图像识别模型对简易的目标图像内容的识别率较高,特别对于大量用户使用客户端进行扫描/拍摄的情况下,可以针对大量的简易的目标图像内容进行准确识别。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本说明书实施例提供的图像识别方法所基于的架构示意图;图2为本说明书实施例提供的图像识别过程;图3为本说明书实施例提供的图像识别方法在实际应用中的执行架构示意图;图4为本说明书实施例提供的针对logo进行标注的示意图;图5为本说明书实施例提供的针对logo进行投影变换的示意图;图6为本说明书实施例提供的针对logo进行显示效果变换的示意图图7为本说明书实施例提供的图像识别装置结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在本说明书的一个或多个实施例中,需要进行识别处理的目标图像内容,可认为是一种纹理、结构、样式较为简易的logo、图形或图案。为了更加有效地针对上述的目标图像内容进行识别,故在本说明书实施例中提出一种图像识别方法。如图1所示为本说明书实施例中的图像识别方法所应用于的架构。在图1中:服务器可认为是业务提供方后台的业务服务器,为了便于说明和理解,图1中仅以一台服务器表示,但其具体的架构可以采用分布式、集群式架构,或者仅是单一的大型服务器等,至于采用何种架构,通常将根据实际应用的需要所确定。在实际应用中,业务提供方通过该业务服务器,为大量用户所使用的业务客户端(以下简称为:客户端)提供业务服务。在本说明书实施例中,服务器可以使用简易图像训练得到相应的图像识别模型。该图像识别模型上线(通常可嵌入至客户端中)后,可以针对客户端所扫描/拍摄的对象(特别是简易图像)进行较为精确地识别。客户端运行在用户所使用的终端设备上,在一种惯常实施例中,该客户端中内置有上述训练得到的图像识别模型。那么,当用户通过该客户端进行扫描/拍摄时,该客户端便能够针对扫描或拍摄的对象(特别是简易图像)进行图像识别。当然,这里需要说明的是,在本说明书实施例中所描述的客户端进行扫描/拍摄,应理解为是客户端调用终端设备上的摄像器件(如:摄像头)进行扫描/拍摄。后续出现类似描述则不再过多进行赘述。基于图1所示的架构,下面对本说明书实施例中的图像识别方法进行详细阐述。具体如图2所示,为本说明书实施例中图像识别方法,包括以下步骤:步骤S201:获取原始图像,其中,所述原始图像中包含目标图像内容。在实际应用中,需要针对图像识别模型进行训练,该图像识别模型是否能够较为准确地对用户所扫描/拍摄的对象进行识别,往往受其训练样本的影响。因此,为了保证后续训练得到的图像识别模型的准确性,在本说明书实施例中,所述的原始图像中包含有标准的目标图像内容,例如:一幅包含标准logo的渲染图,其中该渲染图便可认为是原始图像,logo便可认为是目标图像内容。在本说明书实施例中,所述的原始图像可以是通过图像处理软件所生成的渲染图,也可以是经过拍摄所得到的照片,对此不进行限定。一般来说,在包含目标图像内容的原始图像中,目标图像内容的角度、色度、清晰度等均保持较优值,且图像噪声保持较低值,以便后续作为样本进行训练。步骤S203:根据所述目标图像内容进行倍增处理,生成多个变换图像。在实际应用中,用户使用客户端所扫描/拍摄的图像可能受到角度、对焦、光照等多种条件的影响,这无疑增加了对用户所拍摄的图像进行识别的难度。那么,为了保证针对用户所拍摄图像进行识别的准确性,故在本说明书实施例中,可以针对目标图像内容进行倍增处理。在本说明书实施例中,所述的倍增处理可以包括投影变本文档来自技高网...

【技术保护点】
1.一种图像识别方法,包括:获取原始图像;其中,所述原始图像中包含目标图像内容;根据所述目标图像内容进行倍增处理,生成多个变换图像;将所述变换图像作为训练样本进行模型训练,得到图像识别模型,以针对包含目标图像内容的待识别图像进行识别。

【技术特征摘要】
1.一种图像识别方法,包括:获取原始图像;其中,所述原始图像中包含目标图像内容;根据所述目标图像内容进行倍增处理,生成多个变换图像;将所述变换图像作为训练样本进行模型训练,得到图像识别模型,以针对包含目标图像内容的待识别图像进行识别。2.如权利要求1所述的方法,获取原始图像,具体包括:获取所述原始图像,并接收针对所述原始图像中包含的目标图像内容的标注操作,生成对应于所述目标图像内容的标注信息;其中,所述标注信息包括:标注区域信息、名称信息、类型信息中的至少一种。3.如权利要求1所述的方法,根据所述目标图像内容进行倍增处理,生成多个变换图像,具体包括:针对所述目标图像内容进行几何投影变换处理,生成多个几何投影变换图片。4.如权利要求3所述的方法,针对所述目标图像内容进行几何投影变换处理,具体包括:针对所述目标图像内容进行单应投影变换或仿射投影变换。5.如权利要求1所述的方法,根据所述目标图像内容进行倍增处理,生成多个变换图像,具体包括:针对所述目标图像内容进行显示效果变换处理,生成多个显示效果不同的变换图像。6.如权利要求5所述的方法,针对所述目标图像内容进行显示效果变换处理,生成多个显示效果不同的变换图像,具体包括:针对所述目标图像内容进行平滑滤波处理,生成带有虚焦显示效果的变换图像;针对所述目标图像内容添加椒盐噪声,生成带有噪声显示效果的变换图像;针对所述目标图像内容进行颜色空间转换处理,生成带有色调变换效果的变换图像。7.如权利要求1所述的方法,根据所述目标图像内容进行倍增处理,生成多个变换图像,具体包括:基于预先建立的背景图片库以及所述目标图像内容,生成背景替换图像。8.如权利要求1所述的方法,所述方法还包括:接收用户反馈的图像报错消息;根据所述图像报错消息,确定误识别图像;根据所述误识别图像进行迭代训练。9.如权利要求8所述的方法,根据所述误识别图像进行迭代训练,具体包括:将所述误识别图像作为背景图片,与所述目标图像内容进行倍增处理,生成变换图片,以进行迭代训练,或根据误识别的目标图像内容以及误识别图像,生成原始图像,以进行迭代训练,或建立误识别图像集合,并将该误识别图像集合中的误识别图像作为待训练样本进行迭代训练。10.如权利要求1~9中任一所述的方法,所述目标图像内容包括:简易的logo、图形或图案。11.一种图像识别装置,所述装置包括:获取模块,获取原始图像;其中,所述原始图像...

【专利技术属性】
技术研发人员:周明才张宇王楠杜志军何强
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1