一种图像处理方法及装置制造方法及图纸

技术编号:17049306 阅读:17 留言:0更新日期:2018-01-17 18:10
本申请公开了一种图像处理方法及装置,所述方法包括:获取样本图片的标注信息、图像维度特征和文字维度特征;其中,所述标注信息至少包括所述图片的内容属性;所述样本图片的图像维度特征与所述样本图片包含的文本区域相关联;利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征,建立图片识别模型;所述图片识别模型用于识别待处理图片的内容属性。本申请有效提高了图片识别的准确率。

A method and device for image processing

The invention discloses an image processing method and device. The method includes: information, image features and text feature dimension dimension annotation to obtain the sample picture; among them, the annotation information content attributes including at least the picture; associated text image dimension features of the sample images and the sample images. Contains; using the sample image annotation information, dimensions of the image and the text feature dimension, establish image recognition model; the image recognition model for image processing to content attribute recognition. This application effectively improves the accuracy of image recognition.

【技术实现步骤摘要】
一种图像处理方法及装置
本申请涉及数据处理
,尤其涉及一种图像处理方法及装置。
技术介绍
随着互联网的发展,用户可以使用互联网方便地传播、交流各种信息。用户在享受互联网传播、获取信息的便利的同时,也饱受垃圾信息的困扰。其中,图片形式的垃圾信息在各种电子商务平台、论坛社区中泛滥,例如广告图片、诈骗图片等。用户在浏览、搜索图片信息时,大量存在的垃圾图片,降低了用户获取有效信息的效率,严重影响了用户体验。因此,如何标识图片的可信性成为一个重要的问题。现有技术中,在标识图片信息的可信性时,主要是通过检测垃圾图片例如广告图片的方式来标识非法图片。具体地,现有技术存在一种使用CNN深度学习模型进行分类的图片识别方法,利用深度学习自主提取图片特征以对图片进行分类,进而判断是否垃圾图片。然而,这种方式非常依赖于样本图片的标注数据,对区别于样本图片特征的其他图片无法进行准确识别,因此存在准确性较低、灵活性不强的缺陷。
技术实现思路
有鉴于此,本申请提供了一种图像处理方法及装置,用以解决现有技术对图像处理的准确性较低的技术问题。为解决上述技术问题,本申请实施例的第一方面,提供了一种图像处理方法,包括:分别对样本图片和待处理图片进行特征提取处理,获取所述样本图片的图像维度特征、文字维度特征以及所述待处理图片的图像维度特征、文字维度特征,其中,所述样本图片和所述待处理图片均包括文本区域,所述图像维度特征与所述文本区域相关联;比较所述待处理图片的图像维度特征与所述样本图片的图像维度特征的距离以及所述待处理图片的文字维度特征与样本图片的文字维度特征的距离,获得比较结果;根据所述比较结果、所述样本图片的内容属性确定所述待处理图片的内容属性。可选的,所述图像维度特征通过以下方式得到:将所述图片划分为多个颜色通道,提取每个颜色通道对应的文字区域;对所述每个颜色通道对应的文字区域进行合并处理,获取文本行区域;基于获取的所述文本行区域提取所述图片的图像维度特征。可选的,所述图像维度特征包括所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。可选的,所述文字维度特征通过以下方式得到:对图片进行文字识别处理,获得文字识别结果;将所述文字识别结果与预先存储的关键词库中的关键词进行匹配,获得匹配结果;根据所述匹配结果获取所述图片的文字维度特征;其中,所述图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数,和/或,与所述文字识别结果匹配的关键词的置信度的和值。为解决上述技术问题,本申请实施例的第二方面,提供了一种图像处理方法,包括:获取样本图片的标注信息、图像维度特征和文字维度特征;其中,所述标注信息至少包括所述图片的内容属性;所述样本图片的图像维度特征与所述样本图片包含的文本区域相关联;利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征,建立图片识别模型;所述图片识别模型用于识别待处理图片的内容属性。可选的,获取所述样本图片的图像维度特征包括:将所述样本图片划分为多个颜色通道,提取每个颜色通道对应的文字区域;对所述每个颜色通道对应的文字区域进行合并处理,获取文本行区域;基于获取的所述文本行区域提取所述样本图片的图像维度特征。可选的,所述样本图片的图像维度特征包括所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。可选的,获取所述样本图片的文字维度特征包括:对所述样本图片进行文字识别处理,获得文字识别结果;将所述文字识别结果与预先存储的关键词库中的关键词进行匹配,获得匹配结果;根据所述匹配结果获取所述样本图片的文字维度特征;其中,所述样本图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数,和/或,与所述文字识别结果匹配的关键词的置信度的和值。可选的,所述方法还包括:获取与所述样本图片对应的用户行为特征和/或用户信用特征;所述利用所述样本图片的标注信息、图像维度特征和文字维度特征,建立图片识别模型包括:利用所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征建立图片识别模型。可选的,所述利用所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征建立图片识别模型包括:将获取的所述样本图片的标注信息、图像维度特征、文字维度特征、用户行为特征和/或用户信用特征输入支持向量机SVM模型,训练得到图片识别模型。可选的,所述方法还包括:建立样本图片、上传所述样本图片的用户的标识、用户行为特征/或用户信用特征的对应关系;所述获取与所述样本图片对应的用户行为特征和/或用户信用特征包括:利用所述样本图片、上传所述样本图片的用户的标识、用户行为特征和/或用户信用特征的对应关系,获取与所述样本图片对应的用户行为特征和/或用户信用特征。根据本申请实施例的第三方面,提供了一种图像处理方法,包括:对待处理图片进行特征提取处理,获取所述待处理图片的图像维度特征和文字维度特征;其中,所述待处理图片的图像维度特征与所述待处理图片包含的文本区域相关联;利用预先建立的图片识别模型、所述图像维度特征和所述文字维度特征对所述待处理图片进行识别,获得识别结果;所述识别结果用于标识所述待处理图片的内容属性。可选的,所述方法还包括:接收对所述待识别图片的识别结果的判定操作,根据所述判定操作更新所述待识别图片的标注信息;利用更新后的所述标注信息更新所述图片识别模型。根据本申请实施例的第四方面,提供了一种图像处理装置,包括:特征获取单元,用于获取样本图片的标注信息、图像维度特征和文字维度特征;其中,所述标注信息至少包括所述图片的内容属性;所述样本图片的图像维度特征与所述样本图片包含的文本区域相关联;模型建立单元,用于利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征,建立图片识别模型;所述图片识别模型用于识别待处理图片的内容属性。可选的,所述特征获取单元包括图像特征提取单元和文字特征提取单元,其中,所述图像特征提取单元包括:文字区域提取单元,用于将所述样本图片划分为多个颜色通道,提取每个颜色通道对应的文字区域;合并单元,用于对所述每个颜色通道对应的文字区域进行合并处理,获取文本行区域;图像维度特征获取单元,用于基于获取的所述文本行区域提取所述样本图片的图像维度特征。可选的,所述图像维度特征提取单元用于基于获取的所述文本行区域提取所述样本图片的图像维度特征包括:所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。可选的,所述特征获取单元包括图像特征提取单元和文字特征提取单元,其中,所述文字特征提取单元包括:文字识别单元,用于对所述样本图片进行文字识别处理,获得文字识别结果;匹配单元,用于将所述文字识别结果与预先存储的关键词库中的关键词进行匹配,获得匹配结果;文字维度特征获取单元,用于根据所述匹配结果获取所述样本图片的文字维度特征;其中,所述样本图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数,和/或,与所述文字识别结本文档来自技高网...
一种图像处理方法及装置

【技术保护点】
一种图像处理方法,其特征在于,包括:分别对样本图片和待处理图片进行特征提取处理,获取所述样本图片的图像维度特征、文字维度特征以及所述待处理图片的图像维度特征、文字维度特征,其中,所述样本图片和所述待处理图片均包括文本区域,所述图像维度特征与所述文本区域相关联;比较所述待处理图片的图像维度特征与所述样本图片的图像维度特征的距离以及所述待处理图片的文字维度特征与样本图片的文字维度特征的距离,获得比较结果;根据所述比较结果、所述样本图片的内容属性确定所述待处理图片的内容属性。

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:分别对样本图片和待处理图片进行特征提取处理,获取所述样本图片的图像维度特征、文字维度特征以及所述待处理图片的图像维度特征、文字维度特征,其中,所述样本图片和所述待处理图片均包括文本区域,所述图像维度特征与所述文本区域相关联;比较所述待处理图片的图像维度特征与所述样本图片的图像维度特征的距离以及所述待处理图片的文字维度特征与样本图片的文字维度特征的距离,获得比较结果;根据所述比较结果、所述样本图片的内容属性确定所述待处理图片的内容属性。2.根据权利要求1所述的方法,其特征在于,所述图像维度特征通过以下方式得到:将所述图片划分为多个颜色通道,提取每个颜色通道对应的文字区域;对所述每个颜色通道对应的文字区域进行合并处理,获取文本行区域;基于获取的所述文本行区域提取所述图片的图像维度特征。3.根据权利要求2所述的方法,其特征在于,所述图像维度特征包括所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。4.根据权利要求1所述的方法,其特征在于,所述文字维度特征通过以下方式得到:对图片进行文字识别处理,获得文字识别结果;将所述文字识别结果与预先存储的关键词库中的关键词进行匹配,获得匹配结果;根据所述匹配结果获取所述图片的文字维度特征;其中,所述图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数,和/或,与所述文字识别结果匹配的关键词的置信度的和值。5.一种图像处理方法,其特征在于,包括:获取样本图片,其中,所述样本图片包括文本区域;获取样本图片的标注信息、图像维度特征和文字维度特征,其中,所述标注信息包括所述图片的内容属性;所述样本图片的图像维度特征与所述文本区域相关联;利用所述样本图片的标注信息、所述图像维度特征和所述文字维度特征,建立图片识别模型;所述图片识别模型用于识别待处理图片的内容属性。6.根据权利要求1所述的方法,其特征在于,获取样本图片的图像维度特征包括:将所述样本图片划分为多个颜色通道,提取每个颜色通道对应的文字区域;对所述每个颜色通道对应的文字区域进行合并处理,获取文本行区域;基于获取的所述文本行区域提取所述样本图片的图像维度特征。7.根据权利要求6所述的方法,其特征在于,所述样本图片的图像维度特征包括所述文本行区域的个数、所述文本行区域与非文字区域面积的比值、文本行区域中心位置水平偏移方差及文本行区域中心位置竖直偏移方差中的一个或任意组合。8.根据权利要求5所述的方法,其特征在于,获取样本图片的文字维度特征包括:对所述样本图片进行文字识别处理,获得文字识别结果;将所述文字识别结果与预先存储的关键词库中的关键词进行匹配,获得匹配结果;根据所述匹配结果获取所述样本图片的文字维度特征;其中,所述样本图片的文字维度特征包括与所述文字识别结果匹配的关键词的个数,和/或,与所述文字识别结果匹配的关键词的置信度的和值。9.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取与所述样本图片对应的用户行为特征和/或用户信用特征;所述利用所述样...

【专利技术属性】
技术研发人员:金炫
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1