对包括文字内容和图像内容的图片识别制造技术

技术编号：17542044 阅读：31 留言：0更新日期：2018-03-24 19:34

本发明专利技术的目的是提供一种图片识别方法、装置以及计算机设备、计算机可读存储介质与计算机程序产品。图片识别装置定位图片中的文字区域和图像区域；对所述文字区域中的文字内容提取相应的词向量；对所述图像区域提取图像特征向量；将所述词向量与所述图像特征向量进行整合，以确定所述图片的语义。与现有技术相比，本发明专利技术提供了一种由计算机设备自动对图片进行识别的方案，从而对包括文字内容和图像内容的图片在发布前进行内容识别和审核。

Picture recognition including text content and image content

The aim of the present invention is to provide a picture recognition method, a device and a computer device, a computer readable storage medium and a computer program product. The text area and the image region of the image recognition device positioning in the picture; word vector corresponding to the text content of the text in the region of the image extraction; feature vector is extracted from the image region; integrate the word vectors and the image feature vector, to determine the image semantic. Compared with the existing technology, the present invention provides a scheme for automatically identifying pictures by computer equipment, so that content recognition and examination of pictures including text content and image content before publication can be carried out.

全部详细技术资料下载

【技术实现步骤摘要】
对包括文字内容和图像内容的图片识别
本专利技术涉及图片识别
，具体涉及一种对包括文字内容和图像内容的图片进行语义识别的技术。
技术介绍
目前的图片识别技术对于内容比较单一的图片的准确率较高，从而自动审核完成较好。例如，对于内容要么为文字、商标，要么为单一主题的图片，图片审核系统可以直接通过OCR技术来识别图片中的文字或商标，或者通过基于深度学习的图像分类技术对图片中的元素进行识别，以判断其是否符合发布标准。然而，对于同时包括文字内容和图像内容的图片，现有的图片识别技术较难适用，多通过人工审核进行，这使得审核人员的压力较大，且审核周期也较长。
技术实现思路
本专利技术的目的是提供一种图片识别方法、装置以及计算机设备、计算机可读存储介质与计算机程序产品。根据本专利技术的一个方面，提供了一种图片识别方法，其中，该方法包括以下步骤：-定位图片中的文字区域和图像区域；-对所述文字区域中的文字内容提取相应的词向量；-对所述图像区域提取图像特征向量；-将所述词向量与所述图像特征向量进行整合，以确定所述图片的语义。根据本专利技术的一个方面，还提供了一种图片识别装置，其中，该装置包括：用于定位图片中的文字区域和图像区域的装置；用于对所述文字区域中的文字内容提取相应的词向量的装置；用于对所述图像区域提取图像特征向量的装置；用于将所述词向量与所述图像特征向量进行整合，以确定所述图片的语义的装置。根据本专利技术的一个方面，还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现根据本专利技术的一个方面的一...
对包括文字内容和图像内容的图片识别

【技术保护点】
一种图片审核方法，其中，该方法包括以下步骤：‑定位图片中的文字区域和图像区域；‑对所述文字区域中的文字内容提取相应的词向量；‑对所述图像区域提取图像特征向量；‑将所述词向量与所述图像特征向量进行整合，以确定所述图片的语义。

【技术特征摘要】
1.一种图片审核方法，其中，该方法包括以下步骤：-定位图片中的文字区域和图像区域；-对所述文字区域中的文字内容提取相应的词向量；-对所述图像区域提取图像特征向量；-将所述词向量与所述图像特征向量进行整合，以确定所述图片的语义。2.根据权利要求1所述的方法，其中，所述定位步骤具体包括：-通过目标检测模型识别图片中的文字区域和图像区域。3.根据权利要求2所述的方法，其中，所述目标检测模型通过以下步骤训练获得：-收集经标注有文字区域和图像区域的图片；-将所述经标注的图片输入待训练的目标检测模型，以进行模型训练，从而获得训练好的所述目标检测模型。4.根据权利要求1至3中任一项所述的方法，其中，所述词向量的提取步骤具体包括：-对所述文字区域进行字符识别，以获得所识别的字符；-从所识别的字符中提取所述词向量。5.根据权利要求1至4中任一项所述的方法，其中，所述图像特征向量的提取步骤具体包括：-通过图像分类模型对所述图像区域提取所述图像特征向量。6.根据权利要求1至5中任一项所...

【专利技术属性】
技术研发人员：邓玥琳，高光明，刘辉，丁飞，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人