从图像中识别出文字的方法和装置制造方法及图纸

技术编号：25186720 阅读：51 留言：0更新日期：2020-08-07 21:14

本发明专利技术公开了从图像中识别出文字的方法和装置。所述方法包括：获取待识别的图像集合；从所述图像集合中的各图像中分别提取出文本区域；从各文本区域中抽取出文字；对抽取出的文字进行识别，得到与各图像对应的文字识别结果。该技术方案的有益效果在于，由于避免了对图像进行整体的识别而是从中先提取出文本区域，能够大幅提高识别准确率，避免了图像中类似文字线条的干扰，在对海报等文字与背景融合得较好的图像中识别效果尤佳，可以兼容多种业务场景，减少图像数据生产、校验及运营成本，实现了自动探索图像中包含的内容线索，对于基于图像的数据挖掘有着重要帮助。

全部详细技术资料下载

【技术实现步骤摘要】
从图像中识别出文字的方法和装置
本专利技术涉及图像识别
，具体涉及从图像中识别出文字的方法和装置。
技术介绍
随着高科技信息化时代的到来和互联网计算机技术的发展，导致数量繁多的多媒体信息以指数级增长方式出现在人们日常生活之中，急剧增多的图像信息越来越引起了人们的关注，但是由于图像都以像素的形式存储着对象的颜色、亮度等原始信息，缺乏对图像内容的高层次的描述，很难通过对图像进行计算机分析、理解、检索和复用来自动识别内容。目前，利用OCR(OpticalCharacterRecognition，光学字符识别)等方式对文本进行识别，在技术上有了长足的进步，但是，在对图像进行直接识别时仍然存在一定的不足。例如，海报等图像中往往包含文字，而文字检测受到语种、文字分辨率、文字间距、分布情况、文字的背景、光照、颜色之类因素的影响，这类图像中的某些图案、纹理的背景很难与文字区分开来，如果直接对图像整体进行识别，难度较大，识别效果不能令人满意。
技术实现思路
鉴于上述问题，提出了本专利技术以便提供一种克服上述问...

【技术保护点】
1.一种从图像中识别出文字的方法，包括：/n获取待识别的图像集合；/n从所述图像集合中的各图像中分别提取出文本区域；/n从各文本区域中抽取出文字；/n对抽取出的文字进行识别，得到与各图像对应的文字识别结果。/n

【技术特征摘要】
1.一种从图像中识别出文字的方法，包括：
获取待识别的图像集合；
从所述图像集合中的各图像中分别提取出文本区域；
从各文本区域中抽取出文字；
对抽取出的文字进行识别，得到与各图像对应的文字识别结果。

2.如权利要求1所述的方法，其中，所述获取待识别的图像集合包括：
在多媒体资源库中的资源描述信息被更新时，获取所述资源描述信息中的海报放入所述图像集合。

3.如权利要求2所述的方法，其中，所述方法还包括：
获取所述资源描述信息中的文字描述信息，计算所述文字描述信息与所述文字识别结果的匹配度；
若所述匹配度达到预设阈值，则判定所述海报验证通过；
若所述匹配度未达到预设阈值，则将所述海报放入待验证集合中。

4.如权利要求1所述的方法，其中，所述从所述图像集合中的各图像中分别提取出文本区域包括：
从各图像中分别提取出候选文本区域；
将所述候选文本区域输入到预设模型中进行验证，根据验证结果确定文本区域。

5.一种从图像中识别出文字的装置，包括：
图像集合获取单元，适于获取待识别的图像集合；
文本区域提取单元，适于从所述图像集合中的各图像中分别提取出文本区域；
文字抽取单元，...

【专利技术属性】
技术研发人员：矫健，
申请(专利权)人：北京奇虎科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人