The extraction method of the invention is an adaptive image text information relates to text information extraction technology in the image, which comprises the following steps: 1) image preprocessing; 2) background complexity analysis; text detection; 3) 4) 5) text authentication; text extraction; 6) text information output or display. The method of the invention, by calculating the background complexity, text detection methods of the complex image background by different degree, reduce the use of single text detection method in the detection, error detection, improve the performance of the whole text extraction system. The background image in the method of the invention of the complex calculation method is simple, effective, not only can detect the different background of complexity in the image and text information, the detected text information is not affected by the influence of font, size and language, has very strong versatility.
【技术实现步骤摘要】
本专利技术涉及模式识别与机器视觉领域中的文本信息提取
,具 体地是。
技术介绍
随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用, 图像中信息越来越引起人们的关注,然而计算机理解图像的内容,目前还 很困难。图像中嵌入的文字能够提供一些人们所要的重要信息,如书的封 面、视频、自然风景图片WWW网页的彩图等等,它对理解图像中的内容有 着重要的帮助。让计算机像人类一样识别图像中的文字,即文字的自动检 测系统,近年来越来越引起了人们的关注,它对于图像的存储、分类和检 索等来说具有极其重要的意义,有着广泛的应用前景和商业价值。在许多 情况下,图像中的场景文字甚至成为图像最主要、最关键的信息,例如对 于车牌的识别,对于路牌的识别和翻译等。这些场景文字被抽取后,送入0CR模块,转换成计算机可理解的内码,可以方便的进行后续的各种处理。国内外的研究人员是在近几年内才开始对图像中的文本信息提取技 术进行研究的,由于文本信息提取受到语种、文字分辨率、文字间距、分 布情况、文字的背景、光照、颜色之类因素的影响,并且某些图案、纹理的背景很难与文字区分开来,因此图像中的文本 ...
【技术保护点】
一种自适应图像文本信息提取方法,其特征在于,包括步骤:1)图像预处理;2)图像背景复杂度分析;3)文本初检测;4)文本验证;5)文本抽取;6)文本信息输出或显示; 其具体步骤为: A)首先,从选定的路径中读取图像,并将彩色图像转 换为灰色图像; B)根据灰色图像所有像素点的灰度变化密度,计算出整幅图像的背景复杂度,计算方法为:某一像素点P↓[0]的灰度强度S′按照下式计算: S′=MAX{|P↓[1]-P↓[8]|,|P↓[2]-P↓[7]|,|P↓[3 ]-P↓[6]|,|P↓[4]-P↓[5]|} (1) *** (2) 则图 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:李敏花,肖柏华,王春恒,戴汝为,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。