【技术实现步骤摘要】
【专利摘要】本专利技术提供。本专利技术不仅利用了文字的纹理特征,而且利用了文字区域与周围区域色调不同的特点,有效地对场景中的文字进行定位。通过取边缘像素点附近的平均色调差,利用该平均色调差与阈值相比较来判断该区域是否含有文字,这样做可以加入区域文字的局部颜色信息,利用文字的颜色一致性与背景的不同来定位文字。且本专利技术利用自适应的阈值处理方法来得到阈值,该阈值是由所有候选框的上下左右区域的主色调差的平均值得到的,这样做的目的是利用整幅图的颜色信息来为局部颜色信息做贡献,得到的阈值可以表征场景图的文字区域与背景的色调差。本专利技术能较快地对自然场景中文字进行准确定位。【专利说明】
本专利技术属于图像处理和计算机视觉
,特别涉及一种自然场景文字定位方法。
技术介绍
将场景图片中文字进行自动的检测,分割,识别出来,将对人们的信息获取提供非常大的帮助,也对图像的语义信息的自动理解以及检索有着非常重要的意义。在车载导航系统中,如果能自动的对前方的路标、商铺名称、交通标志等进行定位,识别,那么将为人们的出行提供安全保障,可以提醒驾驶员减速,以及正确的行车路线。多媒体以及计算机的高速发展中,图片以其形象深刻的特殊形式成为传输的重要介质,基于关键词的检索已经不能满足人们的需求,而基于图片内容的检索,已经成为发展的趋势,检索中,文字的定位,识别成为关键的技术,引来越来越多学者的关注,同时文字定位可以为盲人的阅读提供辅助帮助。在对场景中文字定位的现有方法的综合学习中,文字定位的方法大致可以分为两种方法:1、基于纹理的文字定位方法;2、基于区域的文字定位方法。 ...
【技术保护点】
一种局部色调差异的自然场景文字定位方法,其特征在于,包括以下步骤:1)通过分类器对场景图片进行扫描,以得到候选文字区域对应的候选框;2)将场景图片转化为HSI颜色模型,提取色调H分量,计算所有候选框box(i)与相邻区域的主色调差异hue_aver:hue_aver=1NΣi=1N|box_domihue(i)-box_neighbour_domihue(i)|;其中,box_domihue(i)为第i个候选框box(i)的主色调,box_neighbour_domihue(i)为与候选框box(i)相邻区域的主色调;N为当前场景图片中候选框总数;3)取场景图片中边缘像素点,求各候选框中所有边缘像素点与邻居像素点间的平均色调差local_hue(i);4)比较各候选框对应的平均色调差local_hue(i)与主色调差异hue_aver的大小,当候选框对应的平均色调差local_hue(i)大于主色调差异hue_aver,则将视当前候选框为包含文字的区域,否则舍弃当前候选框;所有候选框判断完毕后,最终的场景文字定位完成。
【技术特征摘要】
【专利技术属性】
技术研发人员:李宏亮,黄自力,姚源,许静,孟凡满,吴庆波,黄超,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。