一种图片内文字显示方法技术

技术编号:21273912 阅读:39 留言:0更新日期:2019-06-06 08:11
本发明专利技术公开了一种图片内文字显示方法,与现有技术相比,当遇到图片内包含有成行的文字时,例如:以图片形式展示的文章等,本申请实施例提供的该图片内文字显示方法及装置,可以对准确识别图片内文字以及将识别的内容显示,方便用户对图片内的文字进行阅读。

【技术实现步骤摘要】
一种图片内文字显示方法
本专利技术涉及文字显示领域,尤其涉及一种图片内文字显示方法。
技术介绍
用户在浏览网络时,常常会遇到一些以图片形式展示的文字文章,文字文章包含有一行或多行汉字,例如:目前各类微博网站都对发表文章的字数进行了限制,当用户需要发表文字较多的长微博时,常常把文字转换成图片形式后才能发出,阅读长微博时,就只能浏览图片内文字。由于图片的尺寸大小不一致,当图片尺寸较小时,会出现无法清晰辨识图片内的文字的问题,影响用户阅读,虽然有些终端或网页上设置有图片放大选项,但对于显示界面较小的终端而言,在显示界面内只能显示图片的局部内容,需要用户多次点击、移动、重复等待加载等,操作不方便。当图片尺寸较大时,即使设置有放大显示选项,显示效果也往往不清晰,仍存在无法对图片内的文字进行清晰辨识的问题。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种图片内文字显示方法,所述方法包括:获取待识别图片,根据待识别图片上的连通体判断所述待识别图片内是否存在至少一行汉字;当所述待识别图片内存在至少一行汉字时,对待识别图片内一行汉字中的连通体依次进行横向区域分割,得到待识别汉字,所述待识别汉字内包含有一个或多个连通体,所述对待识别图片内一行汉字中的连通体依次进行横向区域分割,包括:在一行汉字中依次选取一个连通体加入到待识别连通体组内;计算所述待识别连通体组的外围矩形的宽高比例;判断所述连通体组的外围距离的宽高比例是否小于预先设置的比例阈值;当所述连通体组的外围距离的宽高比例小于比例阈值时,依次选取一个相邻连通体增加到所述待识别连通体组,计算并判断增加连通体后待识别连通体组的外围矩形的宽高比例是否小于预先设置的比例阈值;当增加连通体后待识别连通体组的外围矩形的宽高比例大于等于预先设置的比例阈值时,将增加连通体前的待识别连通体内所有连通体作为一个待识别汉字,根据所述待识别汉字内包含连通体的个数,在预先建立的样本字库内查找满足匹配度要求的汉字,将查找到汉字作为目标汉字;显示所有目标汉字;其中,所述在预先建立的样本字库内查找满足匹配度要求的汉字,包括:在预先建立的样本字库内查找连通体个数与所述待识别汉字内包含连通体的个数相同的汉字,作为待选汉字;计算所述待识别汉字与待选汉字的匹配度;判断所述待识别汉字与待选汉字的匹配度是否大于等于预先设置的匹配度阈值;当所述待识别汉字与待选汉字的匹配度大于等于匹配度阈值时,将匹配度最大的待选汉字确定为目标汉字。具体实施方式下面进一步详细描述本专利技术的技术方案,但本专利技术的保护范围不局限于以下所述。实施例:一种图片内文字显示方法,所述方法包括:获取待识别图片,根据待识别图片上的连通体判断所述待识别图片内是否存在至少一行汉字;当所述待识别图片内存在至少一行汉字时,对待识别图片内一行汉字中的连通体依次进行横向区域分割,得到待识别汉字,所述待识别汉字内包含有一个或多个连通体,所述对待识别图片内一行汉字中的连通体依次进行横向区域分割,包括:在一行汉字中依次选取一个连通体加入到待识别连通体组内;计算所述待识别连通体组的外围矩形的宽高比例;判断所述连通体组的外围距离的宽高比例是否小于预先设置的比例阈值;当所述连通体组的外围距离的宽高比例小于比例阈值时,依次选取一个相邻连通体增加到所述待识别连通体组,计算并判断增加连通体后待识别连通体组的外围矩形的宽高比例是否小于预先设置的比例阈值;当增加连通体后待识别连通体组的外围矩形的宽高比例大于等于预先设置的比例阈值时,将增加连通体前的待识别连通体内所有连通体作为一个待识别汉字,根据所述待识别汉字内包含连通体的个数,在预先建立的样本字库内查找满足匹配度要求的汉字,将查找到汉字作为目标汉字。显示所有目标汉字,其中,所述在预先建立的样本字库内查找满足匹配度要求的汉字,包括:在预先建立的样本字库内查找连通体个数与所述待识别汉字内包含连通体的个数相同的汉字,作为待选汉字;计算所述待识别汉字与待选汉字的匹配度;判断所述待识别汉字与待选汉字的匹配度是否大于等于预先设置的匹配度阈值;当所述待识别汉字与待选汉字的匹配度大于等于匹配度阈值时,将匹配度最大的待选汉字确定为目标汉字。优选地,判断所述待识别图片内是否存在至少一行汉字,包括:对待识别图片进行图像处理;对图像处理后的待识别图片进行连通性分析,得到多个组成汉字的连通体;判断在待识别图片内连通体所在位置是否存在至少一组字符基线;当存在至少一组字符基线时,确定所述待识别图片内存在至少一行汉字;当不存在字符基线时,确定所述待识别图片内不存在至少一行汉字。优选地,所述对待识别图片内一行汉字中的连通体依次进行横向区域分割,还包括:计算待识别汉字的宽高比例与预先设置的比例阈值的均值;判断所述均值是否在预先设置的数值区间内;当所述均值位于预先设置的数值区间内,将所述均值替换预先设置的比例阈值;当所述均值位于预先设置的数值区间外,继续使用预先设置的比例阈值。优选地,所述方法还包括:判断所选取一行汉字中是否存在新的连通体,当不存在新的连通体时,结束。优选地,当查找到的所有待选汉字的匹配度都小于匹配度阈值时,所述在预先建立的样本字库内查找满足匹配度要求的汉字,还包括:在预先建立的样本字库内查找连通体个数与所述待识别汉字内包含连通体的个数相差n的汉字,作为备选汉字,n的初始值为0;计算所述待识别汉字与备选汉字的匹配度;判断所述待识别汉字与备选汉字的匹配度是否大于等于预先设置的匹配度阈值;当所述待识别汉字与备选汉字的匹配度大于等于匹配度阈值时,将匹配度最大的备选汉字确定为目标汉字;当所述待识别汉字与备选汉字的匹配度小于匹配度阈值时,将n的值增加1后,继续查找备选汉字,直至n等于预先设置的循环次数。优选地,每个待选汉字都按照预先设置的规则划分有多个特征边,并且每个特征边的特征信息已知,所述特征信息包括:特征边的坐标值以及角度值;所述计算所述待识别汉字与待选汉字的匹配度,包括:按照预先设置的规则获取待识别汉字中多个特征边的参数信息;计算所述待识别汉字中特征边参数信息与待选汉字中特征边的参数信息的相匹配的特征边个数;将相匹配的特征边的个数与待选汉字的总特征边个数的比值确定为匹配度。优选地,所述显示所有目标汉字,包括:按照对待识别图片进行横向区域分割时连通体所在位置将所有目标汉字进行排列;生成与排列后所有目标汉字相对应的标签;获取待识别图片的统一资源定位符;将所述统一资源定位符中的图片标签更换为所有目标汉字的标签;接收浏览器对所述待识别图片的统一资源定位符的解析指令,根据所述解析指令将所述排列后所有目标汉字进行显示。优选地,包括:图片获取单元,用于获取待识别图片;图片判断单元,用于根据所述待识别图片上的连通体判断所述待识别图片内是否存在至少一行汉字;横向区域分割单元,用于当所述待识别图片内存在至少一行汉字时,对待识别图片内一行汉字中的连通体依次进行横向区域分割,得到待识别汉字,所述待识别汉字内包含有一个或多个连通体;匹配单元,用于根据所述待识别汉字内包含连通体的个数,在预先建立的样本字库内查找满足匹配度要求的汉字,将查找到汉字作为目标汉字;显示单元,用于显示所有目标汉字;其中,所述匹配单元还包括:待选汉字查找单元,用于在预先建立的样本字库内查找连通体本文档来自技高网...

【技术保护点】
1.一种图片内文字显示方法,其特征在于,所述方法包括:获取待识别图片,根据待识别图片上的连通体判断所述待识别图片内是否存在至少一行汉字;当所述待识别图片内存在至少一行汉字时,对待识别图片内一行汉字中的连通体依次进行横向区域分割,得到待识别汉字,所述待识别汉字内包含有一个或多个连通体,所述对待识别图片内一行汉字中的连通体依次进行横向区域分割,包括:在一行汉字中依次选取一个连通体加入到待识别连通体组内;计算所述待识别连通体组的外围矩形的宽高比例;判断所述连通体组的外围距离的宽高比例是否小于预先设置的比例阈值;当所述连通体组的外围距离的宽高比例小于比例阈值时,依次选取一个相邻连通体增加到所述待识别连通体组,计算并判断增加连通体后待识别连通体组的外围矩形的宽高比例是否小于预先设置的比例阈值;当增加连通体后待识别连通体组的外围矩形的宽高比例大于等于预先设置的比例阈值时,将增加连通体前的待识别连通体内所有连通体作为一个待识别汉字,根据所述待识别汉字内包含连通体的个数,在预先建立的样本字库内查找满足匹配度要求的汉字,将查找到汉字作为目标汉字;显示所有目标汉字;其中,所述在预先建立的样本字库内查找满足匹配度要求的汉字,包括:在预先建立的样本字库内查找连通体个数与所述待识别汉字内包含连通体的个数相同的汉字,作为待选汉字;计算所述待识别汉字与待选汉字的匹配度;判断所述待识别汉字与待选汉字的匹配度是否大于等于预先设置的匹配度阈值;当所述待识别汉字与待选汉字的匹配度大于等于匹配度阈值时,将匹配度最大的待选汉字确定为目标汉字。...

【技术特征摘要】
1.一种图片内文字显示方法,其特征在于,所述方法包括:获取待识别图片,根据待识别图片上的连通体判断所述待识别图片内是否存在至少一行汉字;当所述待识别图片内存在至少一行汉字时,对待识别图片内一行汉字中的连通体依次进行横向区域分割,得到待识别汉字,所述待识别汉字内包含有一个或多个连通体,所述对待识别图片内一行汉字中的连通体依次进行横向区域分割,包括:在一行汉字中依次选取一个连通体加入到待识别连通体组内;计算所述待识别连通体组的外围矩形的宽高比例;判断所述连通体组的外围距离的宽高比例是否小于预先设置的比例阈值;当所述连通体组的外围距离的宽高比例小于比例阈值时,依次选取一个相邻连通体增加到所述待识别连通体组,计算并判断增加连通体后待识别连通体组的外围矩形的宽高...

【专利技术属性】
技术研发人员:孙科
申请(专利权)人:四川熹玥广告传媒有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1