【技术实现步骤摘要】
一种文本定位方法、装置、电子设备及存储介质
本申请涉及人工智能、图像处理和文本识别的
,具体而言,涉及一种文本定位方法、装置、电子设备及存储介质。
技术介绍
文本识别,是指对包括字符的图像进行分析处理,获取版面信息并识别其中的字符,从而将文本图像转换为电子文本的过程。从图像中识别字符的过程包括:图像采集、图像预处理、行分割、字符分割和字符识别;图像采集是指使用摄像头将手写体的文字图片拍照采集录入;图像预处理是指对字符图像进行去噪和旋转矫正等处理。行分割是指在预处理完成以后,采用投影法将文字行分割出来,分割出来的结果例如:一行文字图像;字符分割是指在文字分割完成以后,将一行文字图分割为字符图像;字符识别是指从字符图像中识别出该字符图像对应的字符或者字符编码。文本定位,是指从图像中检测出文本的位置范围,例如:广告牌上的广告文字等,可以简单地理解为上述的行分割,也可以理解为确定多个字符组成的文本位置范围的过程。在具体的实践过程中,图像中的字符背景复杂多样,例如:广告牌上文字形变严重,以及产品包装上褶皱弯曲等等 ...
【技术保护点】
1.一种文本定位方法,其特征在于,包括:/n获得待测图像;/n使用预先训练的神经网络模型预测所述待测图像的字符区域概率图和字符连接概率图,所述字符区域概率图表征图像区域中存在字符的概率大小,所述字符连接概率图表征图像区域中的字符之间存在连接的概率大小;/n根据所述字符区域概率图确定所述待测图像中的多个字符边框,所述字符边框表征图像中存在字符的位置范围;/n根据所述多个字符边框和所述字符连接概率图确定所述待测图像中的至少一个文本边框,所述文本边框表征图像中的多个字符边框对应字符组成文本的位置范围。/n
【技术特征摘要】
1.一种文本定位方法,其特征在于,包括:
获得待测图像;
使用预先训练的神经网络模型预测所述待测图像的字符区域概率图和字符连接概率图,所述字符区域概率图表征图像区域中存在字符的概率大小,所述字符连接概率图表征图像区域中的字符之间存在连接的概率大小;
根据所述字符区域概率图确定所述待测图像中的多个字符边框,所述字符边框表征图像中存在字符的位置范围;
根据所述多个字符边框和所述字符连接概率图确定所述待测图像中的至少一个文本边框,所述文本边框表征图像中的多个字符边框对应字符组成文本的位置范围。
2.根据权利要求1所述的方法,其特征在于,在所述使用预先训练的神经网络模型预测所述待测图像的字符区域概率图和字符连接概率图之后,在所述根据所述字符区域概率图确定所述待测图像中的多个字符边框之前,还包括:
对所述待测图像的字符区域概率图和字符连接概率图进行高斯滤波,获得滤波后的所述字符区域概率图和所述字符连接概率图。
3.根据权利要求1所述的方法,其特征在于,所述根据所述字符区域概率图确定所述待测图像中的多个字符边框,包括:
根据所述字符区域概率图生成至少一个连通区域,所述连通区域表征图像中的像素值相同且位置相邻的像素点组成的区域;
根据所述至少一个连通区域计算所述待测图像中的多个字符边框。
4.根据权利要求1所述的方法,其特征在于,所述根据所述多个字符边框和所述字符连接概率图确定所述待测图像中的至少一个文本边框,包括:
根据所述字符连接概率图确定所述文本边框包括的字符数量;
将所述字符数量乘以所述多个字符边框的平均宽度,获得文本宽度;
计算所述多个字符边框的平均高度,获得文本高度;
根据所述文本宽度和所述文本高度确定所述文本边框。
5.根据权利要求4所述的方法,其特征在于,所述根据所述字符连接概率图确定所述文本边框包括的字符数量,包括:
根据所述字符连接概率图从所述多个字符边框中筛选出至少一...
【专利技术属性】
技术研发人员:张发恩,孙天齐,袁智超,陆强,
申请(专利权)人:创新奇智北京科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。