【技术实现步骤摘要】
文本图像识别方法、装置、设备及存储介质
本公开涉及图像识别
,尤其涉及一种文本图像识别方法、装置、设备及存储介质。
技术介绍
对于在自然场景下人为拍摄的文本图像照片,会出现一定程度的文字印章压盖、模糊褶皱等情况,这些情况对文本图像的OCR(OpticalCharacterRecognition,光学字符识别)造成了困难。相关技术中的文本图像识别方法,对于模糊或者具有文字印章压盖的文本图像,由于文字边缘与文字主体颜色略有差异,往往不能保证文本的完整性,识别效果较差。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种文本图像识别方法、装置、设备及存储介质,能够将图像中的文本及其边缘清晰地分割出来,保持文本的完整性。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种文本图像识别方法,包括:获取待识别文本图 ...
【技术保护点】
1.一种文本图像识别方法,其特征在于,包括:/n获取待识别文本图像,所述待识别图像中包含文本;/n基于所述待识别文本图像包含的各像素点的预设特征值,分别对各像素点进行聚类,并确定各类别的类中心;/n分别计算各像素点到各类中心的距离;/n基于各像素点到各类中心的距离,分别将各像素点归属到至少一个所述类别中;以及/n基于与所述文本的预设特征值对应的类别中的所有像素点,识别出所述文本。/n
【技术特征摘要】
1.一种文本图像识别方法,其特征在于,包括:
获取待识别文本图像,所述待识别图像中包含文本;
基于所述待识别文本图像包含的各像素点的预设特征值,分别对各像素点进行聚类,并确定各类别的类中心;
分别计算各像素点到各类中心的距离;
基于各像素点到各类中心的距离,分别将各像素点归属到至少一个所述类别中;以及
基于与所述文本的预设特征值对应的类别中的所有像素点,识别出所述文本。
2.根据权利要求1所述的方法,其特征在于,基于各像素点到各类中心的距离,分别将各像素点归属到至少一个所述类别中包括:分别对各像素点执行如下操作:
确定出所述像素点到各类中心的距离中的最小值;
将所述像素点归属到所述最小值对应的类别中;
分别计算所述最小值与所述像素点到其他类中心的各距离的比值;
分别将各比值与预设系数进行比较;以及
当所述比值大于或等于所述系数时,将所述像素点归属到与所述比值对应的类别中。
3.根据权利要求1或2所述的方法,其特征在于,所述预设特征值为颜色特征值。
4.根据权利要求3所述的方法,其特征在于,基于与所述文本颜色对应的类别中的所有像素点,识别出所述文本包括:
将所述待识别图像中,不属于与所述文本颜色对应的类别中的所有像素点替换为预定颜色的像素点,以识别出所述文本。
5.根据权利要求3所述的方法,其特征在于,对所述待识别文本图像包含的像素点进行聚类,并确定各类别的类中心包括:基于kmeans方法,对所述待识别文本...
【专利技术属性】
技术研发人员:王亚领,刘设伟,闫永泽,马文伟,
申请(专利权)人:泰康保险集团股份有限公司,泰康在线财产保险股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。