【技术实现步骤摘要】
文本识别方法、装置、电子设备及可读存储介质
[0001]本申请涉及图像处理、人工智能以及大数据
,具体而言,本申请涉及一种文本识别方法、装置、电子设备及可读存储介质。
技术介绍
[0002]OCR(Optical Character Recognition,光学字符识别)是计算机视觉领域一个重要的研究热点问题,其中曲形文本识别是OCR中的重要应用。近年来,随着深度学习技术的发展,基于深度学习的OCR检测识别成为了主流趋势。
[0003]其中,OCR技术包括检测网络和识别网络两个网络,检测网络用于定位文本的位置,识别网络用于识别文本的具体内容。现有的识别算法在对曲形文本检测识别时,检测网络大都聚焦检测单个任务,仅仅定位到曲形文本的位置,但是由于曲形文本包含的背景噪声点过多,后续识别网络无法提取文本,最终造成识别效果较差。
技术实现思路
[0004]本申请实施例提供一种文本识别方法、装置、电子设备及可读存储介质,能够提升对于图像中曲形文本的文本识别效果。
[0005]一方面,本申请实施例提供 ...
【技术保护点】
【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:获取待识别文本图像,其中,所述待识别文本图像中包括曲形文本区域;提取所述待识别文本图像的文本特征图;基于所述文本特征图确定所述待识别文本图像中的待识别文本区域以及所述待识别文本区域的区域边界信息,所述待识别文本区域包括所述曲形文本区域;根据所述区域边界信息对所述待识别文本区域进行校正,得到矫正后的矩形文本区域;对所述矩形文本区域进行文字识别,得到所述待识别文本图像的文本识别结果。2.根据权利要求1所述的方法,其特征在于,所述区域边界信息包括所述待识别文本区域的第一侧的边界信息,其中,所述第一侧是与所述待识别文本图像中文本的书写方向一致的两侧;所述根据所述区域边界信息对所述待识别文本区域进行校正,包括:根据所述第一侧的边界信息和所述待识别文本区域,确定所述待识别文本区域的第二侧的边界信息,其中,所述第二侧是与所述书写方向垂直的方向上的两侧;根据所述第一侧的边界信息和所述第二侧的边界信息,对所述待识别文本区域进行校正。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述文本特征图确定所述待识别文本图像中的待识别文本区域以及所述待识别文本区域的区域边界信息,包括:基于所述文本特征图,确定所述待识别文本图像中的文本像素点以及所述文本像素点中属于所述待识别文本区域的边界像素点;基于所述文本像素点,确定所述待识别文本图像中的待识别文本区域;基于所述边界像素点,确定所述待识别文本图像的区域边界信息。4.根据权利要求3所述的方法,其特征在于,所述区域边界信息包括所述待识别文本区域的第一侧的边界信息,所述第一侧是与所述待识别文本图像中文本的书写方向一致的两侧,所述边界像素点包括所述第一侧中一侧的边界像素点和所述第一侧中另一侧的边界像素点;所述基于所述边界像素点,确定所述待识别文本图像的区域边界信息,包括:根据所述第一侧中一侧的边界像素点,确定所述一侧的第一边界连通域,基于所述第一边界连通域确定所述第一侧中一侧的边界信息;根据所述第一侧中另一侧的边界像素点,确定所述另一侧的第二边界连通域,基于所述第二边界连通域确定所述第一侧中另一侧的边界信息。5.根据权利要求2所述的方法,其特征在于,所述根据所述待识别文本区域的第一侧的边界信息和所述待识别文本区域,确定所述待识别文本区域的第二侧的边界信息,包括:根据所述第一侧的边界信息和所述待识别文本区域,确定所述待识别文本区域的第二侧的边界关键点;根据所述边界关键点和所述第一侧的边界信息,确定所述待识别文本区域的第二侧的边界信息。6.根据权利要求5所述的方法,其特征在于,所述根据所述边界关键点和所述第一侧的边界信息,确定所述待识别文本区域的第二侧的边界信息,包括:
根据所述边界关键点和所述第一侧的边界信息,确定所述待识别文本区域的第二侧的初始边界信息;对所述初始边界信息进行曲线平滑处理,得到所述待识别文本区域的第二侧的边界信息。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述基于所述文本特征图确定所述待...
【专利技术属性】
技术研发人员:王洪振,黄珊,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。