【技术实现步骤摘要】
文字提取方法、装置和电子设备
本公开涉及图像生成领域,尤其涉及一种文字提取方法、装置、电子设备及计算机可读存储介质。
技术介绍
文字作为人类专利技术的抽象的交流符号,具有丰富的表达性,并在自然场景中作为信息表达大量出现。由于文字含有丰富的语义信息,识别自然场景中的文字成为大量视觉方面应用的基础,如目标定位、人机交互、图像搜索、机器导航和工业自动化等等。因此,自然场景下对文字的识别和理解是近年的研究与应用的热点之一。现有技术中的文字检测技术一般如传统的OCR以及目标检测算法,其提取文字时,均只能圈出文字的一定范围,如以圆形框或者矩形框圈出文字,但是这样很不准确,如在需要提取出图像中的文字时,提取出的区域中可能存在图像中非文字部分的像素,给后续的应用带来不便。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。为了 ...
【技术保护点】
1.一种文字提取方法,其特征在于,包括:/n获取待提取图像;/n获取所述待提取图像的第一特征图像;/n根据所述第一特征图像得到所述待提取图像中的文字图像。/n
【技术特征摘要】
1.一种文字提取方法,其特征在于,包括:
获取待提取图像;
获取所述待提取图像的第一特征图像;
根据所述第一特征图像得到所述待提取图像中的文字图像。
2.如权利要求1所述的文字提取方法,其中,所述获取所述待提取图像的第一特征图像,包括:
将所述待提取图像输入文字提取模型的多个卷积层得到所述第一特征图像。
3.如权利要求2所述的文字提取方法,其中,所述根据所述第一特征图像得到所述待提取图像中的文字图像,包括:
将所述第一特征图像输入所述文字提取模型的多个反卷积层得到所述文字图像。
4.如权利要求2或3所述的文字提取方法,其中,所述文字提取模型通过以下训练步骤得到:
获取训练集合,其中所述训练集合中包括多个图像对,其中所述图像对包括第一图像以及与之对应的文字图像;
获取第一边缘信息,所述第一边缘信息是所述文字图像中文字的边缘信息;
初始化文字提取模型的参数;
将所述训练集合中的第一图像输入文字提取模型中得到一张二维图像以及第二边缘信息,所述第二边缘信息是所述二维图像中的文字的边缘信息;
根据所述二维图像、所述文字图像、所述第一边缘信息和所述第二边缘信息计算误差;
基于所述误差更新所述文字提取模型的参数;
基于更新后的参数和所述训练集合迭代上述参数更新的过程直至达到收敛条件;
将达到收敛条件时得到的参数作为训练好的文字提取模型的参数。
5.如权利要求4所述的文字提取方法,其中所述文字图像的像素点与所述第一图像的像素点对应,且所述文字图像中只包含所述第一图像中所包含的文字。
6.如权利要求4所述的文字提取方法,其中所述第一图像为通过不包含文字的图像和所述文字图像合成的图像。
7.如权利要求4所述的文字提取方法,其中所述文字图像为背景为黑色、文字为白色的二值化图像。
8.如权利要求4所述的文字提取方法,其中所述获取第一边缘信息,包括:
获取所述文字图像中的文字的边缘的像素点的位置。
9.如权利要求4所述的...
【专利技术属性】
技术研发人员:周恺卉,王长虎,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。