【技术实现步骤摘要】
一种通用场景文字识别方法及装置
本专利技术涉及图像识别
,特别涉及一种通用场景文字识别方法及装置。
技术介绍
自然场景中包含着丰富的文字信息,如商店招牌、道路指示牌以及各种警告提示牌等,如果人们能够将这些文字提取出来,并做进一步处理后将会为图像语义的理解提供非常有利的依据和丰富的信息。文字提取处理的前提是自然场景图像的获取。目前,大多数自然场景图像都是由人手持手机、平板等电子设备拍摄得到的。人为拍摄容易在拍摄过程中发生抖动,导致拍摄的图像模糊;如果连续拍摄还会受到拍摄环境变化的影响,图像的成像质量参差不齐,进而导致自然场景图像的识别效果不佳。由此可见,如果不能在对自然场景图像进行文字提取处理之前对该图像进行质量的甄别和优化处理,自然场景图像的文字识别的准确率和可靠性将无法得到保证。
技术实现思路
为了解决相关技术中存在的无法对自然场景图像进行质量的甄别和优化处理、保证文字识别的准确性和可靠性的技术问题,本专利技术提供了一种通用场景文字识别方法及装置。本专利技术实施例第一方面公 ...
【技术保护点】
1.一种通用场景文字识别方法,其特征在于,所述方法包括:/n获取目标自然图像的图像质量信息;/n根据所述图像质量信息判断所述目标自然图像是否为可识别图像;/n如果是,获取所述目标自然图像的识别等级;/n依据所述目标自然图像的识别等级选择相匹配的文本检测策略,并利用所述文本检测策略对所述目标自然图像进行检测,得到所述目标自然图像包含的一块或多块候选文本区域;/n利用预先训练得到的文字识别模型对所述候选文本区域进行识别,识别出每个所述候选文本区域的文字内容。/n
【技术特征摘要】
1.一种通用场景文字识别方法,其特征在于,所述方法包括:
获取目标自然图像的图像质量信息;
根据所述图像质量信息判断所述目标自然图像是否为可识别图像;
如果是,获取所述目标自然图像的识别等级;
依据所述目标自然图像的识别等级选择相匹配的文本检测策略,并利用所述文本检测策略对所述目标自然图像进行检测,得到所述目标自然图像包含的一块或多块候选文本区域;
利用预先训练得到的文字识别模型对所述候选文本区域进行识别,识别出每个所述候选文本区域的文字内容。
2.根据权利要求1所述的方法,其特征在于,所述获取目标自然图像的图像质量信息之前,所述方法还包括:
采集同一场景下的若干张连续的自然图像;
对所述若干张自然图像进行多帧融合,得到目标自然图像。
3.根据权利要求1或2所述的方法,其特征在于,所述获取目标自然图像的图像质量信息,包括:
获取所述目标自然图像的图像质量评价指标;
基于所述图像质量评价指标确定所述目标自然图像的图像质量信息;其中,所述图像质量评价指标至少包括对比度、饱和度和阴影面积。
4.根据权利要求3所述的方法,其特征在于,根据所述图像质量信息判断所述目标自然图像是否为可识别图像,包括:
当所述对比度位于预设的第一区间、所述饱和度位于预设的第二区间和所述阴影面积小于预设的第三阈值中的至少一项满足时,确定所述目标自然图像为可识别图像。
5.一种通用场景文字识别装置,其特征在于,包括...
【专利技术属性】
技术研发人员:罗健锋,李仕军,郑伟雄,
申请(专利权)人:广州润普网络科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。