【技术实现步骤摘要】
文字识别方法、装置及存储介质、服务器
本专利技术涉及图像检测、图像处理
,具体涉及一种文字识别方法、装置及存储介质、服务器。
技术介绍
用户在使用电子产品浏览网络页面、文档页面、产品界面、视频过程中,经常会遇到有些在其中的文字无法复制,或者文字处于图像或视频中而无法将文字提取出来。例如,在查看网络中的公开课视频的情景下,对公开课视频中的文字内容进行记录或做笔记,需要手动录视频页面显示的文字数据内容,数据获取的效率非常低,导致文字识别效率低且识别不准确的问题。然而,如果能够将网络页面、文档页面、产品界面、视频识别出视频中出现的文字后,有助于用户进行快速的检索或者对文字进行编辑等。因此,如何识别图像中的文字受到社会各界的广泛关注。
技术实现思路
为克服以上技术问题,特别是文字识别效率低且识别不准确的问题,特提出以下技术方案:本专利技术实施例提供的一种文字识别方法,包括:响应于截图请求,获取所述截图请求对应的截图区域,根据所述截图区域生成截图图像;对所述截图图像进行过滤,得到待识别图像,将所述待识别图像划分为若干个区域,获得第一子图像;基于注意力模型的深度卷积神经网络 ...
【技术保护点】
1.一种文字识别方法,其特征在于,包括:响应于截图请求,获取所述截图请求对应的截图区域,根据所述截图区域生成截图图像;对所述截图图像进行过滤,得到待识别图像,将所述待识别图像划分为若干个区域,获得第一子图像;基于注意力模型的深度卷积神经网络算法提取各所述第一子图像中的文字,将所述文字以可编辑的形式发送给用户。
【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:响应于截图请求,获取所述截图请求对应的截图区域,根据所述截图区域生成截图图像;对所述截图图像进行过滤,得到待识别图像,将所述待识别图像划分为若干个区域,获得第一子图像;基于注意力模型的深度卷积神经网络算法提取各所述第一子图像中的文字,将所述文字以可编辑的形式发送给用户。2.根据权利要求1所述的文字识别方法,其特征在于,所述对所述截图图像进行过滤,得到待识别图像,包括:对所述截图图像进行灰度处理,获得灰度图,所述灰度图为所述待识别图像。3.根据权利要求1所述的文字识别方法,其特征在于,所述基于注意力模型的深度卷积神经网络算法提取各所述第一子图像中的文字,包括:依据所述深度卷积神经网络算法分别提取所述待识别图像和所述第一子图像中的文字;将从所述待识别图像和所述第一子图像中提取出的文字通过注意力机制获得所述文字。4.根据权利要求3所述的文字识别方法,其特征在于,所述将所述待识别图像划分为若干个区域,获得第一子图像之后,包括:判断所述第一子图像中是否存在位于预设灰度值阈值内的灰度值;当所述第一子图像中不存在位于所述预设灰度值阈值内的所述灰度值时,将所述第一子图像删除。5.根据权利要求4所述的文字识别方法,其特征在于,所述基于注意力模型的深度卷积神经网络算法提取各所述第一子图像中的文字,包括:将相邻区域的两所述第一子图像拼凑为一张图像,获得第二子图像;依据所述深度卷积神经网络算法分别提取所述待识别图像、所述第一子图像、所述第二子图像中的文字;将从所述待识别...
【专利技术属性】
技术研发人员:黄锦伦,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。