文字识别方法、装置及存储介质、服务器制造方法及图纸

技术编号：21060942 阅读：24 留言：0更新日期：2019-05-08 07:23

本发明专利技术涉及图像检测、图像处理技术领域，本申请实施例提供的一种文字识别方法，包括：响应于截图请求，获取所述截图请求对应的截图区域，根据所述截图区域生成截图图像；对所述截图图像进行过滤，得到待识别图像，将所述待识别图像划分为若干个区域，获得第一子图像；基于注意力模型的深度卷积神经网络算法提取各所述第一子图像中的文字，将所述文字以可编辑的形式发送给用户。在本申请中通过基于用户的截图区域生成截图图像，对用户截图图像中的文字进行识别，方便用户对该文字进行其他操作，如粘贴、复制，提高了文字识别的应用场景，特别是职场办公中，减少手动记录频率，提高文字转换速率以及正确性，进一步提高用户的工作效率。

Character Recognition Method, Device, Storage Media and Server

全部详细技术资料下载

【技术实现步骤摘要】
文字识别方法、装置及存储介质、服务器
本专利技术涉及图像检测、图像处理
，具体涉及一种文字识别方法、装置及存储介质、服务器。
技术介绍
用户在使用电子产品浏览网络页面、文档页面、产品界面、视频过程中，经常会遇到有些在其中的文字无法复制，或者文字处于图像或视频中而无法将文字提取出来。例如，在查看网络中的公开课视频的情景下，对公开课视频中的文字内容进行记录或做笔记，需要手动录视频页面显示的文字数据内容，数据获取的效率非常低，导致文字识别效率低且识别不准确的问题。然而，如果能够将网络页面、文档页面、产品界面、视频识别出视频中出现的文字后，有助于用户进行快速的检索或者对文字进行编辑等。因此，如何识别图像中的文字受到社会各界的广泛关注。
技术实现思路
为克服以上技术问题，特别是文字识别效率低且识别不准确的问题，特提出以下技术方案：本专利技术实施例提供的一种文字识别方法，包括：响应于截图请求，获取所述截图请求对应的截图区域，根据所述截图区域生成截图图像；对所述截图图像进行过滤，得到待识别图像，将所述待识别图像划分为若干个区域，获得第一子图像；基于注意力模型的深度卷积神经网络...

【技术保护点】
1.一种文字识别方法，其特征在于，包括：响应于截图请求，获取所述截图请求对应的截图区域，根据所述截图区域生成截图图像；对所述截图图像进行过滤，得到待识别图像，将所述待识别图像划分为若干个区域，获得第一子图像；基于注意力模型的深度卷积神经网络算法提取各所述第一子图像中的文字，将所述文字以可编辑的形式发送给用户。

【技术特征摘要】
1.一种文字识别方法，其特征在于，包括：响应于截图请求，获取所述截图请求对应的截图区域，根据所述截图区域生成截图图像；对所述截图图像进行过滤，得到待识别图像，将所述待识别图像划分为若干个区域，获得第一子图像；基于注意力模型的深度卷积神经网络算法提取各所述第一子图像中的文字，将所述文字以可编辑的形式发送给用户。2.根据权利要求1所述的文字识别方法，其特征在于，所述对所述截图图像进行过滤，得到待识别图像，包括：对所述截图图像进行灰度处理，获得灰度图，所述灰度图为所述待识别图像。3.根据权利要求1所述的文字识别方法，其特征在于，所述基于注意力模型的深度卷积神经网络算法提取各所述第一子图像中的文字，包括：依据所述深度卷积神经网络算法分别提取所述待识别图像和所述第一子图像中的文字；将从所述待识别图像和所述第一子图像中提取出的文字通过注意力机制获得所述文字。4.根据权利要求3所述的文字识别方法，其特征在于，所述将所述待识别图像划分为若干个区域，获得第一子图像之后，包括：判断所述第一子图像中是否存在位于预设灰度值阈值内的灰度值；当所述第一子图像中不存在位于所述预设灰度值阈值内的所述灰度值时，将所述第一子图像删除。5.根据权利要求4所述的文字识别方法，其特征在于，所述基于注意力模型的深度卷积神经网络算法提取各所述第一子图像中的文字，包括：将相邻区域的两所述第一子图像拼凑为一张图像，获得第二子图像；依据所述深度卷积神经网络算法分别提取所述待识别图像、所述第一子图像、所述第二子图像中的文字；将从所述待识别...

【专利技术属性】
技术研发人员：黄锦伦，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人