汉字定位方法及装置、存储介质和电子设备制造方法及图纸

技术编号：21004485 阅读：25 留言：0更新日期：2019-04-30 21:37

本发明专利技术公开了一种汉字定位方法及装置、存储介质和电子设备，涉及计算机技术领域。该汉字定位方法包括：基于预设背景图片数据集和预设汉字表构建目标数量个训练样本；其中，各所述训练样本中标注有汉字位于背景图片的区域；获取深度学习模型的模型配置参数文件和均值文件；对所述训练样本进行迁移学习迭代并基于所述模型配置参数文件和均值文件得到网络权值；获取目标图片，并基于所述网络权值将所述目标图片在网络中进行前向传播，以获得目标预测值作为所述目标图片的汉字在所述目标图片中的预测区域。本公开可以通过深度学习的方式确定图片上汉字的位置，并且处理过程耗时较少。

Chinese Character Location Method and Device, Storage Media and Electronic Equipment

全部详细技术资料下载

【技术实现步骤摘要】
汉字定位方法及装置、存储介质和电子设备
本公开涉及计算机
，具体而言，涉及一种汉字定位方法、汉字定位装置、存储介质和电子设备。
技术介绍
在工作和生活中，汉字是人们获知信息的主要途径，而在很多情况下，汉字往往出现在图片上，用于对图片进行注释或标识其他内容。如何快速地从图片中提取汉字已成为人们获知信息的关键，在此过程中需要确定汉字在图片中的位置。目前，一方面，图片上可能存在对汉字造成混淆的其他内容，如一些绘画线条、污点等；另一方面，汉字的颜色可能与图片背景的颜色相似；再一方面，汉字的字体和尺寸可能不相同，光照条件(汉字的明暗程度)也可能不同。因此，在图片上对汉字进行定位较为困难。随着计算机技术的发展，出现了一些可以对汉字进行定位的方案，例如，基于连通分量对字符进行识别的算法、采用多次投影(例如，水平投影和垂直投影)的方法对字符进行定位，等等。然而，这些方案的处理速度较慢，针对一张图片，处理时间可能在3秒，无法满足实时处理的需求。另外，针对采用连通域进行汉字定位的方法，当汉字笔画有重合时，会出现定位结果不准确的情况。鉴于此，需要一种汉字定位方法、汉字定位装置、存储介质和电子设备。需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种汉字定位方法、汉字定位装置、存储介质和电子设备，进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。根据本公开的一个方面，提供一种汉字定位方法，包括：基于预设背景图片数据集和预设汉字表构建目...

【技术保护点】
1.一种汉字定位方法，其特征在于，包括：基于预设背景图片数据集和预设汉字表构建目标数量个训练样本；其中，各所述训练样本中标注有汉字位于背景图片的区域；获取深度学习模型的模型配置参数文件和均值文件；对所述训练样本进行迁移学习迭代并基于所述模型配置参数文件和均值文件得到网络权值；获取目标图片，并基于所述网络权值将所述目标图片在网络中进行前向传播，以获得目标预测值作为所述目标图片的汉字在所述目标图片中的预测区域。

【技术特征摘要】
1.一种汉字定位方法，其特征在于，包括：基于预设背景图片数据集和预设汉字表构建目标数量个训练样本；其中，各所述训练样本中标注有汉字位于背景图片的区域；获取深度学习模型的模型配置参数文件和均值文件；对所述训练样本进行迁移学习迭代并基于所述模型配置参数文件和均值文件得到网络权值；获取目标图片，并基于所述网络权值将所述目标图片在网络中进行前向传播，以获得目标预测值作为所述目标图片的汉字在所述目标图片中的预测区域。2.根据权利要求1所述的汉字定位方法，其特征在于，所述汉字定位方法还包括：对所述预测区域进行非极大值抑制，以确定所述目标图片中汉字对应的区域。3.根据权利要求2所述的汉字定位方法，其特征在于，所述汉字定位方法还包括：在所述目标图片中标识汉字对应的区域。4.根据权利要求1所述的汉字定位方法，其特征在于，基于预设背景图片数据集和预设汉字表构建目标数量个训练样本：从预设背景图片数据集中获取目标数量个背景图片样本；从预设汉字表中获取目标数量个汉字样本组；分别将所述背景图片样本与所述汉字样本组进行叠加以构建目标数量个训练样本。5.根据权利要求4所述的汉字定位方法，其特征在于，从预设背景图片数据集中获取目标数量个背景图片样本包括：获取所述预设背景图片数据集中各背景图片的路径；基于所述路径生成目标数量个随机数；根据所述随机数确定对应的背景图片作为背景图片样本；获取所述背景图片样本。6.根据权利要求4或5所述的汉字定位方法，其特征在于，所述汉字样本组中包含字体随机并且/或者颜色随机的多个汉字。7.一种汉字定位装置，其特征在于，包括：训练样本构建模块，用于基于预设背景图片数据集和预设汉字表构建目标数量个训练样本；其中，各所述训练样本中标注有汉字位于背景图片的区域；文件获取模块，用于获取深度学习模型的模型配置参数文件和均值文件；网络权值得到模块，用于对所述训练样本进行迁移学...

【专利技术属性】
技术研发人员：安山，陈宇，车广富，麻晓珍，翁志，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人