文字识别方法、电子设备、存储介质技术

技术编号:19935055 阅读:38 留言:0更新日期:2018-12-29 04:51
本发明专利技术公开了一种文字识别方法、电子设备、存储介质,其方法包括:获取包含第一文字的图片;提取图片中第一文字的笔画信息;根据笔画信息,获取第一文字的线段数据集;将第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为第一文字的识别结果。提取第一文字的笔画信息,将图片文字拆分为具体的直线信息或曲线信息,得到第一文字具体的线段数据集,实现将文字转化为数据集。通过将第一文字的线段数据集与预设数据库中的线段数据集比对,计算数据集间的重合度,直观的根据数据信息,得到的第一文字的识别结果更加准确,提高文字识别率。

【技术实现步骤摘要】
文字识别方法、电子设备、存储介质
本专利技术涉及电子书领域,具体涉及一种文字识别方法、电子设备、存储介质。
技术介绍
电子书与纸质书籍相比,更方便用户随时随地阅读,且可以减轻用户携带纸质书籍的重量。电子书可以通过扫描纸质书籍等方式进行制作,如扫描纸质书籍得到的图片,根据图片制作电子书。但直接根据图片制作电子书,不能对图片中的内容进行编辑、排版、校对等处理,得到的电子书质量较差,影响用户阅读体验效果。因此,在制作电子书时,还需要对图片中包含的文字等内容进行识别,以便更好的对其进行编辑、排版、校对等处理,方便制作得到的电子书显示效果更佳,更符合用户的阅读习惯。因此,需要一种对图片中包含的文字进行识别的方法,以便可以准确地识别出文字,进而对文字进行编辑、排版、校对等处理,制作出显示效果更佳的电子书。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的文字识别方法、电子设备、存储介质。根据本专利技术的一个方面,提供了一种文字识别方法,其包括:获取包含第一文字的图片;提取图片中第一文字的笔画信息,笔画信息包含直线信息和/或曲线信息;根据笔画信息,获取第本文档来自技高网...

【技术保护点】
1.一种文字识别方法,其包括:获取包含第一文字的图片;提取所述图片中第一文字的笔画信息,所述笔画信息包含直线信息和/或曲线信息;根据所述笔画信息,获取所述第一文字的线段数据集;将所述第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与所述第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为所述第一文字的识别结果。

【技术特征摘要】
1.一种文字识别方法,其包括:获取包含第一文字的图片;提取所述图片中第一文字的笔画信息,所述笔画信息包含直线信息和/或曲线信息;根据所述笔画信息,获取所述第一文字的线段数据集;将所述第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与所述第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为所述第一文字的识别结果。2.根据权利要求1所述的方法,其中,所述根据所述笔画信息,获取所述第一文字的线段数据集进一步包括:根据直线信息获取所述第一文字的第一线段数据子集,和/或,根据曲线信息进行拟合处理获取所述第一文字的第二线段数据子集;将所述第一线段数据集和/或所述第二线段数据集进行合并得到所述第一文字的线段数据集。3.根据权利要求2所述的方法,其中,所述根据直线信息获取所述第一文字的第一线段数据子集,和/或,根据曲线信息进行拟合处理获取所述第一文字的第二线段数据子集进一步包括:根据直线信息,获取包含直线的端点位置信息和倾斜角度信息的第一线段数据子集;和/或,根据曲线信息,将对应的曲线进行拟合处理,得到多个线段;根据多个线段获取包含各个线段的端点位置信息和倾斜角度信息的第二线段数据子集。4.根据权利要求3所述的方法,其中,所述将所述第一文字的线段数据集与预设数据库中的多个文字的线段数据集进行比对,查找与所述第一文字的线段数据集的重合度大于预设阈值的预设数据库中的第二文字,作为所述第一文字的识别结果进一步包括:查找预设数据库中与所述第一文字的线段数据集中线段个数相同,且根据端点位置信息和/或倾斜角度信息计算得到的重合度大于预设阈值的预设数据库中的第二文字,作为所述第一文字的识别结果。5.根据权利要求1-4中任一项所述的方法,其中,所述方法还包括:根据第二文字的字体信息,确定所述第一文字的...

【专利技术属性】
技术研发人员:张恒李铭瀚于刚方建华
申请(专利权)人:掌阅科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1