用于识别文本的方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:29968268 阅读:30 留言:0更新日期:2021-09-08 09:40
本申请公开了用于识别文本的方法、装置、电子设备、存储介质及计算机程序产品,涉及图像识别、语音识别技术领域。方法的一具体实施方式包括:获取待识别图像;识别待识别图像,得到正文文本、正文文本中的被标注文本和标注信息;在正文文本中,对应于被标注文本标注标注信息,得到识别后文本。本申请识别待识别图像中的正文文本、被标注文本和标注信息,参照待识别图像中的标注格式排版正文文本、被标注文本和标注信息得到识别后文本,降低了设备的存储空间,提高了用户的查阅体验度。提高了用户的查阅体验度。提高了用户的查阅体验度。

【技术实现步骤摘要】
用于识别文本的方法、装置、设备、存储介质及程序产品


[0001]本申请涉及图像处理领域,具体涉及图像识别、语音识别
,尤其涉及用于识别文本的方法、装置、电子设备、存储介质以及计算机程序产品。

技术介绍

[0002]在查阅纸质书籍过程中,阅读者往往喜欢在纸质书籍中进行标注。由于纸质书籍不利于携带,在纸质书籍上标注的内容无法被随时随地地查阅,而对标注页进行拍摄获取图像又会占用用户手机上的内存,且不利于归类,后续查阅时,查找困难。

技术实现思路

[0003]本申请提供了一种用于识别文本的方法、装置、电子设备、存储介质以及计算机程序产品。
[0004]根据第一方面,提供了一种用于识别文本的方法,包括:获取待识别图像;识别待识别图像,得到正文文本、正文文本中的被标注文本和标注信息;在正文文本中,对应于被标注文本标注标注信息,得到识别后文本。
[0005]根据第二方面,提供了一种用于识别文本的装置,包括:获取单元,被配置成获取待识别图像;识别单元,被配置成识别待识别图像,得到正文文本、正文文本中的被标注文本和标注信息;本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于识别文本的方法,其特征在于,包括:获取待识别图像;识别所述待识别图像,得到正文文本、所述正文文本中的被标注文本和标注信息;在所述正文文本中,对应于所述被标注文本标注所述标注信息,得到识别后文本。2.根据权利要求1所述的方法,其中,所述识别所述待识别图像,得到正文文本、所述正文文本中的被标注文本和标注信息,包括:响应于确定所述待识别图像中的正文部分包括预设标记,识别所述待识别图像中的正文部分、所述正文部分中被所述预设标记所标记的被标注部分和标注部分,依次得到所述正文文本、所述被标注文本和所述标注信息。3.根据权利要求2所述的方法,其中,所述识别所述待识别图像,得到正文文本、所述正文文本中的被标注文本和标注信息,还包括:响应于确定所述待识别图像中的正文部分不包括预设标记,接收待识别语音;识别所述待识别语音,得到语音文本,并将所述正文文本中与所述语音文本匹配的文本确定为所述被标注文本。4.根据权利要求2所述的方法,其中,所述识别所述待识别图像中的正文部分、所述正文部分中被所述预设标记所标记的被标注部分和标注部分,依次得到所述正文文本、所述被标注文本和所述标注信息,包括:识别所述正文部分、所述被标注部分,依次得到所述正文文本、所述被标注文本;对所述标注部分进行图像分割,得到图像形式的所述标注信息。5.根据权利要求1

4任一所述的方法,其中,还包括:显示所述识别后文本。6.根据权利要求5所述的方法,其中,还包括:接收用户的编辑操作,并根据所述编辑操作,编辑所述识别后文本。7.一种用于识别文本的装置,其特征在于,包括:获取单元,被配置成获取待识别图像;识别单元,被配置成识别所述待识别图像,得到正文文本、所述正文文本中的被标注文本和标注信息;标注单元,被配置成在所述正文文本中,对应于所述被标注文本标注所述标注信息...

【专利技术属性】
技术研发人员:刘清灿
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1