一种文本识别的方法、装置、可读存储介质和电子设备制造方法及图纸

技术编号:28783862 阅读:29 留言:0更新日期:2021-06-09 11:17
本发明专利技术实施例公开了一种文本识别的方法、装置、可读存储介质和电子设备。本发明专利技术实施例通过智能设备获取待处理图像,其中,所述待处理图像可以为翻读台历,由于翻读台历由至少一个图片组成,因此,待处理图像中包含至少一个图片区域,每个所述图片区域中包括至少一个图像信息,图像信息包括文字信息或图形信息;确定所述待处理图像中包含的待处理图像信息,根据所述待处理图像信息,生成第一语音信息,播报所述第一语音信息。通过上述方法,采用智能设备的拍摄功能获取待处理图像后,通过语音功能与用户进行互动,在无人陪同的情况下,使用户可以自主使用翻读台历进行学习。户可以自主使用翻读台历进行学习。户可以自主使用翻读台历进行学习。

【技术实现步骤摘要】
一种文本识别的方法、装置、可读存储介质和电子设备


[0001]本专利技术涉及数据处理领域,具体涉及一种文本识别的方法、装置、可读存储介质和电子设备。

技术介绍

[0002]随着全民素质的提高,学生的学习也越来越受到家长的重视,学生除了在课堂上进行学习之外,在课后也需要进行学习,但是在课后的学习过程中,家长可能没有太多的时间对学生进行辅导,或者,家长对还学生的学习内容不太了解,无法正确指导学生;例如,在外语学习过程中,会采用适合各年龄阶段的教具,比如在儿童阶段,会使用翻读台历教具来进行单词的发音、拼写、以及音标的发音等,但是儿童在课后使用翻读台历教具时,家长可能并不擅长学生正在学习的语种,无法准确指导学生正确的单词拼写和发音,因此无法对学生进行辅导,翻读台历等教具也无法起到教学的作用。
[0003]综上所述,如何在无人陪同的情况下,使学生可以自主使用教具进行学习是目前需要解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供了一种文本识别的方法、装置、可读存储介质和电子设备,使学生可以自主使用教具进行学习,提高了用户的使用体验。
[0005]第一方面,本专利技术实施例提供了一种文本识别的方法,该方法包括:
[0006]接收待处理图像,其中,所述待处理图像中包含至少一个图片区域,每个所述图片区域中包括至少一个图像信息;
[0007]确定所述待处理图像中包含的待处理图像信息,其中,所述待处理图像信息为所述至少一个图像信息的集合;
[0008]根据所述待处理图像信息,生成第一语音信息;
[0009]播报所述第一语音信息。
[0010]优选地,所述图像信息包括文字信息或图形信息。
[0011]优选地,确定所述待处理图像中包含的待处理图像信息,具体包括:
[0012]通过图像检测确定所述待处理图像中的至少一个图片区域,其中,每个图片区域携带对应的标识信息;
[0013]通过光学字符识别OCR确定出每个所述图片区域中的至少一个图像信息;
[0014]按照所述每个图片区域携带对应的标识信息将所述至少一个图像信息进行排序,生成所述待处理图像信息。
[0015]优选地,确定所述待处理图像中包含的所述待处理图像信息,具体还包括:
[0016]通过图像检测确定所述待处理图像中的至少一个图片区域;
[0017]确定所述至少一个图片区域中带有特定图形的至少一个候选区域,其中,每个所述候选区域携带对应的标识信息;
[0018]通过光学字符识别OCR确定出每个所述候选区域中的至少一个图像信息;
[0019]按照所述每个候选区域携带对应的标识信息将所述至少一个图像信息进行排序,生成所述待处理图像信息。
[0020]优选地,所述特定图形为手指图形。
[0021]优选地,所述根据所述待处理图像信息,生成第一语音信息,具体包括:
[0022]响应于在数据库的候选图像信息中查找到与所述待处理图像信息相同图像信息;
[0023]在所述数据库中获取所述待处理图像信息对应的语音,生成第一语音信息,其中,所述第一语音信息中包括所述待处理图像信息对应的语音。
[0024]优选地,所述根据所述待处理图像信息,生成第一语音信息,具体还包括:
[0025]响应于在数据库的候选图像信息中未查找到与所述待处理图像信息相同图像信息;
[0026]在所述数据库中获取未查找到与所述待处理图像信息相同图像信息时对应的指令信息,生成第一语音信息,其中,所述第一语音信息中包括所述指令信息,所述指令信息用于提示用户获取正确待处理图像的方法。
[0027]优选地,所述在所述数据库中获取未查找到与所述待处理图像信息相同图像信息时对应的指令信息,生成第一语音信息,具体包括:
[0028]所述在所述数据库中获取未查找到与所述待处理图像信息相同图像信息时对应的指令信息,生成所述指令信息;
[0029]根据所述指令信息,生成所述第一语音信息。
[0030]优选地,该方法还包括:
[0031]接收到触发指令;
[0032]播报第二语音信息,其中,所述第二语音信息用于提示用户获取待处理图像。
[0033]优选地,该方法还包括:
[0034]接收语音反馈信息;
[0035]根据所述语音反馈信息,生成第三语音信息;
[0036]播报所述第三语音信息。
[0037]优选地,所述根据所述语音反馈信息,生成第三语音信息,具体包括:
[0038]响应于所述语音反馈信息中待处理图像信息的读音正确,生成第三语音信息,其中,所述第三语音信息用于提示用户读音正确。
[0039]优选地,所述根据所述语音反馈信息,生成第三语音信息,具体包括:
[0040]响应于所述语音反馈信息中待处理图像信息的读音错误,生成第三语音信息,其中,所述第三语音信息包括所述待处理图像信息的正确读音。
[0041]第二方面,本专利技术实施例提供了一种文本识别的装置,该装置包括:
[0042]接收单元,用于获取待处理图像,其中,所述待处理图像中包含至少一个图片区域,每个所述图片区域中包括至少一个图像信息;
[0043]确定单元,用于确定所述待处理图像中包含的待处理图像信息,其中,所述待处理图像信息为所述至少一个图像信息的集合;
[0044]处理单元,用于根据所述待处理图像信息,生成第一语音信息;
[0045]播报单元,用于播报所述第一语音信息。
[0046]优选地,所述图像信息包括文字信息或图形信息。
[0047]优选地,所述确定单元具体用于:通过图像检测确定所述待处理图像中的至少一个图片区域,其中,每个图片区域携带对应的标识信息;
[0048]通过光学字符识别OCR确定出每个所述图片区域中的至少一个图像信息;
[0049]按照所述每个图片区域携带对应的标识信息将所述至少一个图像信息进行排序,生成所述待处理图像信息。
[0050]优选地,所述确定单元具体还用于:通过图像检测确定所述待处理图像中的至少一个图片区域;
[0051]确定所述至少一个图片区域中带有特定图形的至少一个候选区域,其中,每个所述候选区域携带对应的标识信息;
[0052]通过光学字符识别OCR确定出每个所述候选区域中的至少一个图像信息;
[0053]按照所述每个候选区域携带对应的标识信息将所述至少一个图像信息进行排序,生成所述待处理图像信息。
[0054]优选地,所述特定图形为手指图形。
[0055]优选地,所述处理单元具体用于:响应于在数据库的候选图像信息中查找到与所述待处理图像信息相同图像信息;
[0056]在所述数据库中获取所述待处理图像信息对应的语音,生成第一语音信息,其中,所述第一语音信息中包括所述待处理图像信息对应的语音。
[0057]优选地,所述处理单元具体还用于:响本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别的方法,其特征在于,该方法包括:获取待处理图像,其中,所述待处理图像中包含至少一个图片区域,每个所述图片区域中包括至少一个图像信息;确定所述待处理图像中包含的待处理图像信息,其中,所述待处理图像信息为所述至少一个图像信息的集合;根据所述待处理图像信息,生成第一语音信息;播报所述第一语音信息。2.如权利要求1所述的方法,其特征在于,所述图像信息包括文字信息或图形信息。3.如权利要求1所述的方法,其特征在于,确定所述待处理图像中包含的待处理图像信息,具体包括:通过图像检测确定所述待处理图像中的至少一个图片区域,其中,每个图片区域携带对应的标识信息;通过光学字符识别OCR确定出每个所述图片区域中的至少一个图像信息;按照所述每个图片区域携带对应的标识信息将所述至少一个图像信息进行排序,生成所述待处理图像信息。4.如权利要求1所述的方法,其特征在于,确定所述待处理图像中包含的所述待处理图像信息,具体还包括:通过图像检测确定所述待处理图像中的至少一个图片区域;确定所述至少一个图片区域中带有特定图形的至少一个候选区域,其中,每个所述候选区域携带对应的标识信息;通过光学字符识别OCR确定出每个所述候选区域中的至少一个图像信息;按照所述每个候选区域携带对应的标识信息将所述至少一个图像信息进行排序,生成所述待处理图像信息。5.如权利要求4所述的方法,其特征在于,所述特定图形为手指图形。6.如权利要求1所述的方法,其特征在于,所述根据所述待处理图像信息,生成第一语音信息,具体包括:响应于在数据库的候选图像信息中查找到与所述待处理图像信息相同图像信息;在所述数据库中获取所述待处理图像信息对应的语音,生成第一语音信息,其中,所述第一语音信息中包括所述待处理图像信息对应的语音。7.如权利要求1所述的方法,其特征在于,所述根据所述待处理图像信息,生成第一语音信息,具体还包括:响应于在数据库的候选图像信息中未查找到与所述待处理图像信息相同图像信息;在所述数据库中获取未查找到与所述待处理图像信息相同图像信息时对应的指令信息,生成第一语音信息,其中,所述第一语音信息中包括所述指令信息,所述指令信息...

【专利技术属性】
技术研发人员:宋安捷付治涓王宇峰李思思
申请(专利权)人:北京大米未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1