当前位置: 首页 > 专利查询>韶关学院专利>正文

一种基于OCR和TTS的视障者阅读装置制造方法及图纸

技术编号:30064843 阅读:33 留言:0更新日期:2021-09-15 11:17
本实用新型专利技术涉及一种基于OCR和TTS的视障者阅读装置,包括:微电脑单元、语音识别单元、摄像头以及语音播放器;所述微电脑单元分别与所述语音播放器、所述摄像头以及所述语音识别单元电连接;所述语音识别单元用于识别语音指令,所述语音指令包括阅读指令,所述语音识别单元还用于将所述阅读指令发送给所述微电脑单元;所述微电脑单元用于根据所述阅读指令,驱动所述摄像头对待阅读文字进行抓拍,得到文字图像;所述微电脑单元还用于对所述文字图像进行文字识别,得到文本数据,并根据所述文本数据得到语音流,以及将所述语音流发送给所述语音播放器进行播放。本实用新型专利技术所述的基于OCR和TTS的视障者阅读装置操作简易且阅读效率高。率高。率高。

【技术实现步骤摘要】
一种基于OCR和TTS的视障者阅读装置


[0001]本技术涉及电子阅读设备
,特别是涉及一种基于OCR和TTS的视障者阅读装置。

技术介绍

[0002]对于视力障碍者来说,阅读有两种方式,要么依照传统的方式,通过盲文来阅读,要么通过盲人阅读器或读屏软件等工具来进行电子阅读。对于前者,视力障碍者仅能阅读已经翻译成盲文的阅读资料,资料来源有限、价格昂贵,且阅读效率低;对于后者,现今市场上的盲人阅读器必须首先导入电子书籍,并以此作为阅读来源,在时间上存在一定滞后性;而读屏软件则仅能读取电脑屏幕上的文字,对于海量的纸质文件则无从下手,对于视力障碍者来说体验不佳。

技术实现思路

[0003]基于此,本技术的目的在于,提供一种基于OCR和TTS的视障者阅读装置,视障者可以通过语音控制来触发装置进行对待阅读的文字拍照,对照片进行文字识别,最后合成语音播放出来,其操作简易且阅读效率高。
[0004]一种基于OCR和TTS的视障者阅读装置,包括:
[0005]微电脑单元、语音识别单元、摄像头以及语音播放器;<br/>[0006]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于OCR和TTS的视障者阅读装置,其特征在于,包括:微电脑单元、语音识别单元、摄像头以及语音播放器;所述微电脑单元分别与所述语音播放器、所述摄像头以及所述语音识别单元电连接;所述语音识别单元用于识别语音指令,所述语音指令包括阅读指令,所述语音识别单元还用于将所述阅读指令发送给所述微电脑单元;所述微电脑单元用于根据所述阅读指令,驱动所述摄像头对待阅读文字进行抓拍,得到文字图像;所述微电脑单元还用于对所述文字图像进行文字识别,得到文本数据,并根据所述文本数据得到语音流,以及将所述语音流发送给所述语音播放器进行播放;其中,所述语音流记载有所述待阅读文字的内容。2.根据权利要求1所述的基于OCR和TTS的视障者阅读装置,其特征在于:还包括服务器,所述微电脑单元与所述服务器信号连接;所述微电脑单元还用于将所述文本数据发送给所述服务器;所述服务器用于通过百度语音合成API根据所述文本数据得到所述语音流,并将所述语音流发送给所述微电脑单元。3.根据权利要求2所述的基于OCR和TTS的视障者阅读装置,其特征在于:所述微电脑单元包括OCR模块,所述OCR模块用于通过谷歌的开源OCR算法对所述文字图像进行文字识别。4.根据权利要求2所述的基于OCR和TTS的视障者阅读装置,其特征在于:所述语音识别单元包括ASR管理模块以及ASR模块;所述ASR管理模块用于对语音指令的声纹信息进行学习并记录;所述ASR模块用于根据所述记录的声纹信息对语音指令进行识别并将识别结果发送给所述ASR管理模块;所述ASR管理模块还用于将所述识别结果发送给所述微电脑单元。5.根据权利要求4所述的基于OCR和TTS的视障...

【专利技术属性】
技术研发人员:张德钱李宇航廖斌强丁凡杨森泉
申请(专利权)人:韶关学院
类型:新型
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1