【技术实现步骤摘要】
一种智能无透镜文字识别系统
[0001]本专利技术属于无透镜成像领域,具体涉及一种智能无透镜文字识别系统。
技术介绍
[0002]随着视觉任务的快速发展和应用,相机被集成在各种硬件设备上。某些应用场景对相机尺寸有严格的要求,无透镜相机是一种使用薄掩膜版替代镜头的成像系统,因此可以大大减小相机尺寸。
[0003]和带镜头的相机相比,无透镜相机需要对传感器上收集的数据进行计算成像才能恢复图像,但是基于无透镜重建的图像存在模糊、分辨率的缺点,导致无法胜任很多视觉任务,目前尚未有对基于无透镜的非单个字符文字检测和识别的研究。
[0004]因此,需要一套无透镜文字识别系统。
技术实现思路
[0005]针对目前无透镜成像技术由于较差的成像质量而未应用于非单个字母的文字定位和识别的情况,本专利技术提供了一种基于无透镜的文字定位和识别系统。识别准确率高且该系统方法具有通用性。
[0006]本专利技术采用的技术方案如下:
[0007]本专利技术的智能无透镜文字识别系统包括光学模块和计算成像及文字 ...
【技术保护点】
【技术特征摘要】
1.一种智能无透镜文字识别系统,其特征在于,包括光学模块和计算成像及文字定位识别模块,光学模块主要由平行放置的可调制幅度掩膜板和光学传感器组成,待识别目标放置于光学模块前方,待识别目标发出的光线经可调制幅度掩膜板散射后,在光学传感器的平面上投射形成投影图像,光学传感器将投影图像传输至计算成像及文字定位识别模块;可调制幅度掩膜板上的图案通过液晶显示器显示,掩模版上的图案随机生成或通过训练优化后确定;计算成像及文字识别模块包括计算成像模型、文字定位模型和文字识别模型,三个模型串行连接;计算成像及文字识别模块的输入为经光学模块后在传感器上得到的投影图像,输出为投影图像上文字的文本形式。2.根据权利要求1所述的一种智能无透镜文字识别系统,其特征在于,所述的可调制幅度掩膜板为由k*k个单元格组成的二值化掩膜版,每个单元格的值为1或0,1表示光线能通过,0表示光线不能通过。3.根据权利要求1所述的一种智能无透镜文字识别系统,其特征在于,投影图像经计算成像模型输出预测的重建图像;文字定位模型对输入的重建图像进行处理,输出图像中文字的位置;将文字定位模型的输出结果输入文字识别模型后,输出图像的文字识别结果;计算成像及文字识别模块训练过程中,仅计算成像模型参与训练,文字定位模型和文字识别模型不参与训练。4.根据权利要求3所述的一种智能无透镜文字识别系统,其特征在于,计算成像模型为编码器
‑
解码器体系的神经网络,具体采用U
‑
NET;文字定位模型采用任意文字定位模型结构,具体采用CTPN;文字识别模型采用任意文字识别模型结构,具体采用CRNN。5.根据权利要求1所述的一种智能无透镜文字识别系统,其特征在于,通过训练优化后确定掩模版图案的方法包括以下步骤:1)将待识别目标与光学模块的成像过程建模为二维卷积层,具体为:m=w*o其中,w表示掩模版上的幅度分布,即掩模版上单元格的值分布;以掩模版中心点为原点构建坐标系,(i,j)为掩膜板上单元格中心点的坐标,w
i,j
表示掩膜板上坐标为(i,j)的单元格的值;o表示待识别目标不经过掩模版时在传感器平面上缩放后的图像;以传感器平面中心点为原点构建坐标系,(x,y)表示投影图像的像素点在传感器平面上的坐标值,o
x,y
表示待识别目标不经过掩模版时在传感器平...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。