一种智能扫描笔的图像识别方法、装置以及智能扫描笔制造方法及图纸

技术编号：39158920 阅读：12 留言：0更新日期：2023-10-23 15:01

本发明专利技术提出智能扫描笔的图像识别方法，具体涉及人工智能技术领域,该方法为：S0：构建、训练并测试得到图像文本识别模型；S1：图像采集S2：图像预处理S4：使用图像文本识别模型对预处理图像进行文本识别，同时获取图像中的语言信息和视觉特征，输出预处理图像中包含的文本内容。本发明专利技术还提供一种装置和智能扫描笔。相比于现有技术，本发明专利技术提供的图像识别方法不需要额外的语言模型，将原有的两步识别图像文本内容转变成为一步识别，自适应地将视觉和语言信息考虑在一个统一的结构中，在保持高效的同时展现出更强的语言能力，应用与扫描笔中能显著提升扫描笔的文本识别准确度，加快扫描笔文本识别的速度，帮助用户获得更好的性能体验。验。验。

全部详细技术资料下载

【技术实现步骤摘要】
一种智能扫描笔的图像识别方法、装置以及智能扫描笔

[0001]本专利技术涉及人工智能
，尤其涉及一种智能扫描笔。

技术介绍

[0002]扫描笔作为一种便携式的电子设备，可将手写或印刷的文本扫描后转换为数字格式，对其进一步做出显示、编辑、TTS语音播放、翻译、分享等操作。
[0003]其工作过程中主要可分为图像采集、图像处理和图像识别等步骤：用户首先需手持扫描笔对准需要扫描的文本，此时扫描笔笔尖处设置的光学传感器工作，采集笔尖处的文本的图像；而后，扫描笔内部将对采集到的图像进行处理，最后将处理好的图像送入图像识别模型中进行文本识别，得到图像中的文本信息后，再进一步根据用户需求，对该文本信息进一步做出显示、翻译等处理。
[0004]现有技术中应用于扫描笔中的图像识别算法通常采用两步走的方法完成，即在将处理好的图像送入图像识别模型后，图像识别模型首先基于视觉分析方法对图像进行视觉预测，得出预测结果后，再以文本模型纠正该预测结果，最终得到文本识别结果，采用这样的方法时，图像识别模型将独立构建视觉预测模块和语言纠正模块，两模块单独考虑送入的图像中的视觉信息和文本信息。以申请号为“202310604317.5”的中国专利申请文件为例，其中清楚记载了一种词典笔的文本识别方法及装置，通过识别词典笔在扫描过程中获取的文本图像内的词语内容，在词语内容与词典笔词库内的信息不能匹配时，对词语内容进行字符信息比对，并判定字符状态，在字符完整状态下确定文本错误，在字符残缺状态下通过识别的完整字符内容与词典笔词库内的信息进行

【技术保护点】

【技术特征摘要】
1.一种智能扫描笔的图像识别方法，其特征在于，该方法包括以下步骤：S0：构建、训练并测试得到图像文本识别模型；S1：图像采集：设置图像采集器，扫描得到目标区域的原始图像；S2：图像预处理：对原始图像进行预处理得到预处理图像；S4：使用图像文本识别模型对预处理图像进行文本识别，同时获取图像中的语言信息和视觉特征，输出预处理图像中包含的文本内容。2.如权利要求1所述的智能扫描笔的图像识别方法，其特征在于，所述S0：构建、训练并测试得到图像文本识别模型包括有以下子步骤：S01：构建模型；S02：准备训练数据集；S03：训练模型；S04：测试模型。3.如权利要求2所述的智能扫描笔的图像识别方法，其特征在于，所述S01：构建模型包括有以下子步骤：S01：构建模型具体包括有：S011：分别搭建特征提取网络、掩码语言感知模块以及视觉推理模块；S012：设置特征提取网络、掩码语言感知模块以及视觉推理模块依次连接以构建成为构建待训图像文本识别模型。4.如权利要求3所述的智能扫描笔的图像识别方法，其特征在于，所述S02具体为：S021：选用若干张训练图像；S022：对每一张训练图像做出单词级标注；S023：对已经标注出单词的数据集中的每一张训练图像，根据当前图像上标注的单词的长度随机生成的字符索引；S024：收集所有带单词级标注以及字符索引的训练图像形成训练数据集。5.如权利要求4所述的智能扫描笔的图像识别方法，其特征在于，所述S03：训练模型包括有以下子步骤：S031：从训练数据集选择一个图像输入到待训图像文本识别模型中；S032：特征提取网络对当前输入的图像进行特征提取，得到当前图像的二维特征向量；S033：掩码语言感知模块对当前图像的二维特征向量、当前图像所携带的单词级标注、当前图像所携带的字符索引做出字符掩码映射处理，得到遮挡特征映射；S034：组合当前图像、当前图像的二维特征向量、遮挡特征映射得到带遮挡字符的图像；S035：将带遮挡字符的图像输入到视觉推理模块中，由视觉推理模块视觉空间捕获长距离的信息，预测对应的文本行识别内容；S036：循环S031...

【专利技术属性】
技术研发人员：车建波，
申请(专利权)人：深圳市贝铂智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人