一种非特定字体的数字、符号和字母组的识别方法技术

技术编号：25600127 阅读：18 留言：0更新日期：2020-09-11 23:57

本发明专利技术提出一种非特定字体的数字、符号和字母组的识别方法，包括以下步骤：信息采集模块、图形分析模块、图形采样模块、图形预测模块、模型比对模块、字符比对模块、模型更新模块。本发明专利技术提供的非特定字体的数字、符号和字母组的识别方法，通过工业作业中使用的PDA的扫描头或摄像头，采集非特定字体的数字、符号、字母及其组合并在PDA中进行识别，解决当前工业环境使用的所有PDA可以无须联网就通过自身的条码扫描头能够快速且准确的采集各种字体的一组数字、符号、字母或其组合。

全部详细技术资料下载

【技术实现步骤摘要】
一种非特定字体的数字、符号和字母组的识别方法
本专利技术属于工业环境信息采集识别
，具体涉及一种基于需求响应的非特定字体的数字、符号和字母组的识别方法、装置和存储介质。
技术介绍
当前工业环境中，需要采集作为商品或部件的编号的各种字体的一组数字、符号、字母或它们的组合(但不是条码)的信息上传到管理和追溯系统中。在通过工业作业中使用的智能终端(以下称PDA)的扫描头或摄像头，采集数字、符号、字母及其组合并进行识别的领域，目前市场上有三种技术：一、“基恩士(KEYENCE)”品牌的工业PDA可通过条码扫描头采集识别非特定字体的数字、符号、字母及其组合；二、其余品牌工业PDA设备的条码扫描头可以采集识别一种叫OCR字体的一组数字、符号、字母或它们的组合。三、通过工业PDA条码扫描头采集需要识别的各种字体的数字、符号、字母及其组合，上传互联网的云端服务器中，通过服务器中的图形识别引擎+AI大数据图形分析然后输出结果。上述现有技术具有以下的缺点和不足：“基恩士(KEYENCE)”品牌将技术罐装到芯片中，再将该芯片植入到设备中，如果要获得该采集识别功能只能购买硬件PDA，而其他广泛的各种品牌PDA无法使用该功能。另外，对于“基恩士(KEYENCE)”设备本身来说，由于是通过封装硬件芯片来实现的功能，因此也无法在当前设备上进行升级和优化，只能报废旧版本设备再购买新一代产品，这造成了巨大浪费。其余品牌工业PDA设备的条码扫描头只能采集识别一种叫OCR字体的一组数字、符号、...

【技术保护点】
1.一种非特定字体的数字、符号和字母组的识别方法，其特征在于，包括以下步骤：/n信息采集：对标签样本进行拍照，得到图片信息；/n图形矫正：根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正，得到矫正图形；/n图形采样：对所述图片信息进行采样消除光线干扰，得到采样图形；/n图形预测：根据所述采样图形运算图形趋势，得到预测图形；/n模型比对：选定所述预测图形中的每个所述字符，根据所述字符的有效信息得到字体初判类型，并根据所述字体初判类型在已有样本模型中比对，得到每个所述字符的包含与各所述样本模型比对结果的序列结果集，在各所述序列结果集中，各所述比对结果按照置信度从高到低进行排序；/n字符比对：分别选取置信度最高所述对比结果的作为个所述字符的返回结果；/n模型更新：由所述预测图形生成图片样本，将所述返回结果作为所述图片样本的参数，根据所述图片样本和所述参数更新所述已有样本模型集合。/n

【技术特征摘要】
1.一种非特定字体的数字、符号和字母组的识别方法，其特征在于，包括以下步骤：
信息采集：对标签样本进行拍照，得到图片信息；
图形矫正：根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正，得到矫正图形；
图形采样：对所述图片信息进行采样消除光线干扰，得到采样图形；
图形预测：根据所述采样图形运算图形趋势，得到预测图形；
模型比对：选定所述预测图形中的每个所述字符，根据所述字符的有效信息得到字体初判类型，并根据所述字体初判类型在已有样本模型中比对，得到每个所述字符的包含与各所述样本模型比对结果的序列结果集，在各所述序列结果集中，各所述比对结果按照置信度从高到低进行排序；
字符比对：分别选取置信度最高所述对比结果的作为个所述字符的返回结果；
模型更新：由所述预测图形生成图片样本，将所述返回结果作为所述图片样本的参数，根据所述图片样本和所述参数更新所述已有样本模型集合。

2.根据权利要求1所述的非特定字体的数字、符号和字母组的识别方法，其特征在于，所述图形矫正步骤中，
所述关键因素包括线条、每个字符的相对比例，
所述第一预设效果规则为通过垂直角度采集图片得到的显示效果。

3.根据权利要求2所述的非特定字体的数字、符号和字母组的识别方法，其特征在于，所述模型比对步骤中，还具有以下步骤：
文字选定：定位并选定所述所述预测图形中的每个所述字符；
文字形态预处理：根据各所述字符的所述有效信息进行预处理矫正，得到各矫正后字符；
字体比对：根据所述矫正后文字字符的特征数据在所述已有样本模型中比对，得到每个所述字符的包含与各所述样本模型比对结果的序列结果集。

4.根据权利要求3所述的非特定字体的数字、符号和字母组的识别方法，其特征在于，所述有效信息包括各所述字符的笔画信息、旋转角度信息，所述预处理包括根据所述笔画信息判断所述字符是否为反白，如为反白则进行色相矫正，根据所述旋转角度判断各所述字符是否有旋转角度，如有旋转角度则进行旋转矫正。

5.根据权利要求4所述的非特定字体的数字、符号和字母组的识别方法，其特征在于，所述字体比对步骤前，还具有以下步骤：
字体类型初判：根据各所述矫正后字符的字形状态、笔画粗细状态，以及转折笔画的特征判断得到字体初判类型，去除所述已有样本模型集合中低于预设置信度的所述字体初判类性的样本模型。

6.根据权利要求5所述的非特定字体的数字、符号和...

【专利技术属性】
技术研发人员：唐志展，
申请(专利权)人：上海语识信息技术有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人