一种非特定字体的数字、符号和字母组的识别方法技术

技术编号:25600127 阅读:18 留言:0更新日期:2020-09-11 23:57
本发明专利技术提出一种非特定字体的数字、符号和字母组的识别方法,包括以下步骤:信息采集模块、图形分析模块、图形采样模块、图形预测模块、模型比对模块、字符比对模块、模型更新模块。本发明专利技术提供的非特定字体的数字、符号和字母组的识别方法,通过工业作业中使用的PDA的扫描头或摄像头,采集非特定字体的数字、符号、字母及其组合并在PDA中进行识别,解决当前工业环境使用的所有PDA可以无须联网就通过自身的条码扫描头能够快速且准确的采集各种字体的一组数字、符号、字母或其组合。

【技术实现步骤摘要】
一种非特定字体的数字、符号和字母组的识别方法
本专利技术属于工业环境信息采集识别
,具体涉及一种基于需求响应的非特定字体的数字、符号和字母组的识别方法、装置和存储介质。
技术介绍
当前工业环境中,需要采集作为商品或部件的编号的各种字体的一组数字、符号、字母或它们的组合(但不是条码)的信息上传到管理和追溯系统中。在通过工业作业中使用的智能终端(以下称PDA)的扫描头或摄像头,采集数字、符号、字母及其组合并进行识别的领域,目前市场上有三种技术:一、“基恩士(KEYENCE)”品牌的工业PDA可通过条码扫描头采集识别非特定字体的数字、符号、字母及其组合;二、其余品牌工业PDA设备的条码扫描头可以采集识别一种叫OCR字体的一组数字、符号、字母或它们的组合。三、通过工业PDA条码扫描头采集需要识别的各种字体的数字、符号、字母及其组合,上传互联网的云端服务器中,通过服务器中的图形识别引擎+AI大数据图形分析然后输出结果。上述现有技术具有以下的缺点和不足:“基恩士(KEYENCE)”品牌将技术罐装到芯片中,再将该芯片植入到设备中,如果要获得该采集识别功能只能购买硬件PDA,而其他广泛的各种品牌PDA无法使用该功能。另外,对于“基恩士(KEYENCE)”设备本身来说,由于是通过封装硬件芯片来实现的功能,因此也无法在当前设备上进行升级和优化,只能报废旧版本设备再购买新一代产品,这造成了巨大浪费。其余品牌工业PDA设备的条码扫描头只能采集识别一种叫OCR字体的一组数字、符号、字母或它们的组合,无法识别其他各种字体的上述组合,在实际应用中可用范围十分狭窄。而通过工业PDA条码扫描头采集需要识别的各种非特定字体的数字、符号、字母及其组合,上传互联网的云端服务器并通过服务器中的图形识别引擎+AI大数据图形分析来输出识别结果的技术,这种识别方法的缺陷是工作时需连接互联网,依赖互联网及云服务器,需要借助人工智能大数据AI技术,在无网环境不能工作,网络信号不稳定直接影响系统工作性能。
技术实现思路
本专利技术是为了解决上述问题而进行的,提供了一种非特定字体的数字、符号和字母组的识别方法,通过工业作业中使用的PDA的扫描头或摄像头,采集非特定字体的数字、符号、字母及其组合并在PDA中进行识别,解决当前工业环境使用的所有PDA可以无须联网就通过自身的条码扫描头能够快速且准确的采集各种字体的一组数字、符号、字母或其组合(非条码)。为实现上述目的,本专利技术提出一种基于需求响应的非特定字体的数字、符号和字母组的识别方法,具有这样的特征,包括以下步骤:信息采集:对标签样本进行拍照,得到图片信息;图形矫正:根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正,得到矫正图形;图形采样:对所述图片信息进行采样消除光线干扰,得到采样图形;图形预测:根据所述采样图形运算图形趋势,得到预测图形;模型比对:选定所述预测图形中的每个所述字符,根据所述字符的有效信息得到字体初判类型,并根据所述字体初判类型在已有样本模型中比对,得到每个所述字符的包含与各所述样本模型比对结果的序列结果集,在各所述序列结果集中,各所述比对结果按照置信度从高到低进行排序;字符比对:分别选取置信度最高所述对比结果的作为个所述字符的返回结果;模型更新:由所述预测图形生成图片样本,将所述返回结果作为所述图片样本的参数,根据所述图片样本和所述参数更新所述已有样本模型集合。另外,本专利技术提供的非特定字体的数字、符号和字母组的识别方法,还具有这样的特征,所述图形矫正步骤中,所述关键因素包括线条、每个字符的相对比例,所述第一预设效果规则为通过垂直角度采集图片得到的显示效果。另外,本专利技术提供的非特定字体的数字、符号和字母组的识别方法,还具有这样的特征,所述模型比对步骤中,还具有以下步骤:文字选定:定位并选定所述所述预测图形中的每个所述字符;文字形态预处理:根据各所述字符的所述有效信息进行预处理矫正,得到各矫正后字符;字体比对:根据所述矫正后文字字符的特征数据在所述已有样本模型中比对,得到每个所述字符的包含与各所述样本模型比对结果的序列结果集。另外,本专利技术提供的非特定字体的数字、符号和字母组的识别方法,还具有这样的特征,所述有效信息包括各所述字符的笔画信息、旋转角度信息,所述预处理包括根据所述笔画信息判断所述字符是否为反白,如为反白则进行色相矫正,根据所述旋转角度判断各所述字符是否有旋转角度,如有旋转角度则进行旋转矫正。另外,本专利技术提供的非特定字体的数字、符号和字母组的识别方法,还具有这样的特征,所述字体比对步骤前,还具有以下步骤:字体类型初判:根据各所述矫正后字符的字形状态、笔画粗细状态,以及转折笔画的特征判断得到字体初判类型,去除所述已有样本模型集合中低于预设置信度的所述字体初判类性的样本模型。另外,本专利技术提供的非特定字体的数字、符号和字母组的识别方法,还具有这样的特征,所述字符比对步骤中,在进行置信度排序之前,还具有以下步骤:规则匹配预过滤:将所述序列结果集中的各比对结果与预设字符串内容规则进行匹配,并去除不符合所述预设字符串内容规则的各所述比对结果。另外,本专利技术提供的非特定字体的数字、符号和字母组的识别方法,还具有这样的特征,所述模型更新步骤包括:图片样本保存:根据所述图片样本和所述参数,得到原始图片、文字区域、文字内容,将所述图片样本作为新已有样本模型保存在所述已有样本模型集合中;加权评分计算:在本次识别过程中,根据所述已有样本模型的特征数据与所述图片样本的特征数据匹配成功且输出正确结果的识别成功率,对所述图片样本进行加权评分计算,按照由高到低排列;样本模型调整:根据所述已有样本模型的特征数据与所述图片样本的特征数据匹配成功的累计命中率,将所述累计命中率低的已有样本模型移出已有样本模型集合,放入备用区域;模型重新生成:将更新后的所述已有样本模型集合生成索引。此外,为实现上述目的,本专利技术还提供了一种电子装置,具有这样的特征,该电子装置包括:存储器、处理器,所述存储器上存储有非特定字体的数字、符号和字母组的识别程序,所述非特定字体的数字、符号和字母组的识别程序被所述处理器执行时实现以下步骤:信息采集模块:对标签样本进行拍照,得到图片信息;图形矫正模块:根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正,得到矫正图形;图形采样模块:对所述图片信息进行采样消除光线干扰,得到采样图形;图形预测模块:根据所述采样图形运算图形趋势,得到预测图形;模型比对模块:选定所述预测图形中的每个所述字符,根据所述字符的有效信息得到字体初判类型,并根据所述字体初判类型在已有样本模型中比对,得到每个所述字符的包含与各所述样本模型比对结果的序列结果集,在各所述序列结果集中,各所述比对结果按照置信度从高到低进行排序;字符比对模块:分别选取置信度最高本文档来自技高网
...

【技术保护点】
1.一种非特定字体的数字、符号和字母组的识别方法,其特征在于,包括以下步骤:/n信息采集:对标签样本进行拍照,得到图片信息;/n图形矫正:根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正,得到矫正图形;/n图形采样:对所述图片信息进行采样消除光线干扰,得到采样图形;/n图形预测:根据所述采样图形运算图形趋势,得到预测图形;/n模型比对:选定所述预测图形中的每个所述字符,根据所述字符的有效信息得到字体初判类型,并根据所述字体初判类型在已有样本模型中比对,得到每个所述字符的包含与各所述样本模型比对结果的序列结果集,在各所述序列结果集中,各所述比对结果按照置信度从高到低进行排序;/n字符比对:分别选取置信度最高所述对比结果的作为个所述字符的返回结果;/n模型更新:由所述预测图形生成图片样本,将所述返回结果作为所述图片样本的参数,根据所述图片样本和所述参数更新所述已有样本模型集合。/n

【技术特征摘要】
1.一种非特定字体的数字、符号和字母组的识别方法,其特征在于,包括以下步骤:
信息采集:对标签样本进行拍照,得到图片信息;
图形矫正:根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正,得到矫正图形;
图形采样:对所述图片信息进行采样消除光线干扰,得到采样图形;
图形预测:根据所述采样图形运算图形趋势,得到预测图形;
模型比对:选定所述预测图形中的每个所述字符,根据所述字符的有效信息得到字体初判类型,并根据所述字体初判类型在已有样本模型中比对,得到每个所述字符的包含与各所述样本模型比对结果的序列结果集,在各所述序列结果集中,各所述比对结果按照置信度从高到低进行排序;
字符比对:分别选取置信度最高所述对比结果的作为个所述字符的返回结果;
模型更新:由所述预测图形生成图片样本,将所述返回结果作为所述图片样本的参数,根据所述图片样本和所述参数更新所述已有样本模型集合。


2.根据权利要求1所述的非特定字体的数字、符号和字母组的识别方法,其特征在于,所述图形矫正步骤中,
所述关键因素包括线条、每个字符的相对比例,
所述第一预设效果规则为通过垂直角度采集图片得到的显示效果。


3.根据权利要求2所述的非特定字体的数字、符号和字母组的识别方法,其特征在于,所述模型比对步骤中,还具有以下步骤:
文字选定:定位并选定所述所述预测图形中的每个所述字符;
文字形态预处理:根据各所述字符的所述有效信息进行预处理矫正,得到各矫正后字符;
字体比对:根据所述矫正后文字字符的特征数据在所述已有样本模型中比对,得到每个所述字符的包含与各所述样本模型比对结果的序列结果集。


4.根据权利要求3所述的非特定字体的数字、符号和字母组的识别方法,其特征在于,所述有效信息包括各所述字符的笔画信息、旋转角度信息,所述预处理包括根据所述笔画信息判断所述字符是否为反白,如为反白则进行色相矫正,根据所述旋转角度判断各所述字符是否有旋转角度,如有旋转角度则进行旋转矫正。


5.根据权利要求4所述的非特定字体的数字、符号和字母组的识别方法,其特征在于,所述字体比对步骤前,还具有以下步骤:
字体类型初判:根据各所述矫正后字符的字形状态、笔画粗细状态,以及转折笔画的特征判断得到字体初判类型,去除所述已有样本模型集合中低于预设置信度的所述字体初判类性的样本模型。


6.根据权利要求5所述的非特定字体的数字、符号和...

【专利技术属性】
技术研发人员:唐志展
申请(专利权)人:上海语识信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1