【技术实现步骤摘要】
一种基于OCR的单据自动识别方法
本申请涉及物流运输检测
,具体而言,涉及一种基于OCR的单据自动识别方法。
技术介绍
在建筑物料运输行业中,物流公司负责将建筑需要的原材料从工厂运输到施工工地,在物料的运输和交割过程中会对大量的纸质单据进行处理,该类单据是用于物流公司在后期向托运方收取费用的依据。由于物流公司的发货,收货方较多,每个收发货单位的单据格式、质量、清晰度是不同的,因此就造成了单据样式多样化,单据质量多样化,单据信息多样化等问题。将纸质单据上的涉及发货地、收货地、进厂时间、出厂时间、拉货车牌号、货物重量、收货进厂时间、收货出厂时间等信息转化为文本格式,然后形成对账报表就成为了物流运输企业必然需要去处理之事,目前,各个物流公司均采用人工手工将纸质单据信息录入电脑中的方式来解决该类问题,其解决过程需要耗费大量的人力,人工成本较高;同时其工作过程单调、重复度高,极容易产生人工失误,混乱物流程序。为解决上述问题,现有技术中出现了光学文本识别(OpticalCharacterRecognition,OCR),O ...
【技术保护点】
1.一种基于OCR的单据自动识别方法,其特征在于,所述自动识别方法包括以下步骤:/nS1,基于OCR对单据图像中的文本信息进行提取,得到文字数据;/nS2,根据预设特征值对所述文字数据中的单据类型进行识别,得到第一解析结果;/nS3,根据预设逻辑对所述文字数据中的单据模板进行识别,得到第二解析结果;/nS4,基于第一预设识别规则对所述文字数据中的文字含义进行识别,得到第三解析结果,其中,对车牌信息包括进行误差校正识别;/nS5,将所述第一解析结果、第二解析结果和第三解析结果进行归集;/n其中,步骤S5中的归集结果将储存于数据库中,以形成历史数据。/n
【技术特征摘要】 【专利技术属性】
1.一种基于OCR的单据自动识别方法,其特征在于,所述自动识别方法包括以下步骤:
S1,基于OCR对单据图像中的文本信息进行提取,得到文字数据;
S2,根据预设特征值对所述文字数据中的单据类型进行识别,得到第一解析结果;
S3,根据预设逻辑对所述文字数据中的单据模板进行识别,得到第二解析结果;
S4,基于第一预设识别规则对所述文字数据中的文字含义进行识别,得到第三解析结果,其中,对车牌信息包括进行误差校正识别;
S5,将所述第一解析结果、第二解析结果和第三解析结果进行归集;
其中,步骤S5中的归集结果将储存于数据库中,以形成历史数据。
2.如权利要求1所述的一种基于OCR的单据自动识别方法,其特征在于,所述自动识别方法还包括步骤S6,基于第二预设识别规则对所述文字数据中的文字含义进行识别,得到第三解析结果。
3.如权利要求1或2所述的一种基于OCR的单据自动识别方法,其特征在于,步骤S2中的预设特征值包括限定关键字,即在识别到第一关键字时,不能包含第二关键字,否则识别无效;识别到第二关键字时,不能包含第一关键字,否则识别无效。
4.如权利要求1或2所述的一种基于OCR的单据自动识别方法,其特征在于,步骤S3中的预设逻辑包括对提取的文字特征进行分解匹配,若匹配对应,则认定该文字特征为单据模板;该预设逻辑还包括对特征值的提取,其特征值的提取依照单据上的预设方位坐标。
5.如权利要求1或2所述的一种基于OCR的单据自动识别方法,其特征在于,步骤S4中的通用识别规则包括根据单据字段的特性将其进行划分,即划分为有限集名词集合、有限集固定规律字母组合集合、无限集数字集合和可穷举固定格式。
技术研发人员:何昱,
申请(专利权)人:重庆数道科技有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。