信函校验识别方法技术

技术编号：2931765 阅读：228 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种信函校验识别方法，包括以下步骤：建立邮政编码与汉字地址对照表；进行邮政编码数字识别获得第一数字识别结果及识别自信度；进行汉字地址识别获得汉字识别结果及识别自信度，井根据所述对照表获得邮政编码第二数字识别结果及识别自信度；根据所述第一、第二数字识别结果及识别自信度对信函地址进行校验识别。本发明专利技术将函件的数字邮政编码和收信人汉字地址信息结合起来进行校验识别，实现目的地信息的补全和纠错，提高了识别系统的效率和正确率。降低了邮件分检的成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于邮政信函校验识别
，特别涉及一种邮件的目的地信息的校验识别方法。
技术介绍
一封邮件的目的地信息主要由两部分组成，即邮政编码信息和汉字地址信息。目前在邮政自动化领域主要是依靠对邮政编码进行光学字符识别(OCR)来达到邮件自动化分拣处理的；与此同时，近年来汉字尤其是打印体汉字的光学字符识别(OCR)技术也得到了长足的进步，在邮政自动化领域，这项技术在目标汉字地址识别上也是大有用武之地的。然而，无论是邮政编码还是汉字地址识别技术在单一使用时都不同程度地存在一些弊端。一、单纯依靠邮件的邮政编码识别结果来进行邮件自动化处理的缺点我国地域广阔，国家邮政局从很早开始就使用6位邮政编码针对不同的地域进行了划分，但由于各地的推广力度不一以及一直以来人们的书写习惯等原因导致邮政编码在实际的书写或打印中存在不少问题，从而使单纯依靠邮政编码识别结果来进行邮件自动化处理的效率有时并不是很高，以下罗列了一些主要的问题点1、邮政编码书写错误或手工书写不规范导致邮件被错分有些用户虽然不知道邮件目的地的确切邮编，但是仍会凭印象或凭想象信手写上一个，虽然汉字地址书写得完全正确，但是如果分拣机的OCR只识别邮编的话就势必会造成该邮件被分到一个错误的地方，有时甚至是大相径庭的方向，对用户来说耽搁了邮件的到达时间，对邮局来说也增加了邮运的成本。例如，手写体邮编(233500)由于个别数字的书写较随意则被识别成“2R3500”，(R表示OCR拒识)，造成邮件被拒识。2、邮政编码打印不规范或不清晰导致邮件被错分或拒分这部分信由于邮编是用打印机打印的，所以在很多情况下邮编可能被...

【技术保护点】
一种信函校验识别方法，包括以下步骤：建立邮政编码与汉字地址对照表；进行邮政编码数字识别获得第一数字识别结果及识别自信度；进行汉字地址识别获得汉字识别结果及识别自信度，并根据所述对照表获得邮政编码第二数字识别结果及识别自信度；根据所述第一、第二数字识别结果及识别自信度对信函地址进行校验识别。

【技术特征摘要】

【专利技术属性】
技术研发人员：吕岳，邬建中，徐海堰，原晓梅，
申请(专利权)人：邮政科学上海研究所，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人