当前位置: 首页 > 专利查询>西门子公司专利>正文

识别分配信息的方法和装置制造方法及图纸

技术编号:783900 阅读:163 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及到借助视频编码站的邮件分配信息识别。按照本发明专利技术在视频编码站的图象屏幕上显示的各自的分配信息借助于一个由麦克风(60)和语言输入模块(70)组成的语言输入单元和在必要时附加地借助于键盘(50)被输入。这样被输入的数据被组合成一个完整的、按照可信度评价的分配信息建议的表并且被显示出来,此时不可信的建议在这以前已经被剔除掉了。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及到按照独立权利要求前序部分的一种方法和一种装置和特别有利的是可以应用于确定在邮件上用非字符文字书写的分配信息。分配信息的自动阅读系统,特别是(OCR)地址在信件处理领域是众所周知的并且被叙述在DE 195 31 392中。用现代化的OCR-信件分类设备处理效率为每秒钟10封信,也就是说每小时可以达到36.000封信或更多。然而识别可靠性在很大程度上随着书写在信件封面上地址信息的文字形式和总体质量而变化。在一个成功识别的情况下有关的信件可以使用一种机器可读取的条形码。这种条形码经过一个进一步的机器处理可以达到一个任意希望的分类规则。特别是使用条形码可以使信件分类到邮局运行的分类平台上,在其上信件按照它们的分配的排列次序通过送进装置被分类。亚洲区域的经济趋势和增长的邮件普及率导致了提高致力于地域性文字自动识别的努力,以便限制成本和提高邮件服务。其中与西方国家情况不同的是,在西方国家中邮件自动机代表了一种已经建立了的技术,因而对这些识别系统出现了新的要求,这是来源于,在亚洲区域中的大多数国家使用中国文字符号作为邮件的局域的地址。与西方的字符文字的字母不同,中文的文字符号是构成为表意符号的。每一个这样的表意符号可以代表一个字。代替一种用30至60个数目字母的文字是3000至6000个常用的不同的中文文字,每个中文文字具有一个自己的特征形式。中文的文字符号系统的这种实际上的不封闭性和单个符号的表意结构导致了与西方字符文字系统相比较OCR-系统有效性的降低。此外还由于,在邮件上的地址或者以立式或者以水平方向出现以及常常中文和西方文字混合出现,因而带来麻烦。因为原则上自动阅读系统的识别率不仅对于西方而且对于中文文字符号变化是很大的,因而有必要,通过不同方式的手动干预对它给予支持。当不能自动阅读的信件驳回时简单的干预是进行一种手分类方法。当然随着劳动成本的增加因而出现的成本高得很不经济。此外,这种手动分类的邮件在一个以后的时间点上不再可能毫无问题地使用机器被继续分类,这样就产生了两个相互分开的邮件流,它们必须在一个一定的时间点上重新用手动被融合在一起。为了避免OCR-驳回邮件手动分类的这种缺点,开发了邮件的一个手动编码的各种方法。所有这些方法使用的是通过操作员的干预,以便将条形码用一种方式放在邮件上,它是牢固的并且要求,用同样的机器进行一个机器分类,它们处理OCR-阅读过的和条形编码的邮件。一种另外的方法,为了能在被驳回的邮件上编码,使用所谓的手动编码站。在这些手动编码站上邮件被物理地先后次序排列地经过一个操作员,此时操作员对于每个这样的邮件根据需要信息的多少编码,以便在确定位置上清楚地识别。此时被输入的地址借助于一个目录被转化成一个分类条形码,被放在邮件上。这个被编码的邮件随后借助于条形码分类机(BCS)被进一步处理,它们在机械上与OCR-相应的BCS是一样的。这样的手动编码站作为第一个是从美国-邮政和皇家邮政在70年代时引进的。这种装置的主要缺点在于必须将邮件从OCR-邮件流中分开和对于操作员来说在识别经过他面前的邮件时人类工程学方面的困难。处理被OCR-驳回的邮件的另一个进展是开发了在线-视频编码系统(OVS)。在一个OVS中为了编码将邮件的一个视频图象展现给一个操作员,以代替在手动编码站上的物理的邮件。视频图象被显示给操作员,而此时物理的邮件被保持在延迟的路段上。在这个延迟的路段上一般来说邮件以运动方式保持一个时间间隔,它足够使OVS-操作员将必要的分类信息输入到相关的图象上。一般延迟路段允许一个延迟为10至30秒之间。延迟路段愈长,成本以及对于维护的要求和设备的物理尺寸也就愈高,愈大。使用OVS的主要问题在于,所提供的时间只够一个仔细的输入邮政编码(ZIP)或邮局编码(PC),否则,就要使用一个长得不实际的延迟路段。一旦存在一个ZIP或PC,OVS就可以有效地用于用中文符号注明地址的邮件上。当然这类邮件的份额在很多东方国家很少并且在可预见的未来还将保持。因而开发了专用的编码系统,以便使在线-延迟时间尽可能保持得很小。为了提高编码效率和/或可能输入所有的地址元素,也就是说,ZIP/PC,街道/信箱号,收件人/信箱号,收件人/公司,开发了各种现有技术的方法。主要的有以下一些预览-编码在预览-编码时同时显示两个邮件图象;一个在另外一个的上面。此时下面的图象是主动的,也就是说,它的数据是被编码的。经过一个适当的训练对于操作员来说是可能的,将信息在下面的图象上编码,当他们从上面的图象中用视觉已经得到地址信息时。上面的图象随后变为主动和过程被继续。用预览-编码使之成为可能,在前后连续的图象进行编码时辨认的和运动的功能的一个完整的重叠使操作员-生产率提高一倍。提炼编码在实际可达到的在线-延迟-时间之内只有ZIP/PC地址元素可以被操作员可靠地输入,在提炼编码时被输入与街道有关的地址组成部分的确定的关键组成部分。此外提炼编码是建立在专门开发的规则基础上的,在其中固定长度的编码被用作为进入一个地址目录的进入关键字。例如皇家邮政使用一个提炼公式,它是建立在开始的三个和最后的两个字母的基础上的。此时专门的规则必须被操作员学会,以避免多余的地址信息并且考虑一定的不同的特征例如方向,例如东,西或分类例如街,巷,路。提炼编码除了它的一定的有效性以外还具有一些较大的缺点;特别是复杂的提炼规则,它常常要求考虑到一条街道名字的末尾,而这些组成部分在手写的邮件上一般是写的最不清楚的。此外人们发现不清楚的提炼有一个很高的比率,其中在一个目录中的多个登录对应于提炼编码,这样就不可能进行明确的分类分离。此外还要考虑,操作员的输入生产率降低了,一旦代替一个简单的重复的键盘输入必须由操作员作出决策时。补充编码补充编码与提炼编码相反对于每个被编码的地址进行一个可以变化的输入。重要的是在地址输入时与地址目录进行一次校准,直到一个明确的一致性被达到时。通过显示地址的剩余部分,一旦一个明确的部分一致性被识别时,一个加速效应被达到。然而这种技术的问题出现在,必须给操作员一个输入停止-信号并且被识别的地址剩余部分的一个显示是必要的。这将导致输入生产率的一个降低和使一个预览编码成为不可能。理论上所有被叙述的视频编码技术也都可以被应用在具有中文文字符号的邮件上,虽然缺少中文文字符号的快速输入技术使它的可应用性停留在介于两者之间。操作员-辅助的OCR-技术为了提高在线-处理地址信息美国邮政试验了操作员-辅助的OCR-技术。其中为了提高效率地址图象部分被突出出来,在这里OCR-识别失去作用。因为操作员在译解错误的字母时很慢并且部分甚至也许是整个的识别错误,例如出现分段问题,在这种方法中操作员生产率往往低于将相应的地址简单的重新输入。脱机-编码因为在上述的编码技术中没有能够达到一个纯粹的在线-编码时的高生产率,不久前引入了一个脱机-编码系统,如在US PS 49 92 649中叙述的。在这个系统中在不能被识别地址的邮件上安排了一个附加的信息,一个跟踪识别(TID)。不能被识别地址的邮件被外存储,而这些邮件的图象为了编码被展现在操作员面前,此时没有秒范围的时间限制。随后邮件被传送到TID-阅读机。TID被与输入的地址信息相联接。在此基础上也可本文档来自技高网...

【技术保护点】
借助于视频编码站(40)对邮件分配信息的识别方法,在视频编码站上被接受的、数字化的和被存储的包括有邮件封面分配信息的图象被连续传送,其中所得到的分配信息用字典进行校对, 其特征为, -在视频编码站(40)的图象屏幕上被显示的各自的分配信息是完全地或部分地借助于被连接上的具有一个麦克风(60)和语言识别模块(70)的一个语言输入单元被输入的,并且从在语言输入单元中产生的按照可信度评价过的分配信息建议中在字典校对以后具有最高可信度的一个建议或多个建议作为确认/选定被显示在视频编码站(40)的图象屏幕上。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:R苏亨维尔斯鲍尔萨赫斯W罗森鲍姆U米勒茨基
申请(专利权)人:西门子公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1