当前位置: 首页 > 专利查询>惠普公司专利>正文

外围设备的语言识别系统和方法技术方案

技术编号:2892505 阅读:250 留言:0更新日期:2012-04-11 18:40
一种数据处理系统,能对多种所输入的语言起反应,各种语言遵守规定的语法。在输进来的数据中有既定的数据部分(“容许”关键字)时表明表决结果容许某种语言的出现,有其它既定的数据部分(“禁止”关键字)时表明表决结果禁止该语言的出现。该系统执行的方法能识别所输入的语言。(*该技术在2013年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及数据处理系统中所接收语言的识别,更具体地说,涉及一种采用语法和上下文分析的语言识别系统。现代的数据处理网络可以使各种类型的计算机与通信网络互连起来。诸如打印机、绘图仪等之类的外围设备也可与通信网络连接起来,作为所连接的各计算机的资源。这些外围设备必须能理解和响应收自各种计算机的指令。只要全部所连接的计算机采用同一外围控制语言,外围设备就只需要识别和响应一种语言。但当这些计算机采用不同的外围控制语言时,外围设备就必须能够识别输进来的语言语种,并响应所识别语言中的指令。某些外围控制语言采用识别语言的初始识别码序列。只要与网络连接的各种计算机符合这种语言的语法编码要求,就能识别语言,但保证不了这些代码序列一定能在所有可能连接到网络上的计算机上起作用。外围设备制造厂家必须预料到这种可能性,即,某一特定初始识别码序列可能出现在另一种语言的数据流中从而使外围设备引起错误的语言转换。最近,有一些复杂的外围设备采用“上下文转换”系统,在该系统中,所收到的代码组经过分析,就能够在装入作业中识别要被使用的语言。QMSESP就是这样的一种上下文转换器,它是美国QMS国际公司(地址OneMagnumPass,Mo-bile,Alabama36618)的产品。虽然这种QMSESP产品的细节尚未公布,但从外部分析可以略知其工作情况。该ESP产品看来用以检索表示特定控制语言的特殊字符串、符号和控制字符(以下总称为关键字)。某些关键字由于表示某特定语言而具有特别重要的地位。此外,一个关键字出现的次数也非常重要。根据从初始代码序列积累的统计资料,ESP确定输进来的语言。据发现,ESP在某些情况下并不能进行识别语言。估计语言选择上的这种差错是由于某些关键字在一种以上的语言中出现,而且由于对输进来的数据流没有进行上下文分析所致,经过一段时间之后必然会显示出错误的语言。因此,本专利技术的目的是提供外围设备的一种经改进的语言识别系统。本专利技术的另一个目的是提供一种对输进来的数据流既进行上下文分析又进行语法分析的语言识别系统。本专利技术还有另一个目的,即提供一种可加以扩充以支持其他语言的语言识别系统。数据处理系统通常对多种输入的语言起反应,各种语言遵循既定的语法。输进来的数据有某一些说明部分(“容许”关键字)时表明经表决容许某一种语言出现,有其他说明部分(“禁此”关键字)时表明经表决禁止该语言出现。识别所输入的语言时,系统履行下列程序就各预期的语言分析输进来的数据组的语法,从而识别数据组中的“容许”和“禁止”关键字;根据分析提供各预期语言的“容许”和“禁止”计数,各计数为关键字条的总和,各关键字条由一个经识别的关键字计数乘上一个加权系数组成,加权系数值表示关键字在语法和该数据组上下文中的重要性,“容许”计数是“容许”关键字条的总和,“禁止”计数是“禁止”关键字条的总和;将“容许”计数与“禁止”计数加以比较,以确定它们是否接近得有必要发出“测不准”的信号;然后根据数据组的另一个语法特性,分析该“测不准”情况,并根据其中一个计数显示某一个数值,或者两个计数极其明确时显示从较大的计数得出的数值;最后根据各预期语言的显示值识别所收到的语言。附图说明图1是体现本专利技术的语言识别程序的系统方框图。图2是图1所示的语言识别程序中表决模块中的子程序表。图3是打印机控制语言PCL的语法定义。图4是打印机控制语言PS的语法定义。图5a举例说明了PS语言中各关键字的加权表。图5b举例说明了PCL语言中各关键字的加权表。图6是PS语言的上下文表。图7是PCL语言的上下文表。图8-11举例说明了图1的系统执行语言识别程序的高级流程图。参看图1。个人计数机10、12和14通过局部地区网络(LAN)16互连起来。打印机18也接到LAN16上,给各个人计算机10、12和14提供打印服务。下面将围绕打印机18说明本专利技术的内容,但不言而喻,其它给各有关计算机提供服务的数据处理系统也可应用本专利技术。其它这类外围设备的例子有绘图仪、传真设备等。与LAN连接的各计算机可以采用不同的打印机控制语言。为说明本专利技术,假设PC10采用叫做PCL(打印机控制语言)的打印机语言,PC12采用PS打印机语言,PC14采用其它打印机控制语言。本专利技术使打印机18能自动分析从PC10、12和/或14中任何一个个人计算机输进来的指令/数据流的上下文,识别所收到的语言,并能由此接下去执行打印的各项指令。打印机18包括中央处理单元20、输入/输出(I/0)模块22和随机存取存储模块24,均经总线25与打印发动机28互连。30示出了RAM24的一部分的分解图,该部分包括RAM24供语言识别程序用的部分,其中含有存储收自PC10、12和14任一个人计算机的数据组的存储区32。存储区32最好大得足以存储256字节的数据组。我们知道如此规模的数据组是足以识别输进来的语言而无需不适当地延长所需要的处理时间的。语言识别程序涉及多个表决器模块34、36和38,这些模块各个是专门用来分析预期的打印机语言的。例如,表决器模块34用来分析PCL语言,表决器36用来分析PS语言等。判定器模块40接收来自各表决器模块34、36和38的输出,然后根据这些表决器模块的输入判定所接收的语言可能性最大的语种。判定器40指示CPU20,令其访问语法译码软件,使其能译出并执行该判定出的语言。由于判定和表决功能在不同的模块中执行,当增加其它语言时,只要给各新的语言增设表决器模块就不难适应这些新的语言。参看图2,图中示出了具代表性的表决器模块及其主要组成部分。子程序42是个语法分析器,配备有表决器指定语言结构的各种定义且存有各种定则和叙述语句。应用这些定义,语法分析器42就能够对输进来的数据组进行语法分析,并识别与数据组语言识别的确定特别有关的各部分。这些有关部分以下称之为关键字。关键字有正的关键字和负的关键字。正关键字(如有的话)表示“容许”使用该语言,负关键字(如有的话)表示“禁止”使用该语言。各表决器有许多关键字计数器,一个关键字计数器用一个关键字类型。各表决器模块还有一个加权表48,加权表48在各关键字的计数寄存下来时就赋予该关键字一个加权值。插入加权表48的加权值不是正的就是负的,这取决于所识别的关键字是表示该语言的出现还是表示该语言在语法上所下能容许的未知字符或其它字符组而定。各指定的加权值加起来之后存入表决值寄存器46中,该寄存器保存其值等于在输进来的数据流中检测出的正负加权关键字的总和的现行和。上下文表50用以给各检测出的关键字指定取决于该关键字及其在所收到的数据组中的上下文的不同值(“扭曲”)。上下文表50列有各关键字类型的初始扭曲值,该扭曲值通常由一个扭曲修正器(视情况而定)进行乘法运算或除法运算,从而得出与数据组中关键字的上下文有关的扭曲值。接着,(正负)扭曲值都输进一对表决计数寄存器52中,分别由这两个寄存器累积各正负扭曲值。于是,“容许”计数寄存器累积全部从上述计算得出的正扭曲值“禁止”计数寄存器累积负扭曲值。现在翻看图3和图4,图中,以逻辑图的形式示出了PCL和PS的语法。各逻辑图作为扫描特定语言的表决器模块中各语法分析器子程序42内的逻辑语句体现出来。因此,表决器模块34(图1)的逻辑语句体现图3所示本文档来自技高网...

【技术保护点】
一种在数据处理系统中识别输入的语言的方法,所述系统中,能对多种所输入的语言起反应,各种语言遵守规定的语法,在输进来的数据中有既定的数据部分(“容许”关键字)时表明表决结果容许某种语言的出现,有其它既定的数据部分(“禁止”关键字)时表明表决结果禁止该语言的出现,该系统识别所输入的语言的方法包括下列步骤:a)就每个预期的语言分析输进来的数据组的语法,以识别所述数据组中的“容许”和“禁止”关键字;b)根据所述分析给每个预期的语言提供“容许”计数和“禁止”计数,各所述计数为各关键字条的总和,各关键字条由一个经识别的关键字计数乘以一个扭曲组成,所述扭曲的值表示所述关键字在所述语法中和所述数据组上下文的重要性,所述“容许”计数是“容许”关键字字条的总和,所述“禁止”计数是“禁止”关键示字条的总和;c)将所述“容许”和“禁止”计数加以比较,以确定它们是否如此接近得达到有必要发出“测不准”的信号,然后根据所述数据组的另一个语法特性分析该“测不准”的情况,并根据其中一个所述计数显示一个值,所述显示与所述另一个语法特性是否表示“容许”或“禁止”该语言有关;d)两个计数之间没有“测不准”的情况时显示出从较大的计数得出的一个值;然后e)根据各所述预期语言的所述显示值判定所收到语言的语种。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:SE沃尔顿
申请(专利权)人:惠普公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1