当前位置: 首页 > 专利查询>吴森专利>正文

汉语神经网络输入方法技术

技术编号:2890773 阅读:262 留言:0更新日期:2012-04-11 18:40
汉语神经网络输入技术的方法为:1.建立网络库;2.在屏幕上开提示窗口,窗口中设记忆区和提示区;3.对输入的汉字连续记忆,其过程为:将输入内容送记忆区;经断词后切分成词语;将词语作为节点加入网络库;4.用网络联想输入,其过程为:输入一个汉字;将网络库中的词语链放入提示区展开;按选词输出、所选词语入网、将网络库中所选词语的下层词语链放入提示区展开的顺序连续操作,直至不选词或无词可选为止。本发明专利技术可记忆曾经输入过的离散内容,使用中只要根据屏幕提示就可实现字联词、词联句、句联句的连续性输入。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种汉字输入方法,属于计算机中文信息处理
研究汉字编码的人很多,其输入方法已近千种。目前人们已认识到,仅从单字上下功夫是远远不够的,因此近年来很多人又把研究方向转到了词和句子上,人们建立了具有大量词汇的词典库,规定了各种特殊词语的定义方法,在词语输入系列中又大多加入了容错校正的功能,把一字三、四键提高到一字一、二键。输入效率大有改观,输入难度大大下降,输入方法也日趋成熟。尽管如此,现有的方法也还存在一些问题1.现在流行的智能化ABC和语句输入法系列,都是以输码的方式来实现词输入和句输入的。但因为码和字毕竟是不同的,所以尽管再怎么自动识别也只能解决一般性问题,对于特殊的人名、地名、专业名词,大多数时候都校正得不十分正确,甚至是完全错误的。2.现有的输入法大多把注意力集中在词内和句内。这样就产生了一个连续性差的问题,词组或句子太短则效率较低,如太长又难以重复使用。3.现有的输入法,击键效率偏低,最好的也要在1.0键/字以上,只有一些特殊编码的词组才能突破1.0键/字这一大关,但是也只能用于特殊情况。在91101492号“中文智能化输入技术”专利申请中,明显存在击键次数太多和击键效率太低的缺点。在其范例中,14个汉字“全拼”用了46键,击键效率为3.3键/字,“速拼”用了20键,击键效率为1.4键/字。为了处理特殊情况,该技术加进了14个功能键,这样就需要了解各种情况,选用各个功能键来解决各种特殊问题,同时也给用户增加了许多麻烦。随着计算机应用在我国的普及和发展,非计算机专业操作人员大量增加,特别是计算机已迈进了千家万户,对于广大用户来说,需要更简便更快捷的中文输入方法。本专利技术的目的是针对上述存在的问题,提供一种可完全解决容错出错、连续性差、击键效率低等问题的高智能化的中文计算机输入技术,使用中只要根据屏幕提示就可实现字联词、词联句、句联句的连续性输入。本专利技术是一种汉语神经网络输入技术,其方法为1.建立网络库;2.在屏幕上开提示窗口,窗口中设记忆区和提示区;3.对输入的汉字连续记忆,其过程为将输入内容送记忆区并输出;经断词后切分成词语;将词语作为节点加入网络库;4.用网络联想输入,其过程为输入一个汉字;将网络库中的词语链放入提示区展开;按选词输出、所选词语入网、将网络库中所选词语的下层词语链放入提示区展开的顺序连续操作,直至不选词或无词可选为止。本专利技术借助现有的汉字输入方法,将曾经输入过的离散的字或词组进行连续记忆,然后根据断词原则,将连续记忆的内容切分成汉语神经元,并将汉语神经元编织成汉语神经网络。下面结合实施例对本专利技术进行详细描述。附图说明图1是本专利技术方法的流程图;图2是本专利技术的网络形成过程图。汉语神经网络是一种多层结构的神经网络,它的层次分为汉字索引层、词语链路层、网络递归层三个层次。在汉字输入过程中,一个句子通过断词操作被切分成若干汉字串,这样的每一汉字串均称为一个词语,该词语被称为网络中的汉语神经元,即节点。此处所说的词语可以是单字、词组或短语,如″我″、″喜欢″、″幽静的环境″等都可由用户定义成词语。在汉字输入过程中,不断产生新的词语,对于词语层来说,所有首字相同的词语为同层词语,它们之间按它们产生时的顺序用层内指针连接成词语链。在汉字输入过程中,不断使用词语输入,对于本网络来说,使用过程中的每一词语都是后一词语的前节点,它们之间用层间指针连接,前节点的地址则用专门单元予以记录。而在多次使用过程中,同一词语的所有后一词,即与同一词语曾经相连的词语,称为网络层中的同层词语,它们之间按使用的先后顺序用层内指针连成网络链。索引层中相应节点指向词语层中该节点的词语链首地址,词语层中层间指针指向网络层中该节点的网络链首地址,网络层中层间指针指向词语层中的该词语地址。这样各节点便由层内指针和层间指针连接成一个神经网络。本专利技术采用神经网络技术输入汉字,它使用通用键盘和计算机。其方法分为连续学习记忆和联想使用两部分。连续学习记忆部分的步骤为输入汉字→断词→词语入网,联想使用部分的步骤为输入一个汉字后提示网络中该汉字的词语,然后不断地进行选词输出→所选词语入网→提示网络中该词语的下层词语这样的循环操作,直至不选词或无词可选为止。下面详细介绍。一.建立网络库网络库包括索引层、词语层、网络层三部分。其中索引层用于存放词语层中各词语链的首节点在网络库中的地址指针,它是根据现有汉字数量预先留出的定长并列表,每个汉字占两个字节,以256进制计算,最大长度可以表示64K指针。其初始状态为空表,当有某汉字节点产生时,它的地址将被写入该汉字的索引表中。由于在维护时要调整节点在链路中的位置,所以索引表指针是一个可调整的活动指针。在应用时可以根据汉字码计算出它在索引表中的位置,再根据索引表中的指针直接找到该节点在网络库中的位置。采用此技术可以避免库容量和不相关内容对查寻速度的影响,不论网络库有多大,它都能从库中直接取出所需内容。词语层和网络层均包括节点内容、连接属性、层内指针、层间指针四个字段。其中节点内容用于存放词语,其长度为七个汉字14字节;连接属性用于存放词语在使用过程中的常用性和近期性,长度为2字节;层内指针长2字节,其作用是把同层词语串联成链;层间指针长2字节,其作用是建立两个节点层之间的联系。二.在屏幕上开提示窗口,窗口中设记忆区和提示区。在屏幕上开四行长的弹出式可移动提示窗口,窗口第一行的左上角为记忆区,窗口的其余部分为提示区。记忆区长度为7个汉字,提示区用36个提示符,第一行为6个字母U-Z,第二行为10个字母K-T,第三行为10个字母A-J,第四行为10个数字1-0。三.断词处理在汉字输入过程中,若遇断词符、或遇词组、或遇记忆区满时,便将输入内容切断,切断前的汉字串便作为一个新的词语加入网络库中。断词符包括标点符号、控制符、非汉字符号、空格键。词组断词法是指,当从键盘输入一个词组或从库中联想输入一个词组时,该词组便将输入内容切断。而记忆区满的方式就是使用记忆区长度的定长断词法。以下结合附图1说明本专利技术的学习记忆和联想使用方法。四.学习记忆方法步骤如下1.从键盘输入一个汉字或其它字符。若不是汉字则将其输出文本区,然后转键盘输入步骤1;若是汉字则将其送窗口记忆区并输出文本区,继续检查索引指针步骤2。2.检查索引层中该汉字的索引指针是否空。为空则表示词语层中没有以该字起首的词语,提示区显示空链,转断词判断步骤3;若不空则按指针跳到词语层中该词语链首,即词语层中以该汉字起首的词语链的首节点,并将此链放在窗口的提示区中按层内指针展开显示,以供选词用,继续断词判断步骤3。3.断词判断。若不断词亦不选择提示区中的词语则转键盘输入步骤1;若断词则记忆区中的汉字串被定义为词语,继续新词语入网步骤4。4.新词语入网。其过程是首先将新词语接入词语层,然后将新词语接入网络层,最后将本节点置为前节点。(1).新词语接入词语层。检查本层链内是否有该词语,若有则调整其连接属性并进入网络联想,若无则将该词语加入库尾并接入本层链尾,当该词语为本层链首时,将其接入索引层的索引指针。继续步骤(2)。(2).新词语接入网络层。将该词语加入库尾并接入网络链尾,当该词语为本层链首时,将其接入前节点的层间指针,再使网络本文档来自技高网...

【技术保护点】
一种使用通用键盘和通用计算机输入汉字的汉语神经网络输入技术,其方法为:一.建立网络库;二.在屏幕上开提示窗口,窗口中设记忆区和提示区;三.对输入的汉字连续记忆,其过程为:将输入内容送记忆区并输出;经断词后切分成词语; 将词语作为节点加入网络库;四.用网络联想输入,其过程为:输入一个汉字;将网络库中的词语链放入提示区展开;按选词输出、所选词语入网、将网络库中所选词语的下层词语链放入提示区展开的顺序连续操作,直至不选词或无词可选为止。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:吴森
申请(专利权)人:吴森
类型:发明
国别省市:23[中国|黑龙江]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1