当前位置: 首页 > 专利查询>刘陶专利>正文

中文信息数字化处理方法和汉字随机编码方法技术

技术编号：4090869 阅读：440 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种中文信息数字化处理方法，该方法将一、二级国标汉字按规范化信息进行拆分，然后把拆分的信息进行特征码信息列表，特征码信息列表中的每个汉字特征码包括汉字国标码（ＧＢ码）和控制码二部分，国标码是汉字代码，控制码则标记列表信息（部件、声韵母和笔划）在该汉字拆分中的序码。经过了数字化处理的汉字信息，终使汉字编码变成为人机之间的一种简单“约定”，人们只需按预先设定的编码规则输入字和词，不论是单一类信息还是混合类信息，也不论什么码长的编码操作，电脑都将可以通过采样相关的编码信息和判别编码条件来生成每一类编码操作，实现这一系列组合编码无需编制一条码表，也无需作任何切换，字、词的各类编码组合都将可以通过程序设计自动生成，这就是随机编码操作技术。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种计算机中文信息处理领域，特别涉及一种中文信息数字化处理方法以及采用这种数字化处理方法的一种汉字随机编码方法。
技术介绍
在现有的中文信息处理领域中，以字形编码为例，码表结构设计者为了在标准键盘上实现字、词输入，一般都将200多个部件信息来分解一、二级国标汉字(GB2312)，然后把这200多个部件信息直接地定位在26个字符键上，于是就把拆分汉字得到的部件码变成可操作的键盘码(字码表)。并另行编制一套词码表(或用编码生成器协助生成字、词码表)，一并放入WINDOWS中文操作系统进行字、词编码操作。码表结构虽然解决了字、词的输入，由于分解后的汉字信息没有经过数字化处理，电脑程序无法操作，不仅每一个编码方案都必须编制一套字、词码表，而且只能实现单一类的编码操作(单一信息、单一序码、单一码长)，浪费了大量人力和财力，也给编码设计者和操作者带来许多不便。
技术实现思路
针对上述现有技术的不足，本专利技术要解决的技术问题是提供一种可使中文信息进行程序化控制和处理的中文信息数字化处理方法，以便实现字和词的随机编码输入操作。为解决上述技术问题，本专利技术采用如下技术方案一种中文信息数字化处理方法，将一、二级国标汉字按规范化信息标准进行拆分，拆分后的汉字信息进行特征码信息列表，列表中的每个汉字特征码包括汉字国标码(GB 码)和控制码二部分，国标码是汉字代码，控制码则标记列表信息在该汉字拆分中的序码。集合部件、声韵母、笔划的全部特征码原始信息列表(YG表)作为汉字随机编码设计的信息源。优选的，一、二级国标汉字的分解规范可以为“汉字部件规...

【技术保护点】
一种中文信息数字化处理方法，其特征在于：将一、二级国标汉字按相应的分解规范进行拆分，拆分后的汉字信息进行特征码信息列表，特征码信息列表中的每个汉字特征码包括汉字国标码（ＧＢ码）和控制码二部分，国标码是汉字代码，控制码则标记列表信息在该汉字拆分中的序码。

【技术特征摘要】
一种中文信息数字化处理方法，其特征在于将一、二级国标汉字按相应的分解规范进行拆分，拆分后的汉字信息进行特征码信息列表，特征码信息列表中的每个汉字特征码包括汉字国标码(GB码)和控制码二部分，国标码是汉字代码，控制码则标记列表信息在该汉字拆分中的序码。2.根据权利要求1所述的中文信息数字化处理方法，其特征在于一、二级国标汉字的分解规范可以为“汉字部件规范”、“汉字笔画规范”或“汉字拼音方案”三种。3.一种汉字随机编码方法，其特征在于，包括如下步骤a)首先将一、二级国标汉字按“汉字部件规范”、“汉字笔画规范”或“汉字拼音方案”进行拆分，拆分后的部件、声韵母、笔划信息进行包括汉字国标码和控制码二部分的特征码信息列表；b)建立汉字特征码原始信息列表；c)对原始信息进行键位设计；d)将特征码原始信息列表转化为特征码键位信息列表；e)设立字、词编码缓冲区；f)储存键入信息于字、词缓冲区；g)字(或词)结束键后，根据字(或词)编码特性从字(或词)库中采集编码信息入字(或词)编码缓冲区；h)根据字(或词)的编码特性(特征数据)判别该字(或词)是否符合编码条件，检出编码字(或词)，编码处理结束。4.根据权利要求3所述的汉字随机编码方法，其特征在于在一、二级国标汉字按“汉字拼音方案”拆分的汉语拼音信息中的声母(21个)列表，其控制码数据均为01，其韵母(35个)列表中控制码数据均为02。5.根据权利...

【专利技术属性】
技术研发人员：陈玉龙，
申请(专利权)人：刘陶，
类型：发明
国别省市：90[中国|成都]

全部详细技术资料下载我是这个专利的主人