Chinese characters mixed encoding method of the invention provides an application of low rate of emergency communication, the mixed encoding method applied to the Chinese characters of low rate of emergency communication includes words, phrases and two character words three encoding, among them, the character encoding for selecting the N Chinese characters establish the double word table, word encoding \tree root + node\, using the phrase alignment encoding encoding, the encoding of the phrase phrase table storage multi word phrases, sentences and words in the table is not the very words of the hybrid encoding, the encoding sequence is Chinese characters phrases, two character words and words, the invention has the advantages of high compression rate, high speed, easy to implement, can meet the demand of low bit rate communication Chinese characters, has a strong engineering application value.
【技术实现步骤摘要】
应用于低速率应急通信的混合汉字编码方法
本专利技术涉及汉字编码
,具体涉及一种应用于低速率应急通信的混合汉字编码方法。
技术介绍
当前,低速率应急通信中的汉字编码方法主要采用GB2312编码,其每个汉字用2Byte(16bit)进行编码,占用资源较多,编码效率和通信效率低,迫切需要高压缩率的汉字编码技术。目前通用的压缩软件,如WinRar等,在汉字文本压缩方面效率欠佳,并不适用于通信设备中。而国内外相关技术研究甚少,少数的文献研究都还比较浅。文献[1]游荣彦,李吉桂.通用简易中文文本压缩方法研究[J].华南师范大学学报(自然科学版),2001(2):84-88.提出了一种以13bit为单位的编码方法,通过提供8192个编码空间以容纳6763个汉字,是一种简单的针对单字的紧凑算法。文献[2]陆挺,刘晓辉.应用于极低速率应急通信的11bit汉字编码方法[J].指挥信息系统与技术,2010,1(3):74-78.基于汉字使用频度,以11bit为编码单位来进行汉字编码。相对于文献[1],压缩率得到了一定提升,但仍着眼于单字。
技术实现思路
本申请通过提供一种应用于低速率应急通信的混合汉字编码方法,以解决低速率应急通信中的汉字编码技术占用资源较多,编码效率和通信效率低的技术问题。为解决上述技术问题,本申请采用以下技术方案予以实现:一种应用于低速率应急通信的混合汉字编码方法,信息传输过程中包括单字、双字词语以及短语三种编码,其中,所述单字编码选取N个汉字建立单字码表,所述双字词语编码采取“词根+节点”的树形结构,所述短语编码采用对位编码,所述短语编码的短语码表存储多 ...
【技术保护点】
一种应用于低速率应急通信的混合汉字编码方法,其特征在于,信息传输过程中包括单字、双字词语以及短语三种编码,其中,所述单字编码选取N个汉字建立单字码表,所述双字词语编码采取“词根+节点”的树形结构,所述短语编码采用对位编码,所述短语编码的短语码表存储多字短语、短句以及单字码表中未被编码的非常用字,该混合汉字编码的顺序为短语、双字词语、单字,具体编码流程为:S1:设置索引值初始化为0;S2:取索引后的一个字;S3:在所述短语码表中按序匹配短语首字,如果匹配,则进入步骤S4,否则,进入步骤S6;S4:报文索引后取该短语长度n个字,和短语进行匹配,如果匹配,则进入步骤S5,否则,继续执行步骤S3;S5:对短语进行编码,索引值加n,n为短语平均长度,跳转至步骤S2;S6:判断是否为短语码表最后一个短语,如果是,则进入步骤S7,否则,继续执行步骤S3;S7:在所述双字词语码表中按序匹配词根,如果匹配,则进入步骤S8,否则,进入步骤S10;S8:匹配词尾,如果匹配,则进入步骤S9,否则,继续执行步骤S7;S9:对双字词语进行编码,索引值加2,跳转至步骤S2;S10:判断是否为双字词语码表最后一个词根 ...
【技术特征摘要】
1.一种应用于低速率应急通信的混合汉字编码方法,其特征在于,信息传输过程中包括单字、双字词语以及短语三种编码,其中,所述单字编码选取N个汉字建立单字码表,所述双字词语编码采取“词根+节点”的树形结构,所述短语编码采用对位编码,所述短语编码的短语码表存储多字短语、短句以及单字码表中未被编码的非常用字,该混合汉字编码的顺序为短语、双字词语、单字,具体编码流程为:S1:设置索引值初始化为0;S2:取索引后的一个字;S3:在所述短语码表中按序匹配短语首字,如果匹配,则进入步骤S4,否则,进入步骤S6;S4:报文索引后取该短语长度n个字,和短语进行匹配,如果匹配,则进入步骤S5,否则,继续执行步骤S3;S5:对短语进行编码,索引值加n,n为短语平均长度,跳转至步骤S2;S6:判断是否为短语码表最后一个短语,如果是,则进入步骤S7,否则,继续执行步骤S3;S7:在所述双字词语码表中按序匹配词根,如果匹配,则进入步骤S8,否则,进入步骤S10;S8:匹配词尾,如果匹配,则进入步骤S9,否则,继续执行步骤S7;S...
【专利技术属性】
技术研发人员:李国军,王渝冲,谭露,徐小飞,
申请(专利权)人:中国人民解放军重庆通信学院,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。