【技术实现步骤摘要】
新型汉语普通话信息ASCII体系码
本专利技术是一种汉语普通话语言信息编码技术方案,属于中文信息处理
技术介绍
本专利技术的
技术介绍
是中华人民共和国国家标准GB2312-1980《信息交换用汉字编码字符集·基本集》、《新型汉语信息ASCII码》和《汉语普通话信息ASCII体系码》。
技术实现思路
国家标准GB2312-1980《信息交换用汉字编码字符集·基本集》是计算机系统内部处理和存储汉字时使用的代码,在GB2312中规定,编码采用双七位编码方式(即两个字节表示一个汉字),为了与英文字母相区别,汉字机内代码中两个字节的最高位规定为“1”,英文字母的机代码是7位的ASCII码,这种编码在使用范围上有一些限制,例如在一些大中型计算机系统以及在网络通信环境中,要用字节的最高位作奇偶校验的情况下,就不能用这种汉字内部标识方法,而必须考虑设计其他形式的标识信息。国家标准GB2312-1980《信息交换用汉字编码字符集·基本集》只规定了汉字的编码,为了中文信息处理技术发展的需要,必须要对语素、词、语素的义位、词的义位等汉语语言信息进行编码来拓展中文信息处理技术的广度和 ...
【技术保护点】
本专利技术是一种汉语普通话语言信息和语义信息编码技术方案,属于中文信息处理领域,其特征是:用ASCII码对汉语普通话常用语素和次常用语素、汉语普通话常用词和非常用词、汉语普通话固定词组和自由词组、汉语普通话常用语素和次常用语素的义位、汉语普通话常用词和非常用词的义位,汉语普通话自由词组的义丛、汉语普通话句子的表述等汉语普通话语言和语义信息进行编码,并将这些编码联系为一个体系,从而拓展了中文信息处理技术的广度和深度,为今后中文信息处理和汉语自然语言理解软件的开发提供了一个更好的平台,达到了一个全新的境界。
【技术特征摘要】
1.本发明是一种汉语普通话语言信息和语义信息编码技术方案,属于中文信息处理领域,其特征是:用ASCII码对汉语普通话常用语素和次常用语素、汉语普通话常用词和非常用词、汉语普通话固定词组和自由词组、汉语普通话常用语素和次常用语素的义位、汉语普通话常用词和非...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。