当前位置: 首页 > 专利查询>苏荣斌专利>正文

中外文信息数字化运算编码处理系统技术方案

技术编号:2883435 阅读:222 留言:0更新日期:2012-04-11 18:40
中外文信息数字化运算编码处理系统,属于中外文信息数字化编码处理技术,它彻底解决了中外文信息编码处理的简易性和高效率的矛盾,其主要特征是:使用0-9十个数字,运算编码中外文字数字标点符号,将这些数字编码作为中外文文献检索索引数码及计算机中外文输入码,建立了一整套中外文信息数字化运算编码及输入计算机、中外文编码排序检索、中外文计算机语言和操作系统及芯片指令设计方法系统,广泛用于计算机系统、通讯系统及中外文编码排序检索系统。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】中外文信息数字化运算编码处理系统属于中外文信息数字化编码处理技术。一、中外文信息数字化编码处理技术的现状中外文信息数字化编码处理技术是全世界范围内的历史性重大课题,世界各国都在进行这项课题的研究,并提出了上千种方案,这些已有方案各有优点,也存在着不能统一标准,易学难用、易用难学及违反汉字构形原理的缺点。二、中外文信息数字化运算编码处理系统专利技术的目的是统一使用0-9十个数字对中外文信息进行数字化运算编码处理,彻底解决中外文信息编码处理的简易性和高效率的矛盾。三、中外文信息数字化运算编码处理系统方案包括下列各项(一)中外文信息数字化运算编码方法中外文信息数字化运算编码方法把中外文信息汉字、外语文字数字、标点、符号的分类进行编码。(1)中文文字的编码方法1、汉字的编码方法汉字的编码方法分按汉字的字形、读音分汉字的字形、数字化运算编码汉字的方法、汉字读音数字化运算编码汉字的方法、汉字音形数字化运算编码汉字的方法。(1)汉字字形数字化运算编码汉字的方法汉字字形数字化运算编码汉字的方法为①把汉字的笔划归娄为横、竖、撇、点、折五种基本笔划,相应定义其代码为1、2、3、4、5,以此形成一划编码。(如图1所示)②横、竖、撇、点、折两两组合有十五个结果横横组合、横竖组合、横撇组合、横点组合、横折组合;竖竖组合、竖撇组合、竖点组合、竖折组合;撇撇组合、撇点组合、撇折组合;点点组合、点折组合;折折组合;每个组合各自的笔划代码数字相加,满十减十运算后其相应的编码分别为2、3、4、5、6;4、5、6、7; 6、7、8;8、9;0;以此形成二划组合编码。(如图2所示)③横、竖、撇、点、折任意三划组合寸、弋、 ,各自的组合笔划代码数字相加,满十减十运算后其编码为0;犭、门、己、弓、子、纟、马,各自的组合笔划代码数字相加,满十减十运算后其编码为1;夕、夂、宀、小,各自的组合笔划代码数相加,满十减十运算后其编码为2;饣、 、廴,各自的组合笔划代码数字相加,满十减十运算后其编码为3;工、土、 、幺,各自的组合笔划代码数字相加,满十减十运算后其编码4;艹、巛,各自的组合笔划代码数字相加,满十减十运算后其编码为5;廾的组合笔划代码字数相加,其编码为6;扌、丬、彐,各自的组合笔划代码数字相加,其编码为7;大、口、彳、广,各自的组合笔划代码数字相加,其编码为8;尢、小、巾、山、彡、忄、氵、尸、女,各自的组合笔划代码数字相加,其编码为9;以此形成三划组合编码。④横、竖、撇、点、折多于三划的组合木、月、钅、火、水、日,各自的组合笔划代码数字相加,满十减十运算后其相应的编码分别为0、0、2、4、7、9;以此形成多于三划组合编码。⑤依据上述定义的0、1、2、3、4、5、6、7、8、9十个编码,汉字的编码方法为根据汉字的部首划分,把汉字划分为部首和除部首以外组成汉字的剩余部件(简称余件,以下相同),同0-9十个数字分别编码汉字的部首和余件,依照汉字的书写笔顺,按优先取多于三划组合编码,后取三划组合编码,再取二划组合编码,最后取一划编码的取码顺序,部首取码不超两码,余件取码不超三码,把部首和余件的编码组合成该汉字的编码,每个汉字最多取四码,最少取一码。依据上述方法,具体的汉字字形数字化运算编码汉字的方法分别为①单字的编码方法单字的编码方法依照汉字的独体字与合体字的分类进行编码。A独体字的编码方法独体字的编码方法按超过和不超过四码的汉字进行编码。a、超过四码独体汉字的编码方法为取独体字的前三码和尾码,依次组成该字的编码。例如“粤”字,其中“丿”编码为3,“冂”编码为7,“ ”编码为7,“木”编码为0,“一”编码为1,“ ”编码为6,取其前三码和尾码,则“粤”的编码为3776。b、不超四码(包括四码)独体字的编码方法为取完独体字的全部编码,依次组成该字的编码。例“中”字,其中“口”编码为8,“1”编码为2,则“中”的编码为82。B合体字的编码方法合体字的编码方法按超过和不超过四码的合体字分部首和余件进行编码。a、不超四码合体字的编码方法为i)部首取一码,余件取一至三码,依次组成该字的编码。例“外”字,部首为“夕”,编码为2,余件“卜”编码为6,则“外”字编码为26。ii)部首取两码,余件取一至两码,依次组成该字编码。例“码”字,部首“石”编码为48,余件“马”编码为1,则“码”的编码为481。b、超过四码合体字的编码方法为i)部首取一码,余件取前两码和尾码,依次组成该字的编码。例“编”字,部首“纟”编码为1,余件“扁”编码为9475,则“编”字的编码为1945。ii)部首取首码和尾码,余件取首码和尾码,依次组成该字的编码。例“数”字,部首“夂”编码为47,余件“娄”编码为709,则“数”字的编码为7947。②词组的编码方法词组的编码方法依照词组的字数,分二字词、三字词、多于三字以上的多字词进行编码。A二字词的编码方法为每字各取首码和尾码,依次组成该词组的编码。例“信息”,“信”字的编码为5528,“息”字的编码为3288,则“信息”的编码为各字取首码和尾码为5838。B三字词的编码方法为前二字各取首码,后一字取首码和尾码,依次组成该词组的编码。例“数字化”,“数”字编码为7947,“字”编码为21,“化”字编码为58,则“数字化”的编码为7258。C多字词的编码方法为前三字和尾字各取前一码,共四码,依次组成该词组的编码。例“中华人民共和国”,“中”编码为82,“华”的编码为583,“人”的编码为7,“国”的编码为8234,则“中华人民共和国”的编码为8578。(2)汉字读音数字化运算编码汉字的方法汉字读音数字化运算编码汉字的方法分汉字汉语读音数字化运算编码汉字的方法,汉字日语读音数字化运算编码汉字的方法、汉字韩语读音数字化运算编码汉字的方法。1)汉字汉语读音数字化运算编码汉字的方法汉字汉语读音数字化运算编码汉字的方法为使用0-9十个数字,编码构成汉字汉语读音的字母、声母、韵母、声调,由声母、韵母、声调的编码组成该汉字的编码。①汉语拼音字母的分区排列。A、汉语拼音字母的分区排列a、按拼音字母顺序分区排列拼音字母顺序分区排列为使用0-9十个数字中任意八个数字,编码划分八个区,每个数字编码划分一个区,每个区编码划分三位或四位,把二十六个字母分布在八个区的二十六个位上,其中i、1-8区分布编码的字母为(如图3所示)1区的1-4位分布的字母相应为a、b、c、d2区的1-3位分布的字母相应为e、f、g3区的1-4位分布的字母相应为h、i、j、k4区的1-3位分布的字母相应为l、m、n5区的1-3位分布的字母相应为o、p、q6区的1-3位分布的字母相应为r、s、t7区的1-3位分布的字母相应为u、v、w8区的1-3位分布的字母相应为x、y、zii、2-9区分布编码的字母为(如图4所示)2区的1-3位分布的字母相应为a、b、c3区的1-3位分布的字母相应为d、e、f4区的1-3位分布的字母相应为g、h、i5区的1-3位分布的字母相应为j、k、l6区的1-3位分布的字母相应为m、n、o7区的1-4位分布的字母相应为p、q、r、s8区的1-4位分布的字母相应为t、u、v9区的1-4位分布的字母相应为w、x、y、zb、按声母、韵母的拼音字母顺序分布排列按声母、韵母的本文档来自技高网...

【技术保护点】
一种中外文信息数字化运算编码方法、其特征是: 统一使用0-9十个数字对中文汉字、外语文字、数字、标点、符号进行数字化运算编码处理 (1)中文汉字的编码方法 汉字的编码方法分按汉字的字形、读音分汉字的字形、数字化运算编码汉字的方法、汉字读音数字化运算编码汉字的方法、汉字音形数字化运算编码汉字的方法。 1) 汉字字形数字化运算编码汉字的方法 汉字字形数字化运算编码汉字的方法为: ①把汉字的笔划归娄为横、竖、撇、点、折五种基本笔划,相应定义其代码为1、2、3、4、5,以此形成一划编码。 ②横、竖、撇、点、折两两组合有十五个结果:横横组合、横竖组合、横撇组合、横点组合、横折组合;竖竖组合、竖撇组合、竖点组合、竖折组合;撇撇组合、撇点组合、撇折组合;点点组合、点折组合;折折组合;每个组合各自的笔划代码数字相加,满十减十运算后其相应的编码分别为:2、3、4、5、6;4、5、6、7;6、7、8;8、9;0;以此形成二划组合编码。 ③横、竖、撇、点、折任意三划组合:寸、弋、*,各自的组合笔划代码数字相加,满十减十运算后其编码为0;犭、门、己、弓、子、纟、马,各自的组合笔划代码数字相加,满十减十运算后其编码为1;夕、夂、宀、小,各自的组合笔划代码数相加,满十减十运算后其编码为2;饣、*、廴,各自的组合笔划代码数字相加,满十减十运算后其编码为3;工、土、*、幺,各自的组合笔划代码数字相加,满十减十运算后其编码4;艹、巛,各自的组合笔划代码数字相加,满十减十运算后其编码为5;廾的组合笔划代码字数相加,其编码为6;扌、丬、彐,各自的组合笔划代码数字相加,其编码为7;大、口、彳、广,各自的组合笔划代码数字相加,其编码为8;尢、小、巾、山、彡、忄、氵、尸、女,各自的组合笔划代码数字相加,其编码为9;以此形成三划组合编码。 ④横、竖、撇、点、折多于三划的组合:木、月、钅、火、水、日,各自的组合笔划代码数字相加,满十减十运算后其相应的编码分别为0、0、2、4、7、9;以此形成多于三划组合编码。 ⑤依据上述定义的0、1、2、3、4、5、6、7、8、9十个编码,汉字的编码方法为:根据汉字的部首划分,把汉字划分为部首和除部首以外组成汉字的剩余部件(简称余件,以下相同),同0-9十个数字分别编码汉字的部首和余件,依照汉字的书写笔顺,按优先取多于三划组合编码,后取三划组合编码,再取二划组合编码,最后取一划编码的取码顺序,部首取码不超...

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:苏荣斌梁河
申请(专利权)人:苏荣斌
类型:发明
国别省市:45[中国|广西]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1