【技术实现步骤摘要】
本专利技术涉及一种汉字笔形编码方案。本专利技术可用于计算机汉字输入和辞书查检汉字。目前提出的各种汉字形码编码方案,或多或少都得考虑汉字的笔形信息。事实上,任何一个汉字毫无例外均可拆分为一组有序的笔画序列,笔画按运笔方向则可归纳为五种基本笔形横、竖(包括竖左钩)、撇、掭、折,可以1、2、3、4、5加以编号;它们构成了汉字形码信息的基本单元。不同汉字间的一个主要区别即在于构成汉字的笔画序列,或笔形序列的区别上。但如果按汉字的笔形序列一笔一画的在计算机上输入,则既费时又烦琐。因此各种形码编码方案均提出了各具特色的解决方法,但实质均是对汉字的笔形序列进行分段拆分,每一段成一组,并作为一个字元。不同编码方案的区别仅在于字元的选取上。但迄今为止提出的各种形码方案,其字元的选取,或者说对汉字笔形序列的分段拆分方法,大多缺乏严格的规则,没有规律可循,因此不仅需要使用者硬性记忆,而且也仅能适用于某一特定汉字字符集,扩充性差。较为有规律的有王永民的五笔字型和陈爱文的表形码。五笔字型的字元编码直接和字元的首两笔笔形联系,抓住了汉字结构的基本信息,是一个相当成功的编码方案;缺点是字 ...
【技术保护点】
一种汉字笔形编码方案,该方案以横、竖(包括竖左钩)、撇、掭、折五种笔型(对应编号“1”、“2”、“3”、“4”、“5”)为基础,对汉字笔形序列,按一定规则进行分段拆分,每一段成一组,并作为一个字元,每一字元以首两笔的笔形编号加以标记,将所有字元分为5×5=25类,编号为“11”、“12”……“54”、“55”,据此对汉字进行编码,其特征在于:a.对汉字笔画序列进行分段拆分、产生字元时以字型结构的间隙,27个取作主要字元的高频部首(钅、木、氵、火、土、日、月、艹、竹、亻、宀 、虫、犭、疒、足、扌、衤、讠、纟、口、女、阝(在左)、山、石、辶、王、忄),“小”、“人”、“了 ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。