【技术实现步骤摘要】
一种蒙古文字母变体形式的自适应方法
本专利技术涉及计算机文字处理
,尤其涉及一种少数民族文字在计算机文字处理技术中字母变体形式的自适应方法,特指一种蒙古文字母在计算机、计算机移动设备、移动通讯设备上显示、输入和识别变体形式的自适应方法。
技术介绍
蒙古文字是经过腓尼基字母--阿拉马字母--粟特字母--畏兀儿字母这样一个漫长的演变过程的。它从上到下连写(一个单词为一个单位),从左到右移行。由8个元音、27个辅音共35个读音组成。蒙古文字母在字词中所处的位置不同分为独立、词首、词中、词尾等四种字形,蒙古文字词中上下黏结不同字母时会有不同的变体形式。从专利技术计算机开始,经历互联网信息时代到现在的大数据时代,国家标准的规则中只对蒙古文35个字母进行了名义字符的编码,未对所有字母的变体形式进行次序和编码,且未考虑计算机操作系统的版本兼容性问题。采用国家标准会产生多对多的二义性和复杂性问题;也会产生蒙古文字母在字词中上下黏结不同字母时产生结构失真的问题。上述的蒙古文字母变体形式次序规定和编码无法保证蒙古文字词的完全读音分解和自然排序。需要开发二次蒙古文字词排序软件,否 ...
【技术保护点】
一种蒙古文字母变体形式的自适应方法,其特征在于:首先依据《蒙古文字母顺序》国家规范标准建立涵盖蒙古文字母变体形式的蒙古文字母数据库;其次根据蒙古文字词结构规律建立蒙古文字母变体形式处理单元列举出字母变体形式的多种组合;再次调用数字化的蒙古文词典库,对经过蒙古文字母变体形式处理单元列举出的各种组合正音正字;最后将判断出正确的字母变体形式与计算机中的蒙古文国家标准码位对应。
【技术特征摘要】
1.一种蒙古文字母变体形式的自适应方法,其特征在于:首先依据《蒙古文字母顺序》国家规范标准建立涵盖蒙古文字母变体形式的蒙古文字母数据库;其次根据蒙古文字词结构规律建立蒙古文字母变体形式处理单元列举出字母变体形式的多种组合;再次调用数字化的蒙古文词典库,对经过蒙古文字母变体形式处理单元列举出的各种组合正音正字;最后将判断出正确的字母变体形式与计算机中的蒙古文国家标准码位对应。2.根据权利要求1所述的一种蒙古文字母变体形式的自适应方法,其特征在于在蒙古文字母变体形式处理单元中按照蒙古文字词结构中建立独立字形、词首字形、词尾字形和词中字形数据单元;建立常用形式、第二形式、第三形式、词中整形、词中分写形和词中连写形数据单元。3.根据权利要求2所述的一种蒙古文字母变体形式的自适应方法,其特征在于采用四次循环嵌套的方式将独立字形、词首字形、词尾字形和词中字形中的字母变体形式与常用形式、第二形式、第三形式、词中整形、词中分写形和词中连写形进行组合,组合出的蒙古文字母变体形式存放在蒙古文字母变体形式处理单元对比数据库中。4.根据权利要求1所述的一种蒙古文字母变...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。