【技术实现步骤摘要】
一种基于分段和结构的藏文字构件识别方法
[0001]本专利技术涉及一种藏文字构件识别方法,尤其涉及一种基于分段和结构的藏文字构件识别方法。
技术介绍
[0002]藏文字组字构件的自动识别,是藏文字、词层面信息化研究的一项基础工作。根据现代藏文文法,揭示并实现组字部件的自动识别对藏文字、词、句法层面的信息化有着重要的作用。现有技术中存在各种基于30个辅音的识别藏文字构件的方法,这些方法要进行复杂而深层次的判断,非常复杂。
技术实现思路
[0003]针对现有技术中的上述不足,本专利技术提供了一种基于分段和结构的藏文字构件识别方法。
[0004]为了达到上述专利技术目的,本专利技术采用的技术方案为:
[0005]S1、构建藏文字结构字典;
[0006]S2、对待识别藏文字进行分段;
[0007]S3、扫描步骤S2分段后的藏文字各结构,转换得到各结构对应类型;
[0008]S4、根据步骤S3中得到的各结构对应类型,在步骤S1构建的藏文字结构字典中查找出各结构对应各构件位置值;< ...
【技术保护点】
【技术特征摘要】
1.一种基于分段和结构的藏文字构件识别方法,其特征在于,包括以下分步骤:S1、构建藏文字结构字典;S2、对待识别藏文字进行分段;S3、扫描步骤S2分段后的藏文字各结构,转换得到各结构对应类型;S4、根据步骤S3中得到的各结构对应类型,在步骤S1构建的藏文字结构字典中查找出各结构对应各构件位置值;S5、根据各结构中对应各构件位置值,识别出待识别藏文字的各个构件。2.如权利要求1所述的一种基于分段和结构的藏文字构件识别方法,其特征在于,所述步骤S1包括以下分步骤:S11、将藏文字分段为前件、后件和元件;S12、基于步骤S11的分段结果得到前件、后件和元件的结构类型及各结构类型对应各构件位置值;S13、设定前件、后件和元件的结构类型为藏文字结构字典的检索关键字,再将各类型对应构件位置的位置变量和位置值为字典值建成字典,完成藏文字结构字典构建。3.如权利要求2所述的一种基于分段和结构的藏文字构件识别方法,其特征在于,所述步骤S11具体包括:将藏文字分段为前件、后件和元件,其中前件包括前加字、上加字、基字和下加字,后件包括后加字和再后加字,元件包括元音。4.如权利要求3所述的一种一种基于分段和结构的藏文字构件识别方法,其特征在于,所述步骤S12包括以下分步骤:S121、采用t6、t5、t4、t3、t2、t1和t0分别表示藏文字的基字、前加字、上加字、下加字、元音、后加字和再后加字,,缺省的构件用
‘
ε
’
代替,p
t6
、p
t5
、p
t4
、p
t3
、p
t2
、p
t1
和p
t0
分别表示藏文字的基字、前加字、上加字、下加字、元音、后加字和再后加字的位置;S122、确定前件的结构类型及各结构类型对应的各构件位置值,其中前件类型包括TTMD、TMD、TTD、TTM、TD、TM、TT和T;TTMD结构类型对应各构件位置值为p
t5
=0,p
t4
=1,p
t6
=2,p
t3
=3;TMD结构类型对应各构件位置值为p
t5
=
‑
1,p
t4
=0,p
t6
=1,p
t3
=2;TTD结构类型对应各构件位置值为p
t5
=0,p
t4
=
‑
1,p
t6
=1,p
t3
=2;TTM结构类型对应各构件位置值为p
t5
=0,p
t4
=1,p
t6
=2,p
t3
=
‑
1;TD结构类型对应各构件位置值为p
t5
=
‑
1,p
t4
=
‑
1,p
t6
=0,p
t3
=1;TM结构类型对应各构件位置值为p
t5
=<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。