一种基于分段和结构的藏文字构件识别方法技术

技术编号:28499565 阅读:31 留言:0更新日期:2021-05-19 22:40
本发明专利技术公开了一种基于分段和结构的藏文字构件识别方法。该方法包括构建藏文字结构字典;对待识别藏文字进行分段;扫描分段后的藏文字各结构,转换得到各结构对应类型;根据各结构对应类型,在藏文字结构字典中查找出各结构中各构件的位置值;根据各结构中对应各构件位置值,识别出待识别藏文字的各个构件。本发明专利技术为了解决现有技术中的藏文字构件识别方法需要基于30个辅音进行复杂而深层次的判断的问题,提出了一种基于藏文字结构的构件识别方法,具有简单高效且易于操作的优点。具有简单高效且易于操作的优点。具有简单高效且易于操作的优点。

【技术实现步骤摘要】
一种基于分段和结构的藏文字构件识别方法


[0001]本专利技术涉及一种藏文字构件识别方法,尤其涉及一种基于分段和结构的藏文字构件识别方法。

技术介绍

[0002]藏文字组字构件的自动识别,是藏文字、词层面信息化研究的一项基础工作。根据现代藏文文法,揭示并实现组字部件的自动识别对藏文字、词、句法层面的信息化有着重要的作用。现有技术中存在各种基于30个辅音的识别藏文字构件的方法,这些方法要进行复杂而深层次的判断,非常复杂。

技术实现思路

[0003]针对现有技术中的上述不足,本专利技术提供了一种基于分段和结构的藏文字构件识别方法。
[0004]为了达到上述专利技术目的,本专利技术采用的技术方案为:
[0005]S1、构建藏文字结构字典;
[0006]S2、对待识别藏文字进行分段;
[0007]S3、扫描步骤S2分段后的藏文字各结构,转换得到各结构对应类型;
[0008]S4、根据步骤S3中得到的各结构对应类型,在步骤S1构建的藏文字结构字典中查找出各结构对应各构件位置值;<br/>[0009]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于分段和结构的藏文字构件识别方法,其特征在于,包括以下分步骤:S1、构建藏文字结构字典;S2、对待识别藏文字进行分段;S3、扫描步骤S2分段后的藏文字各结构,转换得到各结构对应类型;S4、根据步骤S3中得到的各结构对应类型,在步骤S1构建的藏文字结构字典中查找出各结构对应各构件位置值;S5、根据各结构中对应各构件位置值,识别出待识别藏文字的各个构件。2.如权利要求1所述的一种基于分段和结构的藏文字构件识别方法,其特征在于,所述步骤S1包括以下分步骤:S11、将藏文字分段为前件、后件和元件;S12、基于步骤S11的分段结果得到前件、后件和元件的结构类型及各结构类型对应各构件位置值;S13、设定前件、后件和元件的结构类型为藏文字结构字典的检索关键字,再将各类型对应构件位置的位置变量和位置值为字典值建成字典,完成藏文字结构字典构建。3.如权利要求2所述的一种基于分段和结构的藏文字构件识别方法,其特征在于,所述步骤S11具体包括:将藏文字分段为前件、后件和元件,其中前件包括前加字、上加字、基字和下加字,后件包括后加字和再后加字,元件包括元音。4.如权利要求3所述的一种一种基于分段和结构的藏文字构件识别方法,其特征在于,所述步骤S12包括以下分步骤:S121、采用t6、t5、t4、t3、t2、t1和t0分别表示藏文字的基字、前加字、上加字、下加字、元音、后加字和再后加字,,缺省的构件用

ε

代替,p
t6
、p
t5
、p
t4
、p
t3
、p
t2
、p
t1
和p
t0
分别表示藏文字的基字、前加字、上加字、下加字、元音、后加字和再后加字的位置;S122、确定前件的结构类型及各结构类型对应的各构件位置值,其中前件类型包括TTMD、TMD、TTD、TTM、TD、TM、TT和T;TTMD结构类型对应各构件位置值为p
t5
=0,p
t4
=1,p
t6
=2,p
t3
=3;TMD结构类型对应各构件位置值为p
t5


1,p
t4
=0,p
t6
=1,p
t3
=2;TTD结构类型对应各构件位置值为p
t5
=0,p
t4


1,p
t6
=1,p
t3
=2;TTM结构类型对应各构件位置值为p
t5
=0,p
t4
=1,p
t6
=2,p
t3


1;TD结构类型对应各构件位置值为p
t5


1,p
t4


1,p
t6
=0,p
t3
=1;TM结构类型对应各构件位置值为p
t5
=<...

【专利技术属性】
技术研发人员:孙琦龙安见才让
申请(专利权)人:青海民族大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1