一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法技术

技术编号:9864762 阅读:129 留言:1更新日期:2014-04-02 21:45
本发明专利技术涉及一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,属于自然语言处理技术领域。本发明专利技术包括如下步骤:A、制作纳西象形文字体;B、根据步骤A的结果,构建纳西象形文字体库;C、根据步骤B的结果,构建纳西语、汉语、英语电子词典库;D、根据步骤C的结果,从纳西语、汉语、英语电子词典库抽取数据,并制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表;E、根据步骤D的结果,制作纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法。本发明专利技术实现了纳西象形文输入法的实用性、可扩展性、灵活性,降低纳西象形文输入法开发的难度和复杂度、缩短开发周期。

【技术实现步骤摘要】

本专利技术涉及,属于自然语言处理

技术介绍
云南丽江是联合国科教文组织确认的“世界文化遗产”之一,它具有悠久的历史文化,蕴含了浓厚的纳西民族文化。纳西象形文是一种“专象形,人则图人,物则图物,以为书契”的古老文字,被誉为“目前世界上唯一存活着的象形文字”,纳西象形文不仅是中华文明的瑰宝,也是世界文化发展史上的宝贵财产,受到了世界各地研究学者的广泛的关注。但是如今的纳西象形文在各种外来文化和现代文明的渗透和影响下,正在迅速地变异和消亡。许多学者担忧,为数不多的精通者百年之后,纳西象形文字将成为历史。针对纳西象形文字进行计算机信息化处理,以达到历史文化的保护,促进文化的发展、传播,仍然是目前纳西象形文的研究发展方向。目前,输入法的实现主要有两种方式,一、通过调用系统接口,自己编程实现;二、通过输入法编辑器实现。第一种方法主要实现特定功能的输入法,缺点在于实现难度较大、可扩展性、灵活性差。本专利技术在采用第二种方法的基础上,通过对TrueType字体技术、纳西语料库建设和Windows环境下ME技术的深入研究,针对纳西象形文输入法尚未公开这一现状,并结合纳西象形文字的独有特点,设计并实现了在Windows环境下纳西象形文三语即纳西-英语、纳西-汉语、纳西语拼音输入法。
技术实现思路
本专利技术提供了,以用于解决现有针对纳西象形文的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现问题。本专利技术的技术方案是:,所述方法的步骤如下: A、制作纳西象形文字体; B、根据步骤A的结果,构建纳西象形文字体库; C、根据步骤B的结果,构建纳西语、汉语、英语电子词典库; D、根据步骤C的结果,从纳西语、汉语、英语电子词典库抽取数据,并制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表; E、根据步骤D的结果,制作纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法。所述步骤A中,制作纳西象形文字体的具体步骤为: Al、搜集国内外学者研究纳西族象形文字著述以及体裁丰富的含有纳西象形文字的参考资料; A2、将收集的参考资料进行扫描,并以图片的格式储存; A3、将储存的图片使用Photoshop依次进行去色处理、裁剪处理、提取边缘处理、使用图像处理边缘检测算法去噪处理,得到加工后的文字图片; A4、将得到的加工后的文字图片,采用Font Creater导入并制成字模且对单个字模进行微调,得到Unicode编码格式的纳西象形文字体。所述步骤B中,构建纳西象形文字体库为:根据得到的Unicode编码格式的纳西象形文字体采用True type造字映射制作纳西象形文字体库。所述步骤C中,构建纳西语、汉语、英语电子词典库采用的是数据库存储管理技术。所述步骤D中,制作码表的具体步骤为: D1、从纳西语、汉语、英语电子词典库中分别提取出纳西象形文字、词和与之对应的拼音对照表,纳西象形文字、词和与之对应的汉语对照表、纳西象形文字、词和与之对应的英语对照表; D2、将对照表分别按照“象形文文字串+ Tab字符+编码”的格式制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表。所述步骤E中,制作了纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的具体步骤为: E1、运行输入法编辑器,且加载纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表; E2、设置基本参数; E3、设置 IME ; E4、设置输入法的安装参数; E5、加载纳西象形文字体库,进行字体打包安装; E6、程序打包,得到纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法;其中,在打包前需加载预先准备好纳西联想库,并选择包含联想库。所述步骤E2中,基本参数包括输入法发布者名称、输入法软件版本号、输入法帮助链接。所述步骤E3中,IME包括候选词列表的排序设置、候选列表的显示、习惯设定。所述步骤E4中,输入法的安装参数包括输入法注册码密钥、输入法的默认皮肤。本专利技术的有益效果是:实现了纳西象形文输入法的实用性、可扩展性、灵活性,降低纳西象形文输入法开发的难度和复杂度、缩短开发周期。【附图说明】图1为本专利技术的流程图。【具体实施方式】实施例1:如图1所示,,所述方法的步骤如下: A、制作纳西象形文字体; B、根据步骤A的结果,构建纳西象形文字体库; C、根据步骤B的结果,构建纳西语、汉语、英语电子词典库; D、根据步骤C的结果,从纳西语、汉语、英语电子词典库抽取数据,并制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表; E、根据步骤D的结果,制作纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法。所述步骤A中,制作纳西象形文字体的具体步骤为: Al、搜集国内外学者研究纳西族象形文字著述以及体裁丰富的含有纳西象形文字的参考资料; A2、将收集的参考资料进行扫描,并以图片的格式储存; A3、将储存的图片使用Photoshop依次进行去色处理、裁剪处理、提取边缘处理、使用图像处理边缘检测算法去噪处理,得到加工后的文字图片; A4、将得到的加工后的文字图片,采用Font Creater导入并制成字模且对单个字模进行微调,得到Unicode编码格式的纳西象形文字体。所述步骤B中,构建纳西象形文字体库为:根据得到的Unicode编码格式的纳西象形文字体采用True type造字映射制作纳西象形文字体库。所述步骤C中,构建纳西语、汉语、英语电子词典库采用的是数据库存储管理技术。所述步骤D中,制作码表的具体步骤为: D1、从纳西语、汉语、英语电子词典库中分别提取出纳西象形文字、词和与之对应的拼音对照表,纳西象形文字、词和与之对应的汉语对照表、纳西象形文字、词和与之对应的英语对照表; D2、将对照表分别按照“象形文文字串+ Tab字符+编码”的格式制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表。所述步骤E中,制作了纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的具体步骤为: E1、运行输入法编辑器,且加载纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表; E2、设置基本参数; E3、设置 IME ; E4、设置输入法的安装参数; E5、加载纳西象形文字体库,进行字体打包安装; E6、程序打包,得到纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法;其中,在打包前需加载预先准备好纳西联想库,并选择包含联想库。所述步骤E2中,基本参数包括输入法发布者名称、输入法软件版本号、输入法帮助链接。所述步骤E3中,IME包括候选词列表的排序设置、候选列表的显示、习惯设定。所述步骤E4中,输入法的安装参数包括输入法注册码密钥、输入法的默认皮肤。实施例2:如图1所示,,所述方法的步骤如下: A、制作纳西象形文字体; B、根据步骤A的结果,构建纳西象形文字体库; C、根据步骤B的结果,构建纳西语、汉语、英语电子词典库; D、根据步骤C的结果,从纳西语、本文档来自技高网...

【技术保护点】
一种纳西语?纳西拼音、纳西语?汉语、纳西语?英语输入法的实现方法,其特征在于:所述方法的步骤如下:A、制作纳西象形文字体;B、根据步骤A的结果,构建纳西象形文字体库;C、根据步骤B的结果,构建纳西语、汉语、英语电子词典库;D、根据步骤C的结果,从纳西语、汉语、英语电子词典库抽取数据,并制作纳西象形文的纳西语?纳西拼音码表、纳西象形文的纳西语?汉语码表、纳西象形文的纳西语?英语码表;E、根据步骤D的结果,制作纳西语?纳西拼音、纳西语?汉语、纳西语?英语输入法。

【技术特征摘要】
1.一种纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述方法的步骤如下: A、制作纳西象形文字体; B、根据步骤A的结果,构建纳西象形文字体库; C、根据步骤B的结果,构建纳西语、汉语、英语电子词典库; D、根据步骤C的结果,从纳西语、汉语、英语电子词典库抽取数据,并制作纳西象形文的纳西语-纳西拼音码表、纳西象形文的纳西语-汉语码表、纳西象形文的纳西语-英语码表; E、根据步骤D的结果,制作纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法。2.根据权利要求1所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤A中,制作纳西象形文字体的具体步骤为: Al、搜集国内外学者研究纳西族象形文字著述以及体裁丰富的含有纳西象形文字的参考资料; A2、将收集的参考资料进行扫描,并以图片的格式储存; A3、将储存的图片使用Photoshop依次进行去色处理、裁剪处理、提取边缘处理、使用图像处理边缘检测算法去噪处理,得到加工后的文字图片; A4、将得到的加工后的文字图片,采用Font Creater导入并制成字模且对单个字模进行微调,得到Unicode编码格式的纳西象形文字体。`3.根据权利要求1所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤B中,构建纳西象形文字体库为:根据得到的Unicode编码格式的纳西象形文字体采用True type造字映射制作纳西象形文字体库。4.根据权利要求1所述的纳西语-纳西拼音、纳西语-汉语、纳西语-英语输入法的实现方法,其特征在于:所述步骤C中,构建纳西语、汉语、英语电子词典库采用的是数据库存储管理技术。5.根据权利要求1所述的纳西语-纳西拼音、纳西...

【专利技术属性】
技术研发人员:余正涛罗林郭剑毅毛存礼线岩团
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有1条评论
  • 来自[美国] 2014年12月09日 08:07
    毛里济奥·纳西(MaurizioNassi)职业足球运动员司职前锋效力于意大利足球丙二级联赛的UnioneSportivaAlessandriaCalcio1912俱乐部
    0
1