一种基于新型汉字全息编码规则的明盲文转换系统技术方案

技术编号：16755527 阅读：84 留言：0更新日期：2017-12-09 02:04

本发明专利技术提供了一种基于新型汉字全息编码规则的明盲文转换系统，包括：文本采集模块，用于从外部获取汉字文本；读音数据库，用于存储汉字的读音；分词预处理模块，用于向文本采集模块从外部获取的汉字文本中，自动或手动插入分词标记；汉字全息码预编译模块，用于将所述汉字文本编译成汉字全息码的编码格式，并存储到汉字全息文件存储模块中；汉字全息文件存储模块，用于存储汉字全息码格式的文件。本发明专利技术采用新型的汉字全息码作为文件存储格式，在确定汉字字形的同时，也唯一确定了其读音，还明确了是否与后面汉字分词，包含了明盲文转换时所需的全部信息。利用本发明专利技术，能从根本上克服目前汉字盲文阅读中普遍存在的“费解”、“误解”等问题。

A new type of blind text conversion system based on new Chinese character holography rules

The present invention provides a novel holographic encoding conversion system, Chinese characters rules based on Ming Braille including: text acquisition module is used to obtain Chinese characters text from the outside; the database is used to store the pronunciation, the pronunciation of Chinese characters; word segmentation preprocessing module, Chinese characters for text into the text collection module from external access, automatic or manual insertion mark of word segmentation Chinese characters; holographic code compilation module, used to compile the code into text Chinese characters Chinese characters holographic encoding format, and stored in the file storage module in Chinese characters holographic; holographic storage module for storing Chinese characters, Chinese characters holographic code format. The invention adopts the new Chinese character holographic code as the file storage format, determines the pronunciation of the Chinese character while determining the font shape of the Chinese character, and also specifies whether the word segmentation with the later Chinese characters contains all the information needed for the transformation of Braille. By using this invention, we can fundamentally overcome the problems of \puzzling\ and \misunderstanding\, which are common in the reading of Chinese character Braille.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于新型汉字全息编码规则的明盲文转换系统
本专利技术涉及汉字编码及文字处理领域，具体涉及一种基于新型汉字全息编码规则的明盲文转换系统。
技术介绍
汉字是世界上独一无二的文字，每个字都具有“音”、“形”、“意”三个要素，“音”行于“意”，“意”蕴于“形”，三者密不可分，缺一不可。但目前汉字的盲文，实际是一种拼音方案，由于汉语大量存在同音多字、一字多音的现象，因此汉字转化成盲文后，会普遍存在仅凭读音无法唯一确定词意、从而造成盲人阅读时费解、甚至误解的情况，这也是我国推广和普及盲文所面临的最大难题。随着信息技术的发展，尤其是电脑和点字显示器(以下简称点显器)的推广和普及，为彻底解决上述问题创造了有利条件。
技术实现思路
有鉴于此，有必要针对现有技术中存在的问题，提供一种基于新型汉字全息编码规则的明盲文转换系统，采用特殊的格式对汉字进行转换和存储，将汉字的“音”、“形”、“意”融合在同一套编码规则中，以提高明盲文转换的含义表达准确性。为实现上述目的，本专利技术采用以下技术方案：一种基于新型汉字全息编码规则的明盲文转换系统，包括：文本采集模块，用于从外部获取汉字文本；读音数...

【技术保护点】
一种基于新型汉字全息编码规则的明盲文转换系统，其特征在于，包括：文本采集模块，用于从外部获取汉字文本；读音数据库，用于存储汉字的读音；其中，每个多音字的多个不同读音被按照一定顺序进行编号，且其中一个读音被设定为默认读音；分词预处理模块，用于向文本采集模块从外部获取的汉字文本中，自动或手动插入分词标记；汉字全息码预编译模块，用于结合读音数据库中设定的默认读音以及分词预处理模块中插入的分词标记，将所述汉字文本编译成汉字全息码的编码格式，并存储到汉字全息文件存储模块中；汉字全息文件存储模块，用于存储汉字全息码格式的文件；其中，所述汉字全息码的编码格式为：一个汉字全息码对应一个汉字；汉字全息码的前2字...

【技术特征摘要】
1.一种基于新型汉字全息编码规则的明盲文转换系统，其特征在于，包括：文本采集模块，用于从外部获取汉字文本；读音数据库，用于存储汉字的读音；其中，每个多音字的多个不同读音被按照一定顺序进行编号，且其中一个读音被设定为默认读音；分词预处理模块，用于向文本采集模块从外部获取的汉字文本中，自动或手动插入分词标记；汉字全息码预编译模块，用于结合读音数据库中设定的默认读音以及分词预处理模块中插入的分词标记，将所述汉字文本编译成汉字全息码的编码格式，并存储到汉字全息文件存储模块中；汉字全息文件存储模块，用于存储汉字全息码格式的文件；其中，所述汉字全息码的编码格式为：一个汉字全息码对应一个汉字；汉字全息码的前2字节为该汉字的内码；汉字全息码第3字节的其中一位定义为分词标识码，以分词标识码的不同数值标识该汉字是否与下一个汉字组成分词；汉字全息码的第4字节定义为读音标识码，以读音标识码的数值大小标识该汉字在上下文中正确读音所对应的编号；所述系统还包括：文本编辑模块，用于从汉字全息文件存储模块中读取汉字全息码格式的文件，对汉字全息码中的汉字信息和分词信息进行解译，显示出对应的汉字文本及分词标记，供用户进行审阅和修改；当用户对汉字文本或分词标记进行修改时，同步修改汉字全息文件存储模块中存储的汉字全息码；注音编辑模块，用于从汉字全息文件存储模块中读取汉字全息码格式的文件，对汉字全息码中的汉字信息和读音信息进行解译，显示出对应的汉字文本和多音字的读音信息，结合读音数据库，供用户审阅并修正多音字的正确读音；当用户对多音字的读音进行更改时，同步修改汉字全息文件存储模块中存储的汉字全息码；盲文转换模块，用于从汉字全息文件存储模块中读取汉字全息码格式的文件，对汉字全息码中的分词信息和读音信息进行解译，并结合读音数据库确定各汉字的读音，以将汉字全息码中的汉字信息转换为盲文供用户审阅及修改；当用户对盲文进行修改时，同步修改汉字全息文件存储模块中存储的汉字全息码。2.根据权利要求1所述的基于新型汉字全息编码规则的明盲文转换系统，其特征在于，在分词预处理模块中，自动插入分词标记是通过结合一外部的或系统内置的分词数据库实现的，所述分词数据库中存储有常用分词，所述分词预处理模块将文本采集模块从外部获取的汉字文本与分词数据库中的分词进行比对，以在汉字文本中自动插入分词标记...

【专利技术属性】
技术研发人员：富明慧，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人