当前位置: 首页 > 专利查询>邱行中专利>正文

中文汉字自动标注拼音的系统及方法技术方案

技术编号:14774655 阅读:56 留言:0更新日期:2017-03-09 12:09
本发明专利技术涉及一种中文汉字自动标注拼音的系统及方法,包括一储存有中文汉字及其按两拼法对应的拼音的数据库、一提取模块、一转换模块以及一显示模块,能够自动为中文汉字标注拼音。本发明专利技术中的韵母字符设计新颖,规律性强,易记、易掌握。在每个汉字的正上方仅标注由一个声母字符和一个韵母字符组成的拼音或一个韵母字符的拼音,从而使注音读物的版面整齐、美观,同时使拼音字符的大小显著增大,因此,非常有利于孩子的学习和保护孩子的视力。

【技术实现步骤摘要】

本专利技术涉及一种中文汉字标注拼音的系统及方法,特别涉及一种中文汉字自动标注拼音的系统及方法
技术介绍
目前,不少出版社为了让孩子多识字,多读书,出版了大量多种多样的注音读物。注音读物就是在文章中的文字上方标注拼音的读物。除了常见的各类童话故事、少儿故事和科普读本,一些经典文学名著等也被改编成标注有拼音的精简本。但是,不同的汉字,其对应的拼音英文字母数不一,例如“的”对应的拼音英文字母数仅2个,“常”对应的拼音英文字母数有5个,而有的汉字对应的拼音英文字母数高达6个,例如“状”、“双”、“窗”等。因此,现有的注音读物存在以下问题:(例如下面作为比较例1的一段标注有拼音的文字,摘自2013年出版的《EQ情商教育童话自我认知卷》第12页)1.为了使英文字母排在汉字的正上方,必然会造成汉字之间的字距不一,从而严重破坏注音读物版面的整齐和美观。例如在上面的一段文字中“常”与“常”之间和“常”与“嘲”之间的间距远大于“完”与“好”之间和“好”与“的”之间的间距。2.汉字过大,而英文字母过小。在上述比较例1中汉字是加粗华文楷体“四号”字,英文字母是“小六号”(与原著完全一致)。如果文章中有“状”等汉字,为了使“状”对应的拼音“zhuang”正好排在“状”字的正上方和使汉字之间的字距相同,则当汉字使用“一号”字(尺寸为9.17mm)时,即使英文字母采用“七号”字(尺寸为1.94mm),也会偏大。3.由于拼音英文字母过小,不仅影响儿童的学习,而且对于儿童的视力将造成不良的影响。另外,对于学习汉字的人而言,如何根据用户需求而自动为中文汉字标注拼音,使有注音需求的用户随时能够了解中文汉字的读音,也是迫切需要解决的问题。
技术实现思路
本专利技术的目的在于解决现有拼音读物中存在的上述问题。为了实现上述目的,提供一种中文汉字自动标注拼音的系统,用于对中文汉字自动标注拼音,该系统包括:一数据库,储存有中文汉字及其对应的拼音,所述数据库中的中文汉字包括单字和词组,所述数据库中的拼音包括单字对应的拼音和词组对应的拼音,所述词组对应的优先级别较高,拼音采用两拼法,即每个中文汉字至多用两个字符:一个声母和一个韵母标注拼音,声母按照下列声母表一至声母表三中的一种,韵母按照下列韵母表一至韵母表四中的一种,其中韵母表一中的“i”、“A”、“E”、“O”和韵母表二中的“i”、“丨”、“a”、“e”、“o”是基本韵母,字符分别表示“n”、“ng”,韵母表三中的“丨”、或者韵母表四中的分别代替注音字符“丨”、“乂”、“凵”,[表1]声母表一[表2]声母表二[表3]声母表三[表4]韵母表一[表5]韵母表二(接前表)[表6]韵母表三[表7]韵母表四一提取模块,采用全屏提取的方式,提取当前所显示的中文页面中的中文汉字串,或采用鼠标取词的方式,提取当前鼠标所在位置的中文汉字串,并将该中文汉字串与该数据库中的词组对比,判断该中文汉字串能否组成词组,如果不能,则与所述单字进行对比;一转换模块,根据该数据库,将该中文汉字串转换为对应的拼音;及一显示模块,将该拼音显示在与该中文汉字串对应的位置。另外,对于所述的中文汉字自动标注拼音的系统,该显示模块还包括一位置单元,用以确定该拼音的显示区域。另外,对于所述的中文汉字自动标注拼音的系统,所述显示区域为该页面中的中文汉字串的各个汉字的正上方区域。另外,对于所述的中文汉字自动标注拼音的系统,所述显示区域为在当前鼠标所在位置开启的一窗口。本专利技术还提供了一种中文汉字自动标注拼音的方法,用于对中文汉字自动标注拼音,该方法包括如下步骤:建立中文汉字与对应的拼音的数据库,所述数据库中的中文汉字包括单字和词组,所述数据库中的拼音包括单字对应的拼音和词组对应的拼音,所述词组对应的优先级别较高,拼音采用两拼法,即每个中文汉字至多用两个字符:一个声母和一个韵母标注拼音,声母按照上述声母表一至声母表三中的一种,韵母按照上述韵母表一至韵母表四中的一种,其中韵母表一中的“i”、“A”、“E”、“O”和韵母表二中的“i”、“丨”、“a”、“e”、“o”是基本韵母,字符分别表示“n”、“ng”,韵母表三中的“丨”、或者韵母表四中的分别代替注音字符“丨”、“乂”、“凵”,提取中文页面,采用全屏提取的方式,提取当前显示的中文页面中的中文汉字串,或采用鼠标取词的方式,提取当前鼠标所在位置的中文汉字串,并将该中文汉字串与该数据库中的词组对比,判断该中文汉字串能否组成词组,如果不能,则与所述单字进行对比,根据该数据库将该中文汉字串转换为对应的拼音,及将该拼音显示在与该中文汉字串对应的位置。另外,所述的中文汉字自动标注拼音的方法,还包括确定该拼音的显示区域的步骤。另外,对于所述的中文汉字自动标注拼音的方法,所述确定该拼音的显示区域的步骤是将该中文汉字串的各个汉字的正上方作为显示区域。另外,对于所述的中文汉字自动标注拼音的方法,所述确定该拼音的显示区域的步骤是在当前鼠标的所在位置开启一窗口作为显示区域。根据本专利技术的中文汉字自动标注拼音的系统及方法,不仅能够自动为中文网页中所有的中文汉字标注拼音,而且在每个汉字的正上方仅标注两个字符组成的拼音或一个字符的拼音,从而使注音读物的版面整齐、美观,同时使拼音字符的大小显著地增大,另外,本专利技术中的韵母以及各种字符容易记忆,因此,非常有利于孩子的学习和保护孩子的视力。结合屏幕取词功能,可以根据用户需要,在显示的页面中截取中文汉字,显示其对应的拼音,从而使用户可以随时了解该中文汉字的读音,方便了用户的使用。附图说明图1是本专利技术的中文汉字自动标注拼音的系统的模块结构图。图2是本专利技术的实施方式的模块结构图。图3是本专利技术的中文汉字自动标注拼音的方法的流程图。图4是本专利技术的第一实施方式页面转换的流程图。图5是本专利技术的第二实施方式的鼠标取词的流程图。具体实施方式下面对本专利技术进行详细说明。图1是本专利技术的中文汉字自动标注拼音系统的模块结构图,包括一数据库110,一提取模块120,一转化模块130以及一显示模块140。下面对本系统的各模块进行详细说明:(1)数据库110,储存有中文汉字及其按两拼法对应的拼音,包括中文汉字的单字对应的拼音和由单字组成的词对应的拼音。(2)提取模块120,用于根据用户需要提取当前页面中的中文汉字。如果用户选择全屏提取,则提取模块120提取当前页面中的所有中文汉字。如果用户选择鼠标取词,则提取模块120只提取当前鼠标所在位置的中文汉字,同时判断当前汉字与其相邻汉字能否组成词组,如果能够组成词组,则提取词组。(3)转换模块130,用于接收提取模块120提取的内容,并且通过数据库110,将该中文汉字转换为对应的拼音。(4)显示模块140,用于将该拼音显示在与该汉字对应的位置。其中,显示模块140还包括一位置单元141(见图2),用以确定拼音显示的具体位置。如果用户选择全屏提取,则位置单元141将中文汉字的正上方作为显示区域,使中文汉字与拼音对应。如果用户选择的是鼠标取词,则该位置单元141将根据当前鼠标所在的位置,自动开启一显示窗口,作为拼音显示区域。参见图3,该图是本专利技术的中文汉字自动标注拼音的方法的流程图,首先建立中文汉字及其按两拼法对应的拼音的数据库(步骤310),然后,提取当前页面中的中文汉字(步骤32本文档来自技高网
...
中文汉字自动标注拼音的系统及方法

【技术保护点】
一种中文汉字自动标注拼音的系统,用于对中文汉字自动标注拼音,其特征在于:该系统包括:一数据库,储存有中文汉字及其对应的拼音,所述数据库中的中文汉字包括单字和词组,所述数据库中的拼音包括单字对应的拼音和词组对应的拼音,所述词组对应的优先级别较高,拼音采用两拼法,即每个中文汉字至多用两个字符:一个声母和一个韵母标注拼音,声母按照下列声母表一至声母表三中的一种,韵母按照下列韵母表一至韵母表四中的一种,其中韵母表一中的“i”、“A”、“E”、“O”和韵母表二中的“i”、“丨”、“a”、“e”、“o”是基本韵母,字符“_”、分别表示“n”、“ng”,韵母表三中的“丨”、或者韵母表四中的“‑”、分别代替注音字符“丨”、“ㄨ”、“凵”,声母表一声母表二声母表三韵母表一韵母表二韵母表三韵母表四一提取模块,采用全屏提取的方式,提取当前所显示的中文页面中的中文汉字串,或采用鼠标取词的方式,提取当前鼠标所在位置的中文汉字串,并将该中文汉字串与该数据库中的词组对比,判断该中文汉字串能否组成词组,如果不能,则与所述单字进行对比,一转换模块,根据该数据库,将该中文汉字串转换为对应的拼音,及一显示模块,将该拼音显示在与该中文汉字串对应的位置。...

【技术特征摘要】
1.一种中文汉字自动标注拼音的系统,用于对中文汉字自动标注拼音,其特征在于:该系统包括:一数据库,储存有中文汉字及其对应的拼音,所述数据库中的中文汉字包括单字和词组,所述数据库中的拼音包括单字对应的拼音和词组对应的拼音,所述词组对应的优先级别较高,拼音采用两拼法,即每个中文汉字至多用两个字符:一个声母和一个韵母标注拼音,声母按照下列声母表一至声母表三中的一种,韵母按照下列韵母表一至韵母表四中的一种,其中韵母表一中的“i”、“A”、“E”、“O”和韵母表二中的“i”、“丨”、“a”、“e”、“o”是基本韵母,字符“_”、分别表示“n”、“ng”,韵母表三中的“丨”、或者韵母表四中的“-”、分别代替注音字符“丨”、“ㄨ”、“凵”,声母表一声母表二声母表三韵母表一韵母表二韵母表三韵母表四一提取模块,采用全屏提取的方式,提取当前所显示的中文页面中的中文汉字串,或采用鼠标取词的方式,提取当前鼠标所在位置的中文汉字串,并将该中文汉字串与该数据库中的词组对比,判断该中文汉字串能否组成词组,如果不能,则与所述单字进行对比,一转换模块,根据该数据库,将该中文汉字串转换为对应的拼音,及一显示模块,将该拼音显示在与该中文汉字串对应的位置。2.根据权利要求1所述的中文汉字自动标注拼音的系统,其特征在于:该显示模块还包括一位置单元,用以确定该拼音的显示区域。3.根据权利要求2所述的中文汉字自动标注拼音的系统,其特征在于:所述显示区域为该页面中的中文汉字串的各个汉字的正上方区域。4.根据权利要求2所述的中文汉字自动标注拼音的系统,其特征在于:所述显示区域为在当前鼠标所在位置开启的一窗口。5...

【专利技术属性】
技术研发人员:邱行中
申请(专利权)人:邱行中
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1