当前位置: 首页 > 专利查询>娄光专利>正文

计算机识读文字软件的编程方法技术

技术编号:2859305 阅读:174 留言:0更新日期:2012-04-11 18:40
一种计算机识读文字软件的编程方法,其特征是:每一个音都有声调,带声调特征的音,是最基本的音,我们把最基本的音定名为音素,本技术是给每一个音素一个唯一的代码将代码输入计算机,计算机看到一个字就根据这个字的音找它的代码,读该代码的音就是该字的读音。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及办公设备中的计算机,特别是。
技术介绍
已有技术的计算机识读文字软件的问题是,语音的认读不易理解,如果用人来读一次就可听懂的文件,已有技术的计算机识读文字软件可能要读两遍或三遍才能听懂。
技术实现思路
为了解决上述问题,本专利技术的目的是,将提供一种让人容易听懂的软件。为了达到上述目的,对轻声、儿化音、多音字都作了相应的处理。每一个音都有声调,带声调特征的音,是最基本的音,我们把最基本的音定名为音素,本技术是给每一个音素一个唯一的代码将代码和音素的音输入计算机,计算机看到一个字就根据这个字的音找它的代码,读该代码的音就是该字的音,使音素代码认读所有的字,包括汉语拼音的字母,例如A就读作“啊”,汉字共有音节420多个,音节又分阴平、阳平、上声、去声、轻声声调,每个音节中可能有1-五个声调,不过以上轻声音调中不包括在特定环境中的轻声,例如“爸爸”二字的第二个爸字和第一个爸字一样收在去声中,在轻声中,虽然在注释中提到“爸爸”二字在连读时第二个爸字读轻声,但是在音序中并没有它的位置,按下边阐述的依音序给音素代码的方法第二个“爸”字是得不到轻声音序代码的,所以在本方案中还得加一些轻声音素代码。根据以上的功能,可能比已有技术的软件容易听懂,在茶、酌、踱、卧时均可听计算机读文件,用听觉上网溜览,再就是在听计算机读文件,用听觉上网溜览时,均可把显示器关掉。具体实施例方式本技术是给每一个音素一个唯一的代码将代码输入计算机,使它认读所有的字,包括汉语拼音的字母,例如A就读作“啊”,汉字共有音节420多个,音节又分阴平、阳平、上声、去声、轻声声调,每个音节中可能有1—五个声调,不过以上轻声音调中不包括在特定环境中的轻声,例如“爸爸”二字的第二个爸字和第一个爸字一样收在去声中,而不是收在轻声中,虽然在注释中提到“爸爸”二字在连读时第二个爸字读轻声,但是在音序中并没有它的位置,按下边阐述的依音序给音素代码的方法第二个“爸”字是得不到轻声音序代码的,所以在本方案中还得加一些轻声音素代码,本方案是在1979年版《辞海》的汉语拼音索引的基础上,再增加轻声、儿化音的共有音素1240多个,也就是说无论是多少字多少书都可以用这1240个音素读出来,既使是新字也能读出来,因为汉字是造字不造音,你只要造出字来就必有名称,名称就是音素,这样只要把音素输入计算机它就可以读所有的计算机文件,这就好象五笔字形输入法的五笔字形能输入所有的字,并且可以反复使用而用之不竭一样,又和四角号码的10个号码一样能代表所有的字,不过五笔字形和四角号码都有不确定的时候,而音素认读就没有这个问题,1240个音素可用汉语拼音的顺序的序号来做为该音素的代号码,也就是每一个音素有一个唯一的代号码,但是这个音素可代表若干个相同音、调的不同的字,以上是按1979年版《辞海》的汉语拼音索引的顺序,与自然数的顺序相结合的方法,另一种方法是以常用音素在先,不常用音素在后的方法把所有的音素排成队,再与自然数的顺序相结合的方法。对多音字,轻音字、儿化音字的处理方法是,在多音字方面把一个多音字的几个音进行比校,按常用的音在前不常用的音在后的原则进行排队,第一常用的音不作标记,第二个音在该字的左上方加一个点,第三个音在该字的正上方加一个点,第四个音在该字的右上方加一个点,第五个音在该字的左上方和右上方各加一个点,第六个音在该字的左上方、右上方和正上方各加一个点共三个点,如果该文件是用拼音输入的,计算机会根据这个多音字的输入音去认读。在按常用的音在前不常用的音在后的原则进行排队的次第,进行标记的文件里,在读该文件时,计算机会根据这个多音字的标记读它的相应的音;轻音字方面作为称谓的“爸”“哥”又没有其它函意的字,在它们重叠时第二个字读轻音是恒定的,所以可以给重叠的第二个字一个音素代码,也可以把作为称谓的“爸”“哥”等没有其它函意的字,输入计算机当计算机读到这些字重叠时就自动把重叠的第二个字读作轻声,其它的重叠字是否读轻音要因语境而定,一般的情况下名词、动词重叠时第二个字是轻音,形容词重叠时第二个字不读轻音,例如“丽丽渐渐胖了”第二个丽字是轻音,就给第二个丽字标上轻音标记,就是在第二个丽字的上边加一条小的上划线,计算机看到标记就读作轻音,第二个渐字不是轻音就不作任何标记,计算机就读它的标准音,如果不作标记那就要让计算机识别语境,对名词、动词重叠时的第二个字读轻音,对形容词重叠时的第二个字不读轻音,,计算机在见到标记时才读轻音;儿化音方面儿化音完全是依语境而定一般的,名词后边有儿是儿化音,动词后边的儿不是儿化音,例如“花儿的钱买红花儿”中的第一个花字是动词它后边地儿不读作儿化音,第二个花字是名词所以读作儿化音,就给名词的花字的下边加一条小的下划线,另一个方法是把儿化音的语境输给计算机使计算机根据语境读出儿化音来,也可以在输入文字时给儿化音的字输上标记。如果该文件在输入时没有做多音字、轻音字、儿化音字的处理,或是用扫描仪扫入的文件是没有做多音字、轻音字、儿化音字标记的处理的,计算机在读的时候,读多音字的不作标记的第一常用音,遇有轻声和儿化音的字的时候,除了有特定组合的已经给出了音素代码的,读该音素代码的音以外,其它的都读该字的标准音,如果打算让计算机把该文件的多音字、轻音字、儿化音都读出来,就按以上的方法给“多音字、轻音字、儿化音字”都做上标记,可目览可听读也可以听读和目览同时进行,当发现应该校正的多音字时,就输入你认为正确的拼音,计算机会给该字作出相应的标记,以后计算机就会按新输入的拼音认读,当发现该读轻音或儿化音的字的时候,就给该字标上相应的标记,以后计算机就会按新的标记读出轻音或儿化音,不过轻音或儿化音在输入时就可方便的标注或是应该标注,而多音字,一个方法是用拼音输入,计算机会自动作上标记,用其它的输入方法输入时,输入者要作上多音字的标记.接下来是页面情况的认读,页面情况包括字体、字号、布局、标点符号,在字体方面让计算机可以认读所有的字体例如仿宋、楷书、粗体等,字号方面让计算机可以认读所有的字号,例如三号、七号、八号等,在布局方面让计算机可以认读页面的情况例如标题的位置、空格、空行等,在标点符号方面让计算机可以认读所有的标点符号,例如逗号、句号、括号、书名号等,有一点与众不同的读法是,对“(、“、《”等原来就读作括号、引号、书名号现在,在它的前边加一个“前”字,读作前括号、前引号、前书名号,与此相对应的就读作后括号、后引号、后书名号,凡是前后对称的符号在读的时候均把前、后的位置读出来。在校对全文和听读及听觉溜览方面;在读文件时本软件可读出三个层次,第一个层次是读没有经过本方案“多音字、轻音字、儿化音字”软件处理的文件,对多音字读它的最常用音,对轻音字读它的标准音,对儿化音字读它的标准音,遇到逗号、句号、顿号、问号、感叹号均做停顿;第二个层次是读经过本方案“多音字、轻音字、儿化音字”处理的文件,它将把多音字、轻音字、儿化音全读出来,遇到逗号、句号、顿号、问号、感叹号均做停顿;第三个层次是专为校对文件设计的,它是在第二个层次的基础上再加上把页面的情况都读出来,也就是见什么读什么,例如见到“,”号,就读做“逗号”见到“。”号就读做“句号”见到“(”号就读做“前括号”见到空格、另起行本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种计算机识读文字软件的编程方法,其特征是每一个音都有声调,带声调特征的音,是最基本的音,我们把最基本的音定名为音素,本技术是给每一个音素一个唯一的代码将代码输入计算机,计算机看到一个字就根据这个字...

【专利技术属性】
技术研发人员:娄光
申请(专利权)人:娄光
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利