用于汉语语音识别系统的连续语音处理方法和装置制造方法及图纸

技术编号:3047361 阅读:218 留言:0更新日期:2012-04-11 18:40
本发明专利技术的连续语音处理方法和装置中,分析了大量的自然语音,已知单音节的连续语音会随着一些因素变化,例如音素、音调、词组结构、在词组中的位置,在句子中的位置和前后连接的音素等、用这些变化因素建立起来一个“连续语音参数储存部分”,通过检索连续语音参数和在音节连续语音计算中结合音节的基本连续语音,在句子中可以精确地确定每个单音节的连续语音。本发明专利技术的语音识别系统可以采用自然的连续语音合成语音。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种连续语音处理方法和装置,用于判定合成语音的连续语音以获得好的音质。以汉语为例,用于汉语语音合成系统的合成单位大体上分为两类(1)单音节(408种,不包括4个音调)和(2)音素(包括21个汉语拼音辅音和38个元音)。作为合成的单位,不管是单音节还是音素,一些因素,例如音素、音调、词组结构、在词组中的位置、在句子中的位置和前后连接的音素,合成单位的这些因素正确地判定每种合成单位的连续语音,而这些因素都对合成语音的自然相似程度有很大影响。传统的用于汉语语音识别系统的连续语音处理方法和装置已经在R.O.C.上公开。专利申请号80100559,标题为“用于Text-to-speech system的连续语音处理方装置。”,图9是一个以图解说明的根据音素、音调和在句子中的位置确定连续语音的连续语音处理装置的方框图。如图9所示,110表示一个记忆部分,用于储存不同数据。120表示一个拼音句子输入部分,用于输入任何长度、由拼音标识和音调标识组成的拼音句子。130表示音节检查部分,用于检查从拼音句子输入部分120输入的带音调标识的句子的音节。150表示音节-音素查找储存部分,用于储存由每个音节组成的音素。140表示音素检查部分,用于使用音节-音素查找储存部分150在输入拼音的句子检查音素,并检查在句子中每个音素的位置。170表示连续语音的数值数据储存部分,用于储存根据音素的种类、音素的音调和句子中音素的位置来定义的连续语音计算数据。160表示连续语音的检查部分,用于计算音节的连续语音通过使用被检查音素的指定数目,每个音素的音调和每个音素在句子中的位置作为索引关键字从连续语音的数值数据储存部分170中检索每个音素的连续语音的数字数据。如上所述的连续语音处理装置,只考虑了音素、音调和在句子中音素的位置。至于合成单位是否组成词组和在词组中其位置的影响对于连续语音也同样应被考虑。例如,在一个三字词组中,第二个字的连续语音是最短的,接下来是第一个字,而第三个字的连续语音是最长的。在例句“我爷爷最喜欢那张小桌子”中,“我爷爷”组成一个三字词组。由传统的连续语音处理装置生成的连续语音第一个“爷”字和第二个“爷”字大约都是339ms。然而,用声音记录装置测量自然语言发音的连续语音分别是275ms和302ms,从而,出现了一个相对较大的差异。因此,仅考虑音素、音调和在句子中音素的位置而得到的连续语音会导致合成语音质量的降低。因此,本专利技术的主要目的是提供一种用于汉语语音识别系统的能克服前述的缺点的连续语音处理方法和装置。根据本专利技术的第一方面,用汉语音素作为基本处理单元的汉语语音识别系统的连续语音处理方法,它包括构造一个用于储存汉语词汇和相关信息的词典。例如语音标识、词性、扩展语法等;构造一个用于储存信息的音节-音素查找部分。例如对于所有汉语音节对应每一个音节的音素指定的数目(包括辅音数目和元音数目)等;构造一个基本的连续语音储存部分,其中,该部分用于储存按音素分类的基本连续语音信息;构造一个连续语音参数储存部分,根据每一个属于音素的音节的音调,词组构成,在词组中的位置,在句子中的位置和关联音素的种类来储存连续语音参数;在一个任何长度的输入句子里通过与储存在词典中的词汇相比较检查每一个词汇的音节的位置;根据储存在词典中的语音标识生成每个被检查词汇的语音;参考词典检查每个被检查词汇的词性和扩展语法;根据扩展语法和相邻词汇的词性的关系把句子中的词汇组合成词组;用音调标识在生成的文字语音标识中检查每一个音节;参照音节-音素查找部分的信息,检查每个被检查音节的音素格式。从基本的连续语音储存部分检索每个被检查音素的连续语音;并且从基本的连续语音和与音调、词组构成,词组中的位置,句子中的位置和被检查音素的前后相邻音素的种类等相关的参数中计算组成每个被检查音节的每个被检查音素,并且计算被检查音素的连续语音获得每个被检查音节的连续语音。根据本专利技术的第二个方面,用汉语音节作为基本处理单元的汉语语音识别系统的连续语音处理方法,它包括下述步骤构造一个用于储存汉语词汇和相关信息的词典。例如语音标识、词性、扩展语法等;构造一个基本的连续语音储存部分,其中,该部分用于储存按音节分类的基本的连续语音信息。构造一个连续语音参数储存部分,根据每一个音节的音调,词组构成,在词组中的位置,在句子中的位置和连接的音节的种类来储存连续语音参数;在一个任何长度的输入句子里通过与储存在词典中的词汇相比较检查每一个词汇的音节的位置;根据储存在词典中的语音标识生成每个被检查词汇的每个音节的语音;参考词典检查每个被检查词汇的词性和扩展语法;根据扩展语法和相邻词汇的词性的关系把句子中的词汇组合成词组;用音调标识在生成的文字语音标识中检查每一个音节;从基本的连续语音储存部分检索每个被检查音节的连续语音;并且从基本的连续语音和与音调、词组构成,词组中的位置,句子中的位置和被检查音节的前后相邻音节的种类等相关的参数中计算每个被检查音节了连续语音。根据本专利技术的第三个方面,用汉语音素作为基本处理单元的汉语语音识别系统的连续语音处理装置,它包括一个词典,用于储存汉语词汇和相关信息。例如语音标识、词性、扩展语法等。一个音节-音素查找部分,用于储存信息。例如对于所有汉语音节对应每一个音节的音素指定的数目(包括辅音指定数目和元音指定数目)等;一个基本的连续语音储存部分,用于储存基本的按音素分类的连续语音信息;一个连续语音参数储存部分,用于根据属于每个音素的每一个音节的音调、词组构成、在词组中的位置、在句子中的位置和相连音素的种类储存连续语音参数;一个词汇检查部分,用于在一个任何长度的输入句子里通过与储存在词典中的词汇相比较检查每一个词汇的音节的位置;一个语音识别生成部分,用于根据储存在词典中的语音标识生成每个被检查词汇的每个音节的语音;一个词性和扩展语法检查部分,用于参考词典检查每个被检查词汇的词性和扩展语法;一个词组扩展部分,用于根据扩展语法和相邻词汇的词性的关系把句子中的词汇组合成词组;一个音调/音节检查部分,用音调标识在生成的文字语音标识中检查每一个音节;一个音素检查部分,用于参照音节-音素查找部分的信息检查每个被检查音节的音素格式;一个基本的连续语音判定部分,用于从基本的连续语音储存部分检索每个被检查音素的连续语音;并且一个音节连续语音计算部分,用于从基本的连续语音和与音调、词组构成、词组中的位置、句子中的位置和被检查音素的前后相邻音素的种类等相关的参数中计算组成每个被检查音节的每个被检查音素,并且计算被检查音素的连续语音获得每个被检查音节的连续语音。根据本专利技术的第四个方面,用汉语音节作为基本处理单元的汉语语音识别系统的连续语音处理装置,它包括一个词典,用于储存汉语词汇和相关信息。例如语音标识、词性、扩展语法等。一个基本的连续语音储存部分,用于储存基本的按音节分类的连续语音信息。一个连续语音参数储存部分,用于根据每个音节的音调、词组构成、在词组中的位置、在句子中的位置和相连的音节的种类储存连续语音参数一个词汇检查部分,用于在一个任何长度的输入句子里通过与储存在词典中的词汇相比较检查每一个词汇的音节的位置;一个语音识别生成部分,用于根据储存在词典中的语音标识生成每个被本文档来自技高网...

【技术保护点】
一种用汉语音节作为基本处理单元的汉语语音识别系统的连续语音处理方法,包括:一个构造用于储存汉语词汇和相关信息的词典的程序,例如语音标识、词性、扩展语法等;一个构造用于储存信息的音节-音素查找部分的程序,例如对应于所有汉语音节每一个音 节的指定的音素数目(包括辅音数目和元音数目)等;一个构造基本的连续语音储存部分的程序,其中,该部分用于根据音素储存基本连续语音的分类信息;一个构造连续语音参数储存部分的程序,其中,该部分用于根据每一个音节属于的音调储存连续语音参数, 词组结构和在词组中的位置,在句子中的位置和相关音素的种类;一个在一个任何长度的输入句子里通过与储存在词典中的词汇相比较的检查每个词汇的音节的位置的程序;一个根据储存在词典中的语音标识每个检查词汇的音节生成语音的程序;一个用参考词 典检查每个检查词汇的词性和扩展语法的程序;一个句子中的词汇根据扩展语法和相邻词汇的词性的关系组合成词组的程序;一个用音调标识在生成的文字语音标识识中检查每一个音节的程序;一个参照音节-音素查找部分的信息检查每个被检查的音素格式; 一个从基本连续语音储存部分检索每个被检查的连续语音的程序;和一个计算每个被检查音素的连续语音的程序。从基本的连续语音和与音调、词组构成、词组中的位置、句子中的位置和被检查音素前后相邻音素的种类相关的参数被检查的音素组成每个被检查音节 ,并且计算被检查的音素的连续语音获得每个被检查音节的连续语音。...

【技术特征摘要】
US 2000-3-28 09/536,7501.一种用汉语音节作为基本处理单元的汉语语音识别系统的连续语音处理方法,包括一个构造用于储存汉语词汇和相关信息的词典的程序,例如语音标识、词性、扩展语法等;一个构造用于储存信息的音节-音素查找部分的程序,例如对应于所有汉语音节每一个音节的指定的音素数目(包括辅音数目和元音数目)等;一个构造基本的连续语音储存部分的程序,其中,该部分用于根据音素储存基本连续语音的分类信息;一个构造连续语音参数储存部分的程序,其中,该部分用于根据每一个音节属于的音调储存连续语音参数,词组结构和在词组中的位置,在句子中的位置和相关音素的种类;一个在一个任何长度的输入句子里通过与储存在词典中的词汇相比较的检查每个词汇的音节的位置的程序;一个根据储存在词典中的语音标识每个检查词汇的音节生成语音的程序;一个用参考词典检查每个检查词汇的词性和扩展语法的程序;一个句子中的词汇根据扩展语法和相邻词汇的词性的关系组合成词组的程序;一个用音调标识在生成的文字语音标识识中检查每一个音节的程序;一个参照音节-音素查找部分的信息检查每个被检查的音素格式;一个从基本连续语音储存部分检索每个被检查的连续语音的程序;和一个计算每个被检查音素的连续语音的程序。从基本的连续语音和与音调、词组构成、词组中的位置、句子中的位置和被检查音素前后相邻音素的种类相关的参数被检查的音素组成每个被检查音节,并且计算被检查的音素的连续语音获得每个被检查音节的连续语音。2.一种用汉语音节作为基本处理单元的汉语语音识别系统的连续语音处理方法,包括一个构造用于储存汉语词汇和相关信息的词典的程序,例如语音标识、词性、扩展语法等;一个构造基本的连续语音储存部分的程序,其中,该部分用于根据音节储存基本连续语音的分类信息;一个构造连续语音参数储存部分的程序,其中,该部分用于根据每一个音节的音调储存连续语音参数,词组结构和在词组中的位置、在句子中的位置和相关音节的种类;一个在一个任何长度的输入句子里通过与储存在词典中的词汇相比较的检查每个词汇的音节的位置的程序;一个根据储存在词典中的语音标识每个检查词汇的每个音节生成语音的程序;一个用参考词典检查每个被检查词汇的词性和扩展语法的程序;一个句子中的词汇根据扩展语法和相邻词汇的词性的关系组合成词组的程序;一个用音调标识在生成的文字语音标识识中检查每一个音节的程序;一个从基本连续语音储存部分检索每个被检查的连续语音的程序;和一个计算从基本的连续语音和与音调、词组构成、词组中的位置、句子中的位置和被检查音素前后相邻音素的种类相关的参数中每个被检查的音节的连续语音程序。3.一种用汉语音素作为基本处理单元的汉语语音识别系统...

【专利技术属性】
技术研发人员:孙世章谢琴韵
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利