用于汉语语音识别系统的连续语音处理方法和装置制造方法及图纸

技术编号：3047361 阅读：218 留言：0更新日期：2012-04-11 18:40

本发明专利技术的连续语音处理方法和装置中，分析了大量的自然语音，已知单音节的连续语音会随着一些因素变化，例如音素、音调、词组结构、在词组中的位置，在句子中的位置和前后连接的音素等、用这些变化因素建立起来一个“连续语音参数储存部分”，通过检索连续语音参数和在音节连续语音计算中结合音节的基本连续语音，在句子中可以精确地确定每个单音节的连续语音。本发明专利技术的语音识别系统可以采用自然的连续语音合成语音。（*该技术在2020年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种连续语音处理方法和装置，用于判定合成语音的连续语音以获得好的音质。以汉语为例，用于汉语语音合成系统的合成单位大体上分为两类(1)单音节(408种，不包括4个音调)和(2)音素(包括21个汉语拼音辅音和38个元音)。作为合成的单位，不管是单音节还是音素，一些因素，例如音素、音调、词组结构、在词组中的位置、在句子中的位置和前后连接的音素，合成单位的这些因素正确地判定每种合成单位的连续语音，而这些因素都对合成语音的自然相似程度有很大影响。传统的用于汉语语音识别系统的连续语音处理方法和装置已经在R.O.C．上公开。专利申请号80100559，标题为“用于Text-to-speech system的连续语音处理方装置。”，图9是一个以图解说明的根据音素、音调和在句子中的位置确定连续语音的连续语音处理装置的方框图。如图9所示，110表示一个记忆部分，用于储存不同数据。120表示一个拼音句子输入部分，用于输入任何长度、由拼音标识和音调标识组成的拼音句子。130表示音节检查部分，用于检查从拼音句子输入部分120输入的带音调标识的句子的音节。150表示音节-音素查找储存部分，用于储存由每个音节组成的音素。140表示音素检查部分，用于使用音节-音素查找储存部分150在输入拼音的句子检查音素，并检查在句子中每个音素的位置。170表示连续语音的数值数据储存部分，用于储存根据音素的种类、音素的音调和句子中音素的位置来定义的连续语音计算数据。160表示连续语音的检查部分，用于计算音节的连续语音通过使用被检查音素的指定数目，每个音素的音调和每个音素在句子中的位置...

【技术保护点】
一种用汉语音节作为基本处理单元的汉语语音识别系统的连续语音处理方法，包括：一个构造用于储存汉语词汇和相关信息的词典的程序，例如语音标识、词性、扩展语法等；一个构造用于储存信息的音节－音素查找部分的程序，例如对应于所有汉语音节每一个音节的指定的音素数目（包括辅音数目和元音数目）等；一个构造基本的连续语音储存部分的程序，其中，该部分用于根据音素储存基本连续语音的分类信息；一个构造连续语音参数储存部分的程序，其中，该部分用于根据每一个音节属于的音调储存连续语音参数，词组结构和在词组中的位置，在句子中的位置和相关音素的种类；一个在一个任何长度的输入句子里通过与储存在词典中的词汇相比较的检查每个词汇的音节的位置的程序；一个根据储存在词典中的语音标识每个检查词汇的音节生成语音的程序；一个用参考词典检查每个检查词汇的词性和扩展语法的程序；一个句子中的词汇根据扩展语法和相邻词汇的词性的关系组合成词组的程序；一个用音调标识在生成的文字语音标识识中检查每一个音节的程序；一个参照音节－音素查找部分的信息检查每个被检查的音素格式； ...

【技术特征摘要】
US 2000-3-28 09/536,7501．一种用汉语音节作为基本处理单元的汉语语音识别系统的连续语音处理方法，包括一个构造用于储存汉语词汇和相关信息的词典的程序，例如语音标识、词性、扩展语法等；一个构造用于储存信息的音节-音素查找部分的程序，例如对应于所有汉语音节每一个音节的指定的音素数目(包括辅音数目和元音数目)等；一个构造基本的连续语音储存部分的程序，其中，该部分用于根据音素储存基本连续语音的分类信息；一个构造连续语音参数储存部分的程序，其中，该部分用于根据每一个音节属于的音调储存连续语音参数，词组结构和在词组中的位置，在句子中的位置和相关音素的种类；一个在一个任何长度的输入句子里通过与储存在词典中的词汇相比较的检查每个词汇的音节的位置的程序；一个根据储存在词典中的语音标识每个检查词汇的音节生成语音的程序；一个用参考词典检查每个检查词汇的词性和扩展语法的程序；一个句子中的词汇根据扩展语法和相邻词汇的词性的关系组合成词组的程序；一个用音调标识在生成的文字语音标识识中检查每一个音节的程序；一个参照音节-音素查找部分的信息检查每个被检查的音素格式；一个从基本连续语音储存部分检索每个被检查的连续语音的程序；和一个计算每个被检查音素的连续语音的程序。从基本的连续语音和与音调、词组构成、词组中的位置、句子中的位置和被检查音素前后相邻音素的种类相关的参数被检查的音素组成每个被检查音节，并且计算被检查的音素的连续语音获得每个被检查音节的连续语音。2．一种用汉语音节作为基本处理单元的汉语语音识别系统的连续语音处理方法，包括一个构造用于储存汉语词汇和相关信息的词典的程序，例如语音标识、词性、扩展语法等；一个构造基本的连续语音储存部分的程序，其中，该部分用于根据音节储存基本连续语音的分类信息；一个构造连续语音参数储存部分的程序，其中，该部分用于根据每一个音节的音调储存连续语音参数，词组结构和在词组中的位置、在句子中的位置和相关音节的种类；一个在一个任何长度的输入句子里通过与储存在词典中的词汇相比较的检查每个词汇的音节的位置的程序；一个根据储存在词典中的语音标识每个检查词汇的每个音节生成语音的程序；一个用参考词典检查每个被检查词汇的词性和扩展语法的程序；一个句子中的词汇根据扩展语法和相邻词汇的词性的关系组合成词组的程序；一个用音调标识在生成的文字语音标识识中检查每一个音节的程序；一个从基本连续语音储存部分检索每个被检查的连续语音的程序；和一个计算从基本的连续语音和与音调、词组构成、词组中的位置、句子中的位置和被检查音素前后相邻音素的种类相关的参数中每个被检查的音节的连续语音程序。3．一种用汉语音素作为基本处理单元的汉语语音识别系统...

【专利技术属性】
技术研发人员：孙世章，谢琴韵，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人