语音编辑装置、语音编辑方法和语音编辑程序制造方法及图纸

技术编号：3044727 阅读：132 留言：0更新日期：2012-04-11 18:40

可以方便地丰富登记在语音识别装置中的标准模式并且有效地扩充可以以语音识别的词的数量。通过部分地变更现存标准模式而有效地生成新标准模式，而不是从零开始来生成新标准模式。变更部分指定单元（１４）中的模式匹配单元（１６）执行匹配处理来标识将要变更的现存标准模式中的一部分。标准模式生成单元（１８）通过剪切掉将要变更的标准模式的该部分上的语音数据、删除它以及用另一语音数据置换它或者将其与另一语音数据组合来生成新标准模式。标准模式数据库更新单元（２０）添加新标准模式到标准模式数据库（２４）。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音编辑装置、语音编辑方法和语音编辑程序。
技术介绍
—般来说，当编辑者编辑已记录语音数据时，该编辑者在聆听所播放的语音的同时指定并剪切编辑点(editing point)'在专利文献5中，当编辑者生成语音卡(这是通过将语音记录在卡并将图片贴在卡上来生成的)时，编辑者利用高级语音编辑程序将语音表示在计算机屏幕上的编辑窗口中，并使用诸如鼠标之类的工具来删除、剪切或组合语音的组成部分。此外，语音识别装置将语音标准模式(以下称为标准模式)用作语音识别词典(voice recognition dictionary )以识另'J语音。然而，标准才莫式需二昏进行扩充以增加可以以语音识另'J ( voice-recognize )的词(word)的数量。在这种情况下，可以删除或剪切现存标准模式的组成部分。现在描述在语音识别装置中作为语音识别词典的标准模式的编辑.，语音识别装置将目标语音分割为预定时间间隔(帧)，提取指示每一帧的语音波形的特征的多维特征参数(倒谱(cepstmm))，将特征参数的时间序列模式与在语音识別装置中累积的标准模式(作为语音识别的基本单元的将具有最高相似度的词输出作为识别结果。通过将语音信号以约20到40毫秒的时间帧分开以获得倒谱(特征参数)，其使用与该时间帧对应的语音信号的快速傅立叶变换(FFT)，获得幅度谱的对数，并使用该对数的频谱的离散傅立叶逆变换(IDFT)。由FFT获得的该语音的频语包括该语音的近似结构信息(指示音位性质的包络信息)以及微振荡分量的信息(指示声音的音调的微结构信息)。在语音识别的情...

【技术保护点】
一种使用现存语音数据生成另一语音数据的语音编辑装置，该装置包括：　　　　变更部分指定单元，其在该现存语音数据之中的使用源语音数据和用于指定该使用源语音数据的变更部分的变更部分语音数据之间执行匹配处理，并且将该使用源语音数据的至少一部分指定为变更部分；以及　　　　语音数据生成单元，其将该变更部分指定单元所指定的该变更部分语音数据用于生成另一语音数据。

【技术特征摘要】
【国外来华专利技术】JP 2005-5-27 156205/20051.一种使用现存语音数据生成另一语音数据的语音编辑装置，该装置包括变更部分指定单元，其在该现存语音数据之中的使用源语音数据和用于指定该使用源语音数据的变更部分的变更部分语音数据之间执行匹配处理，并且将该使用源语音数据的至少一部分指定为变更部分；以及语音数据生成单元，其将该变更部分指定单元所指定的该变更部分语音数据用于生成另一语音数据。2. 如权利要求1所述的语音编辑装置，其中，该语音数据生成单元生成通过用不同语音数据置换由该变更部分指定单元指定的该使用源语音数据的该变更部分语音数据而获得的语音数据，作为另一语音数据。3. 如权利要求1所述的语音编辑装置，其中，该语音数据生成单元生成通过将由该变更部分指定单元指定的该变更部分语音数据与不同语音数据组i语音数据，作为另一语音数据。-来仝4.如权利要求2或3所述的语音编辑装置，其中，用以生成另一S同语音数据^部输入到该语音编辑装置的语音数据、从该现-数据中被剪切出的语音数据或者该现存语音it据.5. —种使用现存标准模式来借助如权利要求1至4之一所述的该语音编辑装置生成另一标准模式的语音识别装置，该语音识别装置包括变更部分指定单元，其在该现存标准模式之中的使用源标准模式和用于指定该使用源标准模式的变更部分的变更部分语音数据之间执行匹配处理，并且将该使用源标准模式的至少一部分指定为变更部分；以及语音数据生成单元，其将该变更部分指定单元所指定的该变更部分语音数据用于生成另一语音数据。6. 如权利要求5所述的语音识别装置，还包...

【专利技术属性】
技术研发人员：寺西利之，幡野浩司，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人