用于簇集音素模型的装置、方法和程序制造方法及图纸

技术编号:3048269 阅读:215 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及用于簇集音素模型的装置、方法和程序。节点初始化单元生成包括输入的音素模型的根节点。候选者生成单元通过将没有子节点的节点中包括的音素模型的集合划分成两个生成一对子集合的候选者。候选者删除单元删除每个只包括附带有指示所述子集合的至少一个具有少量语音数据用于训练的确定信息的音素模型的候选者。类似度计算单元计算在所述子集合中包括的所述音素模型之间的类似度的和。候选者选择单元选择具有最大和的候选者中的一个。节点生成单元分别生成两个包括所述两个包括在所述选择的候选者中的子集合的节点。簇集单元以每个包括在节点中的音素模型集合为单位来簇集所述音素模型。

【技术实现步骤摘要】

本专利技术涉及用于通过将树结构中的节点视为簇(cluster)来簇集 (clustering )音素4莫型的装置、方法和禾呈序。
技术介绍
在语音识别领域中, 一般使用能够通过各音素概率模型表示输入语音 的声学特征的技术。这些概率模型被称为音素模型(phonemic model)。 通过使用被发出的语音的语音数据统计地训练音素模型的参数来获得音素 模型。音素模型的精度取决于在训练中使用的语音数据。因此,为了获得 高精度的音素模型,优选地,通过使用尽可能多的语音数据来实施训练音 素模型。然而,在一些情况下,在训练音素模型中不能使用这么多的语音数据。 例如,在包括泰国语的东南亚语言的情况下,仅有少量的语音数据可以被 用于训练一些音素模型。因此,与4吏得能够利用相对大量的语音数据的欧 美语言或类似语言比较,仅可以获得较低精度的音素模型。另外,在泰国 语的音素中有短元音和长元音之间的区别,并且在某些音素中比用于短元 音的更少的语音数据可以用于长元音。在这样的音素中,长元音的音素模 型比短元音的音素^f莫型具有相对更低的精度。为了以高精度训练仅具有少量可被用于训练的语音数据的音素模型, 众所本文档来自技高网...

【技术保护点】
一种簇集装置,包括: 输入单元,其被配置为输入至少一个附带有确定信息的音素模型和至少一个未附带有所述确定信息的音素模型,所述确定信息指示少量语音数据用于训练; 节点初始化单元,其被配置为生成包括输入的音素模型的节点作为树结构的根 节点; 候选者生成单元,其被配置为通过将所述节点中包括的音素模型的集合划分成两个,对在所述树结构中的节点之中没有子节点的节点生成一对子集合的候选者; 候选者删除单元,其被配置为从生成的候选者删除包括所述两个子集合的候选者,所述两 个子集合的至少一个只包括附带有所述确定信息的音素模型; 类似度计算单元,其被配置为计算所述两个子...

【技术特征摘要】
JP 2007-10-24 276236/20071. 一种簇集装置,包括输入单元,其被配置为输入至少一个附带有确定信息的音素模型和至少一个未附带有所述确定信息的音素模型,所述确定信息指示少量语音数据用于训练;节点初始化单元,其被配置为生成包括输入的音素模型的节点作为树结构的根节点;候选者生成单元,其被配置为通过将所述节点中包括的音素模型的集合划分成两个,对在所述树结构中的节点之中没有子节点的节点生成一对子集合的候选者;候选者删除单元,其被配置为从生成的候选者删除包括所述两个子集合的候选者,所述两个子集合的至少一个只包括附带有所述确定信息的音素模型;类似度计算单元,其被配置为计算所述两个子集合的每个中包括的所述音素模型之间的类似度,并且计算对所述子集合计算出的所述类似度的和,其中所述两个子集合包括在所述候选者而不是所述删除的候选者的每个中;候选者选择单元,其被配置为选择具有最大计算和的候选者中的一个;节点生成单元,其被配置为分别生成两个节点作为是所述选择的候选者的生成源的节点的子节点,所述两个节点包括两个包括在所述选择的候选者中的子集合;以及簇集单元,其被配置为以在所述树结构的节点中包括的音素模型集合为单位来簇集所述音素模型。2. 根据权利要求l所述的装置,其中,所述输入单元输入至少 一个附带有语言确定信息作为所述确定信息的 音素才莫型和至少一个未附带有所述语言确定信息的音素才莫型,所述语言确定信息指示具有少量语音数据的语言;以及所述候选者删除单元从所述生成的候选者删除包括两个子集合的候选 者,所述两个子集合的至少一个只包括附带有所述语言确定信息的音素模 型。3. 根据权利要求l所述的装置,其中,所述候选者生成单元在所述树 结构的节点之中,对每个没有子节点并且包括附带有所述确定信息的音素 模型的节点生成所述候选者。4. 根据权利要求l所述的装置,其中,所迷音素模型的每个对应于隐 马尔可夫模型(HMM)的每个状态,所述隐马尔可夫模型(HMM)是通 过建模语音的声学特征之间的...

【专利技术属性】
技术研发人员:酒井优
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1