语音翻译方法和语音翻译装置制造方法及图纸

技术编号:3048176 阅读:199 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了语音翻译方法和语音翻译装置。根据本发明专利技术的一个方面,提供了一种语音翻译方法,包括:将上述语音识别为文本,所述文本包括至少一个包含多个单句的长句;将上述至少一个长句切分为多个单句;以及将上述多个单句中的每一个翻译为目标语种的句子。本发明专利技术的语音翻译方法和装置在语音识别模块与机器翻译模块之间,插入一个长句切分模块,其能够将识别出的文本中的长句并自动切分为若干个简单、完整的单句,从而降低了机器翻译的难度,提高了机器翻译的质量。此外,本发明专利技术还提供了一个与用户交互的界面,使得用户可以方便的修改自动切分的结果。同时,用户的修改操作将被记录下来,用以实时更新切分模型,不断地提高自动切分的效果。

【技术实现步骤摘要】

因此,还需要一种有效地减少切分错误、适应用户需求的切 分方法。
技术实现思路
在本实施例中,语音识别单元601可以是本领域的技术人员 公知的或未来开发的任何语音识别技术,例如上述参考文献l中所公开的 语音识别技术,本专利技术对此没有任何限制,只要能够将输入的语音识别为 文本即可。此外,本实施例的切分单元605还包括最优切分路径选择单 元,用于选择得分最高的候选切分路径作为最优的切分路径,如图4所示, 将如下切分路径作为最优的切分路径That's very kind of you || but I don't think I will I'm driving. ||[0058返回到图6,在切分单元605将语音识别单元601识别出的文 本中的长句切分为多个单句后,翻译单元610将多个单句中的每一句翻译 为目标语种的句子。例如,对于上述例句,分别对如下两个句子进行翻译That's very kind of you ||But I don't think I will I'm driving. ||[0059在本实施例中,翻译单元610可以是任何机器翻译装置,例 如基于规则的翻译、基于实例本文档来自技高网...

【技术保护点】
一种语音翻译方法,包括: 将上述语音识别为文本,所述文本包括至少一个包含多个单句的长句; 将上述至少一个长句切分为多个单句;以及 将上述切分的多个单句中的每一个翻译为目标语种的句子。

【技术特征摘要】
1. 一种语音翻译方法,包括将上述语音识别为文本,所述文本包括至少一个包含多个单句的长句;将上述至少一个长句切分为多个单句;以及将上述切分的多个单句中的每一个翻译为目标语种的句子。2. 根据权利要求1所述的语音翻译方法,其中,上述将上述至少一个长句切分为多个单句的步骤包括利用切分模型将上述至少一个长句切分为多个单句。3. 根据权利要求2所述的语音翻译方法,其中,上述利用切分模型将上述至少 一个长句切分为多个单句的步骤包括为上述至少一个长句生成多个候选切分路径;利用上述切分模型计算上述多个候选切分路径中的每一个的得分;以及选择得分最高的候选切分路径作为最优的切分路径。4. 根据权利要求2或3所述的语音翻译方法,其中,上迷切分模型包括多个n元组(n-gram)及其概率。5. 才艮据权利要求1-4中任何一项所述的语音翻译方法,还包括修正上述将上述至少一个长句切分为多个单句的切分结果。6. 根据权利要求5所述的语音翻译方法,其中,上迷修正上述将上述至少一个长句切分为多个单句的切分结果的步骤包括删除或增加上述切分结果中的切分位置。7. 根据权利要求5或6所述的语音翻译方法,还包括根据上述修正后的切分结果更新上述切分模型。8. 根据权利要求7所述的语音翻译方法,其中,上述根据上述修正后的切分结果更新上述切分模型的步骤包括加强上述修正步骤增加的n元组的概率。9. 根据权利要求7所述的语音翻译方法,其中,上述根据上述修正后的切分结果更新上述切分模型的步骤包括减弱上述修正步骤删除的n元组的...

【专利技术属性】
技术研发人员:李剑峰王海峰吴华
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1