【技术实现步骤摘要】
因此,还需要一种有效地减少切分错误、适应用户需求的切 分方法。
技术实现思路
在本实施例中,语音识别单元601可以是本领域的技术人员 公知的或未来开发的任何语音识别技术,例如上述参考文献l中所公开的 语音识别技术,本专利技术对此没有任何限制,只要能够将输入的语音识别为 文本即可。此外,本实施例的切分单元605还包括最优切分路径选择单 元,用于选择得分最高的候选切分路径作为最优的切分路径,如图4所示, 将如下切分路径作为最优的切分路径That's very kind of you || but I don't think I will I'm driving. ||[0058返回到图6,在切分单元605将语音识别单元601识别出的文 本中的长句切分为多个单句后,翻译单元610将多个单句中的每一句翻译 为目标语种的句子。例如,对于上述例句,分别对如下两个句子进行翻译That's very kind of you ||But I don't think I will I'm driving. ||[0059在本实施例中,翻译单元610可以是任何机器翻译装置,例 如基于 ...
【技术保护点】
一种语音翻译方法,包括: 将上述语音识别为文本,所述文本包括至少一个包含多个单句的长句; 将上述至少一个长句切分为多个单句;以及 将上述切分的多个单句中的每一个翻译为目标语种的句子。
【技术特征摘要】
1. 一种语音翻译方法,包括将上述语音识别为文本,所述文本包括至少一个包含多个单句的长句;将上述至少一个长句切分为多个单句;以及将上述切分的多个单句中的每一个翻译为目标语种的句子。2. 根据权利要求1所述的语音翻译方法,其中,上述将上述至少一个长句切分为多个单句的步骤包括利用切分模型将上述至少一个长句切分为多个单句。3. 根据权利要求2所述的语音翻译方法,其中,上述利用切分模型将上述至少 一个长句切分为多个单句的步骤包括为上述至少一个长句生成多个候选切分路径;利用上述切分模型计算上述多个候选切分路径中的每一个的得分;以及选择得分最高的候选切分路径作为最优的切分路径。4. 根据权利要求2或3所述的语音翻译方法,其中,上迷切分模型包括多个n元组(n-gram)及其概率。5. 才艮据权利要求1-4中任何一项所述的语音翻译方法,还包括修正上述将上述至少一个长句切分为多个单句的切分结果。6. 根据权利要求5所述的语音翻译方法,其中,上迷修正上述将上述至少一个长句切分为多个单句的切分结果的步骤包括删除或增加上述切分结果中的切分位置。7. 根据权利要求5或6所述的语音翻译方法,还包括根据上述修正后的切分结果更新上述切分模型。8. 根据权利要求7所述的语音翻译方法,其中,上述根据上述修正后的切分结果更新上述切分模型的步骤包括加强上述修正步骤增加的n元组的概率。9. 根据权利要求7所述的语音翻译方法,其中,上述根据上述修正后的切分结果更新上述切分模型的步骤包括减弱上述修正步骤删除的n元组的...
【专利技术属性】
技术研发人员:李剑峰,王海峰,吴华,
申请(专利权)人:株式会社东芝,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。