【技术实现步骤摘要】
本专利技术涉及,其执行语音识别、机器翻译和语音合成,从而将第一语言的输入语音翻译成第二语言的输出语音。
技术介绍
至今已开发的任何语音翻译装置都执行三个步骤,即语音识别、机器翻译和语音合成,从而将第一语言的输入语音翻译成第二语言的输出语音。也就是说,其执行:步骤(a),识别第一语言的输入语音,生成第一语言的文本;步骤(b),对第一语言的文本进行机器翻译,生成第二语言的文本;以及步骤(c),对第二语言的文本执行语音合成,生成第二语言的输出语音。 输入语音不仅包含由文本表示的语言信息,而且包括所谓的副语言(paralinguistic)信息。副语言信息是显示说话人的重点、强度和态度的韵律信息。副语言信息不能由文本表示,并将在识别输入语音的过程中丢失。不可避免地,传统的语音翻译装置很难生成反映副语言信息的输出语音。 JP-A H6-332494(公开号)公开了一种语音翻译装置,其分析输入语音,从输入语音中提取带有重音的词,并将重音添加到输出语音中与从输入语音中提取的词等同的那些词上。JP-A 2001-117922(公开号)公开了一种语音翻译装置,其生成翻译 ...
【技术保护点】
一种语音翻译装置,包括: 语音识别单元,用于识别第一语言的输入语音以生成所述第一语言的第一文本; 韵律分析单元,用于分析所述输入语音的韵律以获得原始韵律信息; 第一语言-分析单元,用于将所述第一文本分割成第一组词以获得第一语言信息; 第一生成单元,用于基于所述第一语言信息生成第一合成韵律信息; 提取单元,用于比较所述原始韵律信息和所述第一合成韵律信息以提取关于所述第一组词的每一个的副语言信息; 机器翻译单元,用于将所述第一文本翻译成第二语言的第二文本; 第二语言-分析单元,用于将所述第二文本分割成第二组词以获得第二语言信息; 映射单元,用于根据同义性将关于所述第一组词的每一 ...
【技术特征摘要】
JP 2007-8-21 214956/20071.一种语音翻译装置,包括语音识别单元,用于识别第一语言的输入语音以生成所述第一语言的第一文本;韵律分析单元,用于分析所述输入语音的韵律以获得原始韵律信息;第一语言-分析单元,用于将所述第一文本分割成第一组词以获得第一语言信息;第一生成单元,用于基于所述第一语言信息生成第一合成韵律信息;提取单元,用于比较所述原始韵律信息和所述第一合成韵律信息以提取关于所述第一组词的每一个的副语言信息;机器翻译单元,用于将所述第一文本翻译成第二语言的第二文本;第二语言-分析单元,用于将所述第二文本分割成第二组词以获得第二语言信息;映射单元,用于根据同义性将关于所述第一组词的每一个的副语言信息分配给所述第二组词的每一个;第二生成单元,用于基于所述第二语言信息和分配给所述第二组词的每一个的副语言信息生成第二合成韵律信息;以及语音合成单元,用于基于所述第二语言信息和所述第二合成韵律信息合成输出语音。2.如权利要求1所述的装置,其中,所述提取单元对所述原始韵律信息进行归一化以对所述第一组词的每一个计算第一特征量,对所述第一合成韵律信息进行归一化以对所述第一组词的每一个计算第二特征量,并比较所述第一特征量和所述第二特征量,以提取关于所述第一组词的每一个的副语言信息。3.如权利要求1所述的装置,其中,所述提取单元对所述原始韵律信息进行归一化以对所述第一组词的每一个计算第一特征量,对所述第一合成韵律信息进行归一化以对所述第一组词的每一个计算第二特征量,并比较所述第一特征量和所述第二特征量,以提取关于所述第一组词的每一个的副语言信息;所述第二生成单元基于所述第二语言信息生成第三合成韵律信息,对所述第三合成韵律信息进行归一化以对所述第二组词的每一个计算第三特征量,基于所述副语言信息校正所述第三特征量以计算第四特征量,并使用所述第四特征量以生成所述第二合成韵律信息。4.如权利要求3所述的装置,其中,所述副语言信息是通过从所述第一特征量中减去所述第二特征量而获得的值,所述第四特征量是通过将所述副语言信息加到所述第三特征量而获得的值。5.如权利要求4所述的装置,其中,所述映射单元只在所述副语言信息是正值时将所述副语言信息分配给所述第二组词的每一个。6.如权利要求3所述的装置,其中,所述第一特征量是所述第一组词的每一个的原始韵律信息的基频的峰值与线性回归值的比率;所述第二特征量是所述第一组词的每一个的第一合成韵律信息的基频的峰值与线性回...
【专利技术属性】
技术研发人员:徐大威,笼岛岳彦,
申请(专利权)人:株式会社东芝,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。