一种数字视频字幕自动翻译方法技术

技术编号:3632638 阅读:324 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种数字视频字幕自动翻译方法,用于将字幕内容翻译成另一种语言,包括:提取用源语言表示的字幕内容,并转换为文本格式;进行语种判别;选择从源语言到目标语言的翻译短语表;根据目标语言的语种类别,提取目标语言的语言模型;将字幕中的语句划分成短语,查找短语在目标语言中的含义;将翻译后的短语按顺序连接,并计算翻译结果的分数;选择分数最高的翻译结果作为字幕中的语句在目标语言中的含义;将翻译后的字幕内容重新转换为传输流接受的格式并输出。本发明专利技术对每个短语保留所有可能的翻译结果,用翻译概率来表示谁的可能性更大,提高了翻译的准确率;对语句作短语切分时考虑所有可能的匹配上的短语切分,使得翻译结果更为全面。

【技术实现步骤摘要】

【技术保护点】
一种数字视频字幕自动翻译方法,所述方法包括以下步骤:1)、从来自所述数字视频源的传输流中提取用源语言表示的字幕内容,并将字幕内容从图像格式转换为文本格式;2)、对转换后的字幕内容进行语种判别,判断所述的源语言为何种语言; 3)、根据源语言的类别和用户设定的所要翻译的目标语言的类别,选择从源语言到目标语言的翻译短语表,所述翻译短语表中包括源语言短语、与源语言短语具有相同含义的目标语言短语,以及所述的源语言短语和所述的目标语言短语间的翻译概率;4)、 根据目标语言的语种类别,提取目标语言的语言模型;5)、将字幕中用源语言表示的语句划分成短语,并根据步骤3)得到的翻译短语表查找短语在目标语言中的含义;在所述的语句划分成短语的过程中,一个语句有不同的划分方法,将所有的划分都列 出;在所述的查找短语在目标语言中的含义时,将短语在目标语言中的所有的含义都列出;6)、从左至右,将短语在目标语言中的含义顺次连接,形成目标译文,将已经连接好的目标译文称为部分翻译,在连接过程中,将部分翻译与下一个可能的短语的 可能译文进行连接,形成新的部分翻译,并计算新的部分翻译的分数;重复上述的连接过程,直到整句话翻译完毕;在上述翻译过程中,覆盖相同源语言部分的部分翻译都保存在同一个堆栈中,每个堆栈只保留分数最高的前N个结果;7)、在存放整句翻 译结果的堆栈中,选择分数最高的翻译结果作为字幕中的语句在目标语言中的含义;8)、将翻译后的字幕内容由文本格式重新转换为传输流接受的格式,并复合到传输流中输出。...

【技术特征摘要】

【专利技术属性】
技术研发人员:钱跃良熊德意刘群
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1