一种字幕翻译质量检测方法、装置、设备及介质制造方法及图纸

技术编号:32973667 阅读:17 留言:0更新日期:2022-04-09 11:45
本发明专利技术公开了一种字幕翻译质量检测方法、装置、设备及介质,该方法通过通过对双语字幕翻译视频进行语音识别和图像识别,并根据字幕时间线,将语音识别结果和图像识别结果中的原始译文处理为双语句对,接着对语音识别结果进行机器翻译,得到机翻译文,并将机翻译文作为参考译文对原始译文进行质量检测,获取质量评分,当得到的质量评分低于评分阈值,则通过句对修正模型对低于评分阈值的双语句对进行修正处理,直到得到的质量评分不低于评分阈值停止,以完成对字幕翻译质量的检测,提高字幕翻译的质量,保证后续作为语料资源的可靠性。保证后续作为语料资源的可靠性。保证后续作为语料资源的可靠性。

【技术实现步骤摘要】
一种字幕翻译质量检测方法、装置、设备及介质


[0001]本专利技术涉及字幕翻译处理
,具体涉及一种字幕翻译质量检测方法、装置、设备及介质。

技术介绍

[0002]电视电影作为一种重要的文化载体,被越来越多的人喜欢和接受。随着全球化发展,国内越来越多的观众喜欢观看外国电影,尤其是年轻人,国产电影也逐渐走出国门,被全世界认可和喜爱。在观看不同语言的电视电影时,字幕翻译就显得极其重要,高质量的字幕翻译可以为电视电影锦上添花,相反,如果字幕翻译的差强人意则会降低电视电影作品的质量,影响观众的观看体验,也会对后续作为语料资源应用造成严重影响,因此,如何高效检测视频字幕的翻译质量成为一个亟待解决的问题。

技术实现思路

[0003]本专利技术所要解决的技术问题是目前没有对影视作品翻译的字幕进行质量检测方法,无法保证字幕翻译的质量。因此,本专利技术提供一种字幕翻译质量检测方法、装置、设备及介质,以对视频的翻译字幕进行质量检测,保证高质量的视频翻译字幕,并后续作为语料资源提供可靠的基础。
[0004]本专利技术通过下述技术方案实现:
[0005]一种字幕翻译质量检测方法,包括:
[0006]获取双语字幕翻译视频,对所述双语字幕翻译视频进行语音识别和图像识别,得到语音识别结果和图像识别结果;
[0007]从所述图像识别结果中筛选出原始译文,并根据字幕时间线,将语音识别结果和原始译文处理为原始双语句对;
[0008]对原始双语句对进行质量检测,获取质量评分;
[0009]当得到的质量评分低于评分阈值,则通过句对修正模型对低于评分阈值的原始双语句对进行修正处理,得到修正后的双语句对;
[0010]对修正后的双句对再次进行质量检测并获取新的质量评分,当得到的新的质量评分仍低于评分阈值,则将修正后的双语句对作为新的原始双语句对,重复执行通过句对修正模型对低于评分阈值的原始双语句对进行修正处理的步骤,直到得到的质量评分不低于评分阈值停止。
[0011]进一步地,所述从所述图像识别结果中筛选出原始译文,包括:
[0012]对语音识别结果和图像识别结果进行语种识别,将图像识别结果中与语音识别结果的语种不一致的文本内容作为原始译文。
[0013]进一步地,所述对原始双语句对进行质量检测,获取质量评分,包括:
[0014]对原始双语句对中的语音识别结果进行机器翻译,得到机翻译文;
[0015]将机翻译文作为参考译文,采用BLEU算法对原始译文进行质量检测,获取质量评
分。
[0016]进一步地,所述通过句对修正模型对低于评分阈值的原始双语句对进行修正处理,包括:
[0017]通过句对修正模型对原始双语句对中的句子进行合并拆分,并对合并拆分后的原文进行同音字替换、对合并拆分后的原始译文进行形近字替换,得到初始修正后的双语句对;
[0018]基于依存句法对初始修正后的双语句对中的句子进行完整性判断,完成二次修正处理。
[0019]进一步地,所述对原始双语句对中的句子进行合并拆分,包括:
[0020]根据语句停顿标识对原始双语句对中的句子进行合并,并按照意群划分规则原始双语句对中的句子进行拆分。
[0021]进一步地,在重复执行通过句对修正模型对低于评分阈值的原始双语句对进行修正处理的步骤中,所述字幕翻译质量检测方法还包括:
[0022]在重复执行通过句对修正模型对低于评分阈值的原始双语句对进行修正处理的步骤时,若在预设迭代次数内得到的质量评分不低于评分阈值,则在质量评分不低于评分阈值时停止修正;
[0023]在重复执行通过句对修正模型对低于评分阈值的原始双语句对进行修正处理的步骤时,若已经达到预设迭代次数但得到的质量评分仍低于评分阈值,则停止修正并将原始双句对发送给字幕校验人员校验。
[0024]一种字幕翻译质量检测装置,包括:
[0025]翻译视频处理模块,用于获取双语字幕翻译视频,对所述双语字幕翻译视频进行语音识别和图像识别,得到语音识别结果和图像识别结果;
[0026]双语句对获取模块,用于从所述图像识别结果中筛选出原文和原始译文,并根据字幕时间线,将语音识别结果和原始译文处理为原始双语句对;
[0027]一次质量检测模块,用于对原始双语句对进行质量检测,获取质量评分;
[0028]修正处理模块,用于当得到的质量评分低于评分阈值,则通过句对修正模型对低于评分阈值的原始双语句对进行修正处理,得到修正后的双语句对;
[0029]二次质量检测模块,用于对修正后的双句对再次进行质量检测并获取新的质量评分,当得到的新的质量评分仍低于评分阈值,则将修正后的双语句对作为新的原始双语句对,重复执行通过句对修正模型对低于评分阈值的原始双语句对进行修正处理的步骤,直到得到的质量评分不低于评分阈值停止。
[0030]进一步地,所述修正处理模块包括:
[0031]初始修正单元,用于通过句对修正模型对原始双语句对中的句子进行合并拆分,并对合并拆分后的原文进行同音字替换、对合并拆分后的原始译文进行形近字替换,得到初始修正后的双语句对;
[0032]二次修正单元,用于基于依存句法对初始修正后的双语句对中的句子进行完整性判断,完成二次修正处理。
[0033]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述字幕翻译质量检测方
法。
[0034]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述字幕翻译质量检测方法。
[0035]本专利技术提供一种字幕翻译质量检测方法、装置、设备及介质,通过获取双语字幕翻译视频,并对双语字幕翻译视频进行语音识别和图像识别,得到语音识别结果和图像识别结果;从图像识别结果中筛选出原始译文,并根据字幕时间线,将语音识别结果和原始译文处理为原始双语句对,接着对原始双语句对进行质量检测,获取质量评分,当得到的质量评分低于评分阈值,则通过句对修正模型对低于评分阈值的原始双语句对进行修正处理,得到修正后的双语句对;对修正后的双句对再次进行质量检测并获取新的质量评分,当得到的新的质量评分仍低于评分阈值,则将修正后的双语句对作为新的原始双语句对,重复执行通过句对修正模型对低于评分阈值的原始双语句对进行修正处理的步骤,直到得到的质量评分不低于评分阈值停止,以完成对字幕翻译质量的检测,确定字幕翻译的质量,保证后续作为语料资源的可靠性。
附图说明
[0036]此处所说明的附图用来提供对本专利技术实施例的进一步理解,构成本申请的一部分,并不构成对本专利技术实施例的限定。在附图中:
[0037]图1为本专利技术一种字幕翻译质量检测方法的一流程图。
[0038]图2为图1中步骤S40的一具体流程图。
[0039]图3为本专利技术一种字幕翻译质量检测装置的结构示意图。
[0040]图4为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字幕翻译质量检测方法,其特征在于,包括:获取双语字幕翻译视频,对所述双语字幕翻译视频进行语音识别和图像识别,得到语音识别结果和图像识别结果;从所述图像识别结果中筛选出原始译文,并根据字幕时间线,将语音识别结果和原始译文处理为原始双语句对;对原始双语句对进行质量检测,获取质量评分;当得到的质量评分低于评分阈值,则通过句对修正模型对低于评分阈值的原始双语句对进行修正处理,得到修正后的双语句对;对修正后的双句对再次进行质量检测并获取新的质量评分,当得到的新的质量评分仍低于评分阈值,则将修正后的双语句对作为新的原始双语句对,重复执行通过句对修正模型对低于评分阈值的原始双语句对进行修正处理的步骤,直到得到的质量评分不低于评分阈值停止。2.根据权利要求1所述的一种字幕翻译质量检测方法,其特征在于,所述从所述图像识别结果中筛选出原始译文,包括:对语音识别结果和图像识别结果进行语种识别,将图像识别结果中与语音识别结果的语种不一致的文本内容作为原始译文。3.根据权利要求1所述的一种字幕翻译质量检测方法,其特征在于,所述对原始双语句对进行质量检测,获取质量评分,包括:对原始双语句对中的语音识别结果进行机器翻译,得到机翻译文;将机翻译文作为参考译文,采用BLEU算法对原始译文进行质量检测,获取质量评分。4.根据权利要求1所述的一种字幕翻译质量检测方法,其特征在于,所述通过句对修正模型对低于评分阈值的原始双语句对进行修正处理,包括:通过句对修正模型对原始双语句对中的句子进行合并拆分,并对合并拆分后的原文进行同音字替换、对合并拆分后的原始译文进行形近字替换,得到初始修正后的双语句对;基于依存句法对初始修正后的双语句对中的句子进行完整性判断,完成二次修正处理。5.根据权利要求4所述的一种字幕翻译质量检测方法,其特征在于,所述对原始双语句对中的句子进行合并拆分,包括:根据语句停顿标识对原始双语句对中的句子进行合并,并按照意群划分规则原始双语句对中的句子进行拆分。6.根据权利要求1所述的一种字幕翻译质量检测方法,其特征在于,在重复执行通过句对修正模型对低于评分阈值的原始双语句对进行修正处理的步骤中,所述字幕翻译质量检测方...

【专利技术属性】
技术研发人员:廖富林李明张马成
申请(专利权)人:成都优译信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1