一种字幕内容的纠错方法和装置制造方法及图纸

技术编号:16432071 阅读:51 留言:0更新日期:2017-10-22 08:33
本发明专利技术实施例公开了一种字幕内容的纠错方法和装置,所述方法包括:提取视频文件中目标字幕条对应的第一文本信息;识别所述目标字幕条的音频信息得到对应的第二文本信息;将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。实现了对字幕内容的智能纠错,解决人工纠错效率低下以及投入成本高的问题。

Error correcting method and device for caption content

The embodiment of the invention discloses an error correction method and apparatus for a caption content, the method comprises the following steps: first extract text information in video file corresponding to a target subtitle; audio information identifying the target subtitle bar second corresponding text information; the first text information and the second text information error correction by text comparison, error correcting output results. The intelligent correction of caption content is realized, and the problem of low efficiency of manual error correction and high input cost is solved.

【技术实现步骤摘要】
一种字幕内容的纠错方法和装置
本专利技术实施例涉及多媒体技术,尤其涉及一种字幕内容的纠错方法和装置。
技术介绍
通常在音视频的字幕制作时,一般是一边看视频或者边听音频,一边录入字幕文本,而录好的字幕文本内容是否与视频中的音频内容相符或对应,影响用户观看视频或收听音频的体验。现有技术中通常是人工去检查,反复核对去发现问题。人工纠错带来的结果是效率地下,投入成本高。
技术实现思路
本专利技术实施例提供一种字幕内容的纠错方法和装置,实现了对字幕内容的智能纠错,解决人工纠错效率低下以及投入成本高的问题。第一方面,本专利技术实施例提供了一种字幕内容的纠错方法,所述方法包括:提取视频文件中目标字幕条对应的第一文本信息;识别所述目标字幕条的音频信息得到对应的第二文本信息;将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。进一步的,所述提取视频文件中目标字幕条的第一文本信息包括:判断当前图像帧是否有字幕,若是,则确定所述字幕条的位置以及所述字幕条的起始帧和终止帧;提取所述字幕条的第一文本信息。进一步的,所述识别所述目标字幕条的音频信息对应的第二文本信息包括:根据所述起始帧和所述终止帧确定时间间隔;根据所述时间间隔解析和切割视频中的音频信息;将解析和切割后的音频信息与预设文本库进行比对,识别所述音频信息对应的第二文本信息。进一步的,所述将所述第一文本信息和所述第二文本信息通过文本比对进行纠错,输出纠错结果包括:将所述第一文本信息和所述第二文本信息以字或词语为单位一一进行比对;记录所述第二文本中与所述第一文本不同的字或词语;将所述字或词语作为纠错结果进行输出。进一步的,所述预设文本库存储在与语音识别模块相连的服务器中。第二方面,本专利技术实施例提供了一种字幕内容的纠错装置,所述装置包括:信息提取模块,用于提取视频文件中目标字幕条对应的第一文本信息;信息识别模块,识别所述目标字幕条的音频信息得到对应的第二文本信息;信息比对模块,用于将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。进一步的,所述信息提取模块具体用于:判断当前图像帧是否有字幕,若是,则确定所述字幕条的位置以及所述字幕条的起始帧和终止帧;提取所述字幕条的第一文本信息。进一步的,所述信息识别模块具体用于:根据所述起始帧和所述终止帧确定时间间隔;根据所述时间间隔解析和切割视频中的音频信息;将解析和切割后的音频信息与预设文本库进行比对,识别所述音频信息对应的第二文本信息。进一步的,所述信息比对模块具体用于:将所述第一文本信息和所述第二文本信息以字或词语为单位一一进行比对;记录所述第二文本中与所述第一文本不同的字或词语;将所述字或词语作为纠错结果进行输出。进一步的,所述预设文本库存储在与语音识别模块相连的服务器中。本专利技术实施例中,提取视频文件中目标字幕条对应的第一文本信息;识别所述目标字幕条的音频信息得到对应的第二文本信息;将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。实现了对字幕内容的智能纠错,解决人工纠错效率低下以及投入成本高的问题。附图说明图1是本专利技术实施例一中的一种字幕内容的纠错方法的流程图;图2是本专利技术实施例二中的一种字幕内容的纠错方法的流程图;图3是本专利技术实施例三中的一种字幕内容的纠错方法的流程图;图4是本专利技术实施例四中的一种字幕内容的纠错装置的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种字幕内容的纠错方法的流程图,本实施例可适用于对字幕内容进行纠错的情况,该方法可以由本专利技术是实施例提供的一种字幕内容的纠错装置来执行,该装置可采用软件和/或硬件的方式实现。参考图1,该方法具体可以包括如下步骤:S110、提取视频文件中目标字幕条对应的第一文本信息。具体的,用户观看视频的过程中,需要结合视频中的字幕信息和用户听到的音频信息来欣赏视频中的画面。通常字幕条位于用户观看画面的整个屏幕的中下部,在视频播放的过程中,会出现多个字幕条,在多个字幕条中根据用户的需求确定至少一个字幕条为目标字幕条,提取视频文件中目标字幕条对应的第一文本信息。其中,第一文本信息与目标字幕条上的字幕一一对应。可选的,利用纹理去噪方法提取目标字幕条对应的第一文本信息。具体过程如下:求存在同一条字幕的多帧图像帧亮度图像的字幕条区域的平均和图像;将平均和图像进行通过最大类间方差法进行分割,生成只有黑白两种颜色连通域的字幕区域图像;对最大类间方差法分割后的图像确定哪种颜色为文字区域;最后剔除非文字噪声。S120、识别所述目标字幕条的音频信息得到对应的第二文本信息。其中,对目标字幕条对应的音频信息进行语音识别,识别结果标记为第二文本信息,其中,第二文本信息与目标字幕条的音频信息相对应。S130、将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。具体的,将第一文本信息与第二文本信息通过文本比对方法进行纠错,可选的,由于第二文本信息为对音频信息进行语音识别获得,可以将第二文本信息作为目标文本信息,将第一文本信息与目标文本信息进行比对。比对结果中,将两个文本信息中不同的部分定义为错误部分,也即,纠错结果,然后输出纠错结果。本专利技术实施例中,提取视频文件中目标字幕条对应的第一文本信息;识别所述目标字幕条的音频信息得到对应的第二文本信息;将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。实现了对字幕内容的智能纠错,解决人工纠错效率低下以及投入成本高的问题。在上述技术方案的基础上,“将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果”具体可以是:将所述第一文本信息和所述第二文本信息以字或词语为单位一一进行比对;记录所述第二文本信息中与所述第一文本信息不同的字或词语;将所述字或词语作为纠错结果进行输出。可选的,在对文本的具体纠错实现方式上,可以将第一文本信息和第二文本信息以字或词语为单位一一进行比对。在一个具体的例子中,词语可以是短词语或者长词语,对具体的词语长度不做具体限定。需要说明的是,词语的长度越短,比对的结果越准确。对比对不同的字或词语进行记录,将记录结果作为进错结果进行输出。实施例二图2为本专利技术实施例二提供的一种字幕内容的纠错方法的流程图,本实施例在上述实施例的基础上,对“提取视频文件中目标字幕条的第一文本信息”进行了优化。参考图2,该方法具体可以包括如下步骤:S210、判断当前图像帧是否有字幕,若是,则执行S220,若否,则返回执行S210。具体的,根据正在播放的视频中确定当前的图像帧,并判断当前的图像帧中行是否有字幕,如果没有字幕,则返回继续判断当前图像帧是否有字幕,直到有字幕出现。S220、确定所述字幕条的位置以及所述字幕条的起始帧和终止帧。具体的,确定字幕条的位置时,首先采集图像帧的亮度图像,生成纹理图,通过垂直纹理图水平投影求差分,先确定水平字幕条的上下边框,再确定水平字幕条的左右边框,从而确定字幕条的水平位置;接着确定垂直字幕条的位置,通过水平纹理图垂直投本文档来自技高网...
一种字幕内容的纠错方法和装置

【技术保护点】
一种字幕内容的纠错方法,其特征在于,包括:提取视频文件中目标字幕条对应的第一文本信息;识别所述目标字幕条的音频信息得到对应的第二文本信息;将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。

【技术特征摘要】
1.一种字幕内容的纠错方法,其特征在于,包括:提取视频文件中目标字幕条对应的第一文本信息;识别所述目标字幕条的音频信息得到对应的第二文本信息;将所述第一文本信息与所述第二文本信息通过文本比对进行纠错,输出纠错结果。2.根据权利要求1所述的方法,其特征在于,所述提取视频文件中目标字幕条的第一文本信息包括:判断当前图像帧是否有字幕,若是,则确定所述字幕条的位置以及所述字幕条的起始帧和终止帧;提取所述字幕条的第一文本信息。3.根据权利要求2所述的方法,其特征在于,所述识别所述目标字幕条的音频信息对应的第二文本信息包括:根据所述起始帧和所述终止帧确定时间间隔;根据所述时间间隔解析和切割视频中的音频信息;将解析和切割后的音频信息与预设文本库进行比对,识别所述音频信息对应的第二文本信息。4.根据权利要求1所述的方法,其特征在于,所述将所述第一文本信息和所述第二文本信息通过文本比对进行纠错,输出纠错结果包括:将所述第一文本信息和所述第二文本信息以字或词语为单位一一进行比对;记录所述第二文本中与所述第一文本不同的字或词语;将所述字或词语作为纠错结果进行输出。5.根据权利要求3所述的方法,其特征在于,所述预设文本库存储在与...

【专利技术属性】
技术研发人员:王金龙
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1