一种字幕叠加方法及装置制造方法及图纸

技术编号：16330268 阅读：22 留言：0更新日期：2017-09-29 21:29

本发明专利技术提供一种字幕叠加方法及装置，应用于字幕叠加终端，该字幕叠加终端包括多个输入接口。所述方法包括：接收分别从多个输入接口输入的TS流信号，将TS流信号的模式转换为指定模式；对转换后的TS流信号进行解码，获得音频流和视频流；对获得的音频流进行滤波处理，获得语音信息；通过语音识别将语音信息转换为文本信息，并根据文本信息生成对应的字幕图片；将视频流和字幕图片进行叠加处理，生成包括字幕的数据流视频文件。该字幕叠加方案可直接对无字幕的电视节目进行自动语音识别，以生成文本信息，并将文本信息转换为字幕图片以与视频流进行叠加生成包含字幕的数据流视频文件，以方便听力障碍人群收看电视节目。

全部详细技术资料下载

【技术实现步骤摘要】
一种字幕叠加方法及装置
本专利技术涉及广播电视
，具体而言，涉及一种字幕叠加方法及装置。
技术介绍
随着科学技术的发展和人们生活水平的提高，视频已经成为人们工作、学习、社交以及休闲娱乐不可替代的重要方式，并且人们对于视频的要求也越来越高。目前，在视频编辑系统中，对于数据流视频文件的字幕的设定及生成的方式各不相同。但是，目前常用的解码器显示的字幕一般都是电视台通过采编系统直接在视频上进行编辑，编辑完成以后给编码器压缩编码再进行传输。所以，接收机解出来的字幕只能是电视台预先编辑好的字幕。如此，部分无字幕的电视节目将不利于听力障碍人群收看。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种字幕叠加方法及装置，以解决上述问题。本专利技术实施例提供一种字幕叠加方法，应用于字幕叠加终端，所述字幕叠加终端包括多个输入接口，所述方法包括：接收分别从所述多个输入接口输入的TS流信号，将所述TS流信号的模式转换为指定模式；对转换后的TS流信号进行解码，获得音频流和视频流；对获得的所述音频流进行滤波处理，获得语音信息；通过语音识别将所述语音信息转换为文本信息，并根据所述文本信息生成对应的字幕图片；将所述视频流和所述字幕图片进行叠加处理，生成包括字幕的数据流视频文件。进一步地，所述转换后的TS流信号包括多套节目的TS流信号，所述方法还包括：接收输入的叠加请求指令以及输入的节目信息；根据接收到的所述节目信息将包含多套节目的TS流信号转换为与所述节目信息对应的TS流信号。进一步地，所述方法还包括：检测解码后的与所述节目信息对应的视频流中是否包含文本信息，若不包含文本信息，则执行...
一种字幕叠加方法及装置

【技术保护点】
一种字幕叠加方法，其特征在于，应用于字幕叠加终端，所述字幕叠加终端包括多个输入接口，所述方法包括：接收分别从所述多个输入接口输入的TS流信号，将所述TS流信号的模式转换为指定模式；对转换后的TS流信号进行解码，获得音频流和视频流；对获得的所述音频流进行滤波处理，获得语音信息；通过语音识别将所述语音信息转换为文本信息，并根据所述文本信息生成对应的字幕图片；将所述视频流和所述字幕图片进行叠加处理，生成包括字幕的数据流视频文件。

【技术特征摘要】
1.一种字幕叠加方法，其特征在于，应用于字幕叠加终端，所述字幕叠加终端包括多个输入接口，所述方法包括：接收分别从所述多个输入接口输入的TS流信号，将所述TS流信号的模式转换为指定模式；对转换后的TS流信号进行解码，获得音频流和视频流；对获得的所述音频流进行滤波处理，获得语音信息；通过语音识别将所述语音信息转换为文本信息，并根据所述文本信息生成对应的字幕图片；将所述视频流和所述字幕图片进行叠加处理，生成包括字幕的数据流视频文件。2.根据权利要求1所述的字幕叠加方法，其特征在于，所述转换后的TS流信号包括多套节目的TS流信号，所述方法还包括：接收输入的叠加请求指令以及输入的节目信息；根据接收到的所述节目信息将包含多套节目的TS流信号转换为与所述节目信息对应的TS流信号。3.根据权利要求2所述的字幕叠加方法，其特征在于，所述方法还包括：检测解码后的与所述节目信息对应的视频流中是否包含文本信息，若不包含文本信息，则执行所述对获得的所述音频流进行滤波处理的步骤。4.根据权利要求1所述的字幕叠加方法，其特征在于，所述通过语音识别将所述语音信息转换为文本信息的步骤，包括：对所述语音信息进行分帧处理，获得多段语音帧；将各帧语音帧进行转换，获得对应的多维向量，其中各所述多维向量分别包含各所述语音帧的内容信息；根据获得的多个所述多维向量，获得所述语音信息对应的文本信息。5.根据权利要求1所述的字幕叠加方法，其特征在于，所述方法还包括：设定一线性递增的参考时钟；根据所述参考时钟将获得的所述音频流中的每个音频数据块和所述视频流中的每个视频数据块打上时间戳；读取所述音频流中的各所述音频数据块和所述视频流中的各所述视频数据块上的时间戳，并参考当前参考时钟上的时间来进行音频输出和视频输出，以使音视频达到同步。6.一种字幕叠加装置，其特征在于，应用于字幕叠加终端，所述字幕叠加终端包括多个输入接口，所述字幕叠加装置包括接收模块、解码模块、滤波处理模块、第一转换模块及叠加处理模块；所述接收模块用于接收分别从所述多个输入接口输...

【专利技术属性】
技术研发人员：牛伟，李俊，
申请(专利权)人：成都德芯数字科技股份有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人