基于同步翻译的新闻直播字幕在线制作系统技术方案

技术编号:14454787 阅读:134 留言:0更新日期:2017-01-19 02:34
本发明专利技术公开了一种基于同步翻译的新闻直播字幕在线制作系统,包括相互连接的现场采集单元和流媒体服务器,流媒体服务器分别连接语音处理单元和字幕制作单元,语音处理单元连接文字翻译单元,文字翻译单元连接字幕制作单元,字幕制作单元连接视频播放客户端,本发明专利技术通过现场采集单元采集新闻现场的音视频信息,通过语音处理单元识别语音信息,通过文字翻译单元进行翻译,通过字幕制作单元制作双语字幕,并嵌入直播视频流内同步输出,通过视频播放客户端向用户播放,实现新闻直播字幕的在线制作,对新闻内容进行实时翻译,方便来自世界各地的观众第一时间观看到新闻并理解新闻的内容,提高了新闻直播的实时性,突破了新闻直播语言的地域性。

【技术实现步骤摘要】

本专利技术属于语音识别
,涉及一种新闻直播字幕在线制作系统,具体是一种基于同步翻译的新闻直播字幕在线制作系统。
技术介绍
新闻直播,指不经过预先录音或者录像将事件现场情况、演播室播讲或表演同步播出的广播电视传播形式。视频新闻直播一般通过流媒体服务器向用户在线直播新闻,用户通过客户端观看视频新闻,但是,由于新闻直播是同步播出的,无法预先进行翻译,不同国家的用户因为语言问题无法快速理解新闻的内容,限制了新闻直播的地域性,若采用人工进行翻译,对翻译人员的要求很高,并且受到翻译人员翻译水平限制,很大程度影响了新闻直播的实时性。
技术实现思路
本专利技术的目的在于提供一种操作简单、使用方便的基于同步翻译的新闻直播字幕在线制作系统。本专利技术的目的可以通过以下技术方案实现:基于同步翻译的新闻直播字幕在线制作系统,包括相互连接的现场采集单元和流媒体服务器,所述的流媒体服务器分别连接语音处理单元和字幕制作单元,所述的语音处理单元连接文字翻译单元,所述的文字翻译单元连接字幕制作单元,所述的字幕制作单元连接视频播放客户端;所述的语音处理单元包括语音识别模块,用于对流媒体服务器输出音频流的语音进行识别,判断语言种类,生成语音识别数据;语义理解模块,用于对语音识别模块生成的语音识别数据进行语义理解,生成语义理解数据;以及文字转写模块,将语音识别数据和语义理解数据转写为对应的识别文字流和语义文字流;所述的文字翻译单元包括语言选择模块,用于选择语言种类;和翻译模块,根据语言选择模块选择的语言种类,将文字转写模块输出的语义文字流翻译为对应语言的翻译文字流;所述的字幕制作单元包括信息接收模块,用于接收流媒体服务器输出的音频流和视频流,语音处理单元输出的识别文字流,以及文字翻译单元输出的翻译文字流;字幕调整模块,用于将识别文字流和翻译文字流合并制作成双语字幕流,调整字幕的字体、颜色和大小;字幕嵌入模块,用于将字幕流嵌入视频流内,生成带字幕的视频;数据同步模块,用于将字幕流与视频流以及音频流进行同步输出。进一步地,所述的现场采集单元包括视频采集模块,采用高清摄像机,用于记录直播现场的视频图像信息的;语音采集模块,采用高清麦克风,用于采集直播现场的语音信息;以及声音处理模块,用于对语音采集模块采集到的语音信息进行处理,过滤语音信息中的杂音。本专利技术的有益效果:本专利技术提供的新闻直播字幕在线制作系统,通过现场采集单元采集新闻现场的音视频信息,以流式协议输出视频流和音频流,通过语音识别单元识别音频流的语音,输出识别文字流和语义文字流,通过文字翻译单元对语义文字流进行翻译,输出翻译文字流,通过字幕制作单元制作双语字幕,并嵌入直播视频流内同步输出,通过视频播放客户端向用户播放,实现新闻直播字幕的在线制作,对新闻内容进行实时翻译,方便来自世界各地的观众第一时间观看到新闻并理解新闻的内容,提高了新闻直播的实时性,突破了新闻直播语言的地域性。附图说明下面结合附图和具体实施例对本专利技术作进一步详细描述。图1是本专利技术的系统示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。如图1所示,一种基于同步翻译的新闻直播字幕在线制作系统,包括现场采集单元、流媒体服务器、语音识别单元、文字翻译单元、字幕制作单元以及视频播放客户端,现场采集单元连接流媒体服务器,流媒体服务器分别连接语音处理单元和字幕制作单元,语音处理单元连接文字翻译单元,文字翻译单元连接字幕制作单元,字幕制作单元连接视频播放客户端。现场采集单元包括视频采集模块、语音采集模块和声音处理模块。视频采集模块,采用高清摄像机,用于记录直播现场的视频图像信息的。语音采集模块,采用高清麦克风,用于采集直播现场的语音信息。声音处理模块,用于对语音采集模块采集到的语音信息进行处理,过滤语音信息中的杂音;其中,杂音指直播现场除主持人声音外的其他环境噪音。流媒体服务器,接收到现场采集单元输出的实时音视频信号,并以流式协议(RTP/RTSP、MMS、RTMP等)进行直播,输出视频流和音频流。语音处理单元包括语音识别模块、语义理解模块和文字转写模块。语音识别模块,用于对流媒体服务器输出音频流的语音进行识别,判断语言种类,生成语音识别数据;其中,语言种类包括汉语、英语、日语、韩语、俄语、西班牙语、意大利语、葡萄牙语、德语、法语。语义理解模块,用于对语音识别模块生成的语音识别数据进行语义理解,生成语义理解数据。文字转写模块,将语音识别数据和语义理解数据转写为对应的识别文字流和语义文字流。文字翻译单元包括语言选择模块和翻译模块。语言选择模块,用于选择语言种类。翻译模块,根据语言选择模块选择的语言种类,将文字转写模块输出的语义文字流翻译为对应语言的翻译文字流。字幕制作单元包括信息接收模块、字幕调整模块、字幕嵌入模块以及数据同步模块。信息接收模块,用于接收流媒体服务器输出的音频流和视频流,语音处理单元输出的识别文字流,以及文字翻译单元输出的翻译文字流。字幕调整模块,用于将识别文字流和翻译文字流合并制作成双语字幕流,调整字幕的字体、颜色和大小。字幕嵌入模块,用于将字幕流嵌入视频流内,生成带字幕的视频。数据同步模块,用于将字幕流与视频流以及音频流进行同步输出。视频播放客户端,用于向用户现场直播字幕制作单元输出的带字幕的新闻视频。本专利技术工作流程:首先,视频采集模块记录直播现场的视频图像信息,语音采集模块采集直播现场的语音信息并通过声音处理模块过滤语音信息中的杂音,流媒体服务器接收到现场采集单元输出的实时音视频信号,并以流式协议进行直播,输出视频流和音频流。语音识别模块对音频流的语音进行识别,判断语言种类,生成语音识别数据,语义理解模块对语音识别数据进行语义理解,生成语义理解数据,通过文字转写模块将语音识别数据和语义理解数据转写为对应的识别文字流和语义文字流。然后,通过语言选择模块选择语言种类,翻译模块根据语言种类将语义文字流翻译为对应语言的翻译文字流;字幕调整模块将识别文字流和翻译文字流合并制作成双语字幕流,并调整字幕的字体、颜色和大小,字幕嵌入模块将字幕流嵌入视频流内,生成带字幕的视频,通过数据同步模块将字幕流与视频流以及音频流进行同步输出,再通过视频播放客户端向用户现场直播带字幕的新闻视频。本专利技术提供的新闻直播字幕在线制作系统,通过现场采集单元采集新闻现场的音视频信息,以流式协议输出视频流和音频流,通过语音识别单元识别音频流的语音,输出识别文字流和语义文字流,通过文字翻译单元对语义文字流进行翻译,输出翻译文字流,通过字幕制作单元制作双语字幕,并嵌入直播视频流内同步输出,通过视频播放客户端向用户播放,实现新闻直播字幕的在线制作,对新闻内容进行实时翻译,方便来自世界各地的观众第一时间观看到新闻并理解新闻的内容,提高了新闻直播的实时性,突破了新闻直播语言的地域性。为了描述的方便,描述以上装置时以功能分为各种单元、模块分别描述。当然,在实施本申请时可以把各单元、模块的功能在同一个或多个软件和/或硬件中实现。通过以上的实本文档来自技高网...

【技术保护点】
基于同步翻译的新闻直播字幕在线制作系统,其特征在于:包括相互连接的现场采集单元和流媒体服务器,所述的流媒体服务器分别连接语音处理单元和字幕制作单元,所述的语音处理单元连接文字翻译单元,所述的文字翻译单元连接字幕制作单元,所述的字幕制作单元连接视频播放客户端;所述的语音处理单元包括语音识别模块,用于对流媒体服务器输出音频流的语音进行识别,判断语言种类,生成语音识别数据;语义理解模块,用于对语音识别模块生成的语音识别数据进行语义理解,生成语义理解数据;以及文字转写模块,将语音识别数据和语义理解数据转写为对应的识别文字流和语义文字流;所述的文字翻译单元包括语言选择模块,用于选择语言种类;和翻译模块,根据语言选择模块选择的语言种类,将文字转写模块输出的语义文字流翻译为对应语言的翻译文字流;所述的字幕制作单元包括信息接收模块,用于接收流媒体服务器输出的音频流和视频流,语音处理单元输出的识别文字流,以及文字翻译单元输出的翻译文字流;字幕调整模块,用于将识别文字流和翻译文字流合并制作成双语字幕流,调整字幕的字体、颜色和大小;字幕嵌入模块,用于将字幕流嵌入视频流内,生成带字幕的视频;数据同步模块,用于将字幕流与视频流以及音频流进行同步输出。...

【技术特征摘要】
1.基于同步翻译的新闻直播字幕在线制作系统,其特征在于:包括相互连接的现场采集单元和流媒体服务器,所述的流媒体服务器分别连接语音处理单元和字幕制作单元,所述的语音处理单元连接文字翻译单元,所述的文字翻译单元连接字幕制作单元,所述的字幕制作单元连接视频播放客户端;所述的语音处理单元包括语音识别模块,用于对流媒体服务器输出音频流的语音进行识别,判断语言种类,生成语音识别数据;语义理解模块,用于对语音识别模块生成的语音识别数据进行语义理解,生成语义理解数据;以及文字转写模块,将语音识别数据和语义理解数据转写为对应的识别文字流和语义文字流;所述的文字翻译单元包括语言选择模块,用于选择语言种类;和翻译模块,根据语言选择模块选择的语言种类,将文字转写模块输出的语义文字流翻译为对...

【专利技术属性】
技术研发人员:虞焰兴
申请(专利权)人:安徽声讯信息技术有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1