为视音频节目实时添加字幕的设备制造技术

技术编号:25231157 阅读:34 留言:0更新日期:2020-08-11 23:18
本申请公开了一种为视音频节目实时添加字幕的设备,涉及智能硬件领域。该设备包括:HDMI IN接口,与视音频内容提供设备连接,配置成接收视音频内容提供设备输出的视音频节目;控制单元,与HDMI IN接口连接,配置成实时将视音频节目的语音转换成文本再生成字幕后,匹配叠加到视音频节目的画面上;HDMI OUT接口,连接控制单元及显示器,配置成输出叠加字幕后的视音频节目的画面给显示器;HDMI BY PASS电路,连接上述两个接口,配置成当设备进入待机状态时,将二者直连使视音频节目直接输出。本申请实现了字幕和视音频画面“一块屏”输出,彻底解决了听障人士无法观看无字幕视音频节目或只能多屏配合收看的痛处。

【技术实现步骤摘要】
为视音频节目实时添加字幕的设备
本申请涉及智能硬件领域,特别是涉及一种为视音频节目实时添加字幕的设备。
技术介绍
在数字有线电视时代,有线电视采用的是电视机+外置机顶盒的方式来实现播放的。在各种类型的视音频节目中,新闻和直播体育赛事等视音频节目均没有字幕,此种情况下聋人无法准确知晓视音频节目内容。根据第二次全国残疾人抽样调查,我国有2057万听力言语残疾人,占残疾人总数的三分之一。每年还新增聋儿3万人,这一群体对直播节目的字幕需求极为迫切。目前,聋人收看无字幕电视节目采用的手段主要是,在手机上打开如讯飞听见、音书等APP,开启语音识别后,APP上就会出现当前播放的电视节目的声音转换后的文本,从而可以进行查看。但是,上述现有技术的缺点显而易见,首先观看者需要同时观看电视屏幕和手机屏幕两块屏,在电视屏幕上观看视频画面,在手机屏幕上观看文本,无法同时顾及,体验非常差。另外,手机APP中转换出来的密密麻麻的大段文本,通常错别字较多,且毫无逻辑,理解起来相当吃力,根本无法与电视上分行显示且断句逻辑清晰的字幕相比,因此,对理解电视节目内容的效果大打折扣,无法满足听障人士获取字幕的现实需求。
技术实现思路
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。本申请提供了一种为视音频节目实时添加字幕的设备,包括:HDMIIN接口,与视音频内容提供设备连接,其配置成接收所述视音频内容提供设备输出的视音频节目;控制单元,与所述HDMIIN接口连接,其配置成使用语音识别引擎实时将所述视音频节目的语音转换成文本,采用分词算法将所述文本生成字幕,将所述字幕匹配且叠加到所述视音频节目的画面上;HDMIOUT接口,分别连接所述控制单元以及显示器,其配置成输出叠加字幕后的视音频节目的画面给所述显示器;HDMIBYPASS电路,分别连接所述HDMIIN接口和所述HDMIOUT接口,其配置成当所述设备进入待机状态时,将所述HDMIIN接口和所述HDMIOUT接口直通连接,使所述HDMIOUT接口直接输出所述HDMIIN接口接收到的视音频节目。可选的,所述控制单元包括:字幕模块,其配置成采用分词算法对所述文本进行分词、分句和分行处理后得到字幕。可选的,所述字幕模块具体配置成:采用分词算法对所述文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。可选的,所述字幕模块还配置成:在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复文字。可选的,所述设备还包括:遥控器,与所述设备无线连接,其配置成对字幕的开启和关闭状态进行设置;所述控制单元还配置成:判断所述遥控器当前设置的字幕状态,如果为开启状态,则执行后续生成字幕的流程,如果为关闭状态,则直接输出所述视音频节目至所述HDMIOUT接口。可选的,所述遥控器还配置成:对字幕在画面上的位置进行设置;所述控制单元还配置成:当叠加字幕时,按照所述遥控器设置的字幕位置将所述字幕叠加在所述视音频节目的画面上。可选的,所述控制单元具体配置成:先判断当前设置的显示语种,然后使用语音识别引擎实时将所述视音频节目的语音转换成该语种下的文本。可选的,所述设备还包括:H5接口,与用户终端无线连接,其配置成与用户终端进行通信;所述控制单元还配置成:通过所述H5接口与用户终端进行交互,完成用户的注册、认证、激活和付费服务。可选的,所述控制单元还配置成:给用户终端提供开通服务清单和版本信息的查询和显示服务。可选的,所述控制单元还配置成:给用户终端提供用户信息的编辑和预览服务。本申请提供的上述设备,通过HDMIIN接口接收视音频内容提供设备输出的视音频节目;通过控制单元使用语音识别引擎实时将所述视音频节目的语音转换成文本,采用分词算法将所述文本生成字幕,将所述字幕匹配且叠加到所述视音频节目的画面上;通过HDMIOUT接口输出叠加字幕后的视音频节目的画面给显示器;最终实现了字幕和视音频画面“一块屏”的输出,彻底解决了听障人士无法观看无字幕视音频节目或只能多屏配合收看的痛处。而且,上述设备可以适用于多种生活场景,比如参加会议、接受公共服务等等,极大的保证了听障人士信息获取的及时性、方便性,保障他们收视平等权,在日常社会生活中不再有交流的攀篱。另外,通过HDMIBYPASS电路在所述设备进入待机状态时,将所述HDMIIN接口和所述HDMIOUT接口直通连接,使所述HDMIOUT接口直接输出所述HDMIIN接口接收到的视音频节目;从而在待机状态时无需重新连线或重新设置也能够正常收看视音频节目。进一步地,字幕的状态可以通过遥控器设置,可以根据用户需要随时关闭字幕,不会影响不需要此类辅助字幕的其它家庭成员收看视音频节目,方便了听障人士和正常人士不同需求的使用,使用更灵活。根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。附图说明后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:图1是根据本申请一个实施例的为视音频节目实时添加字幕的设备结构图;图2是根据本申请另一个实施例的为视音频节目实时添加字幕的设备结构图;图3是根据本申请另一个实施例的为视音频节目实时添加字幕的设备应用场景示意图。具体实施方式本专利技术实施例涉及为视音频节目实时添加字幕,其中的视音频节目包括但不限于电视节目或网络视音频节目等等,尤其适用于播出时间固定且无字幕的直播新闻、综艺、体育等节目。对于自带字幕的视音频节目不在本专利技术涉及的范围之内,本专利技术实施例中的视音频节目均是指不配有字幕的视音频节目,下文不再特别声明。本专利技术实施例不仅适用于听障人士,同样也适用于需要静音收视者,或者多语种字幕收视者等等,应用极为广泛。图1是根据本申请一个实施例的为视音频节目实时添加字幕的设备结构图。参见图1,该设备包括:HDMIIN接口11,与视音频内容提供设备连接,其配置成接收视音频内容提供设备输出的视音频节目;控制单元12,与HDMIIN接口连接,其配置成使用语音识别引擎实时将视音频节目的语音转换成文本,采用分词算法将文本生成字幕,将字幕匹配且叠加到视音频节目的画面上;HDMIOUT接口13,分别连接控制单元以及显示器,其配置成输出叠加字幕后的视音频节目的画面给显示器;HDMIBYPASS电路14,分别连接HDMIIN接口和HDMIOUT接口,其配置成当设备进入待机状态时,将HDMIIN接口和HDMIOUT接口直通连接,使HDMIOUT接口直接输出HDM本文档来自技高网...

【技术保护点】
1.一种为视音频节目实时添加字幕的设备,包括:/nHDMIIN接口,与视音频内容提供设备连接,其配置成接收所述视音频内容提供设备输出的视音频节目;/n控制单元,与所述HDMIIN接口连接,其配置成使用语音识别引擎实时将所述视音频节目的语音转换成文本,采用分词算法将所述文本生成字幕,将所述字幕匹配且叠加到所述视音频节目的画面上;/nHDMI OUT接口,分别连接所述控制单元以及显示器,其配置成输出叠加字幕后的视音频节目的画面给所述显示器;/nHDMI BY PASS电路,分别连接所述HDMIIN接口和所述HDMI OUT接口,其配置成当所述设备进入待机状态时,将所述HDMIIN接口和所述HDMI OUT接口直通连接,使所述HDMI OUT接口直接输出所述HDMIIN接口接收到的视音频节目。/n

【技术特征摘要】
1.一种为视音频节目实时添加字幕的设备,包括:
HDMIIN接口,与视音频内容提供设备连接,其配置成接收所述视音频内容提供设备输出的视音频节目;
控制单元,与所述HDMIIN接口连接,其配置成使用语音识别引擎实时将所述视音频节目的语音转换成文本,采用分词算法将所述文本生成字幕,将所述字幕匹配且叠加到所述视音频节目的画面上;
HDMIOUT接口,分别连接所述控制单元以及显示器,其配置成输出叠加字幕后的视音频节目的画面给所述显示器;
HDMIBYPASS电路,分别连接所述HDMIIN接口和所述HDMIOUT接口,其配置成当所述设备进入待机状态时,将所述HDMIIN接口和所述HDMIOUT接口直通连接,使所述HDMIOUT接口直接输出所述HDMIIN接口接收到的视音频节目。


2.根据权利要求1所述的设备,其特征在于,所述控制单元包括:
字幕模块,其配置成采用分词算法对所述文本进行分词、分句和分行处理后得到字幕。


3.根据权利要求2所述的设备,其特征在于,所述字幕模块具体配置成:
采用分词算法对所述文本进行分词,替换其中的特殊标点符号,按照语气间隔进行分句,且对过短语句进行自动拼接,然后进行分行,如果超过每行上限字数则进行切割,最终得到字幕。


4.根据权利要求2所述的设备,其特征在于,所述字幕模块还配置成:
在分行之前,过滤掉背景音乐和歌曲的识别结果,处理病句和错句,过滤重复...

【专利技术属性】
技术研发人员:宣振生
申请(专利权)人:北京甲骨今声科技有限公司宣振生
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1