为视音频节目实时添加字幕的方法和装置制造方法及图纸

技术编号：25315717 阅读：25 留言：0更新日期：2020-08-18 22:32

本申请公开了一种为视音频节目实时添加字幕的方法和装置，涉及辅助字幕领域。该方法包括：获取视音频节目；使用语音识别引擎实时将所述视音频节目的语音转换成文本；采用分词算法将所述文本生成字幕；将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。该装置包括：获取模块、识别模块、字幕模块和匹配模块。本发明专利技术实现了字幕和视音频画面“一块屏”的输出，彻底解决了听障人士无法观看无字幕视音频节目或只能多屏配合收看的痛处。

全部详细技术资料下载

【技术实现步骤摘要】
为视音频节目实时添加字幕的方法和装置
本申请涉及辅助字幕领域，特别是涉及一种为视音频节目实时添加字幕的方法和装置。
技术介绍
在数字有线电视时代，有线电视采用的是电视机+外置机顶盒的方式来实现播放的。在各种类型的视音频节目中，新闻和直播体育赛事等视音频节目均没有字幕，此种情况下聋人无法准确知晓视音频节目内容。根据第二次全国残疾人抽样调查，我国有2057万听力言语残疾人，占残疾人总数的三分之一。每年还新增聋儿3万人，这一群体对直播节目的字幕需求极为迫切。目前，聋人收看无字幕电视节目采用的手段主要是，在手机上打开如讯飞听见、音书等APP，开启语音识别后，APP上就会出现当前播放的电视节目的声音转换后的文本，从而可以进行查看。但是，上述现有技术的缺点显而易见，首先观看者需要同时观看电视屏幕和手机屏幕两块屏，在电视屏幕上观看视频画面，在手机屏幕上观看文本，无法同时顾及，体验非常差。另外，手机APP中转换出来的密密麻麻的大段文本，通常错别字较多，且毫无逻辑，理解起来相当吃力，根本无法与电视上分行显示且断句逻辑清晰的字幕相比，因此，对理解电视节目内容的效果大打折扣，无法满足听障人士获取字幕的现实需求。
技术实现思路
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。根据本申请的一个方面，提供了一种为视音频节目实时添加字幕的方法，包括：获取视音频节目；使用语音识别引擎实时将所述视音频节目的语音转换成文本；采用分词算法将所述文本生成字幕；将生...

【技术保护点】
1.一种为视音频节目实时添加字幕的方法，包括：/n获取视音频节目；/n使用语音识别引擎实时将所述视音频节目的语音转换成文本；/n采用分词算法将所述文本生成字幕；/n将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。/n

【技术特征摘要】
1.一种为视音频节目实时添加字幕的方法，包括：
获取视音频节目；
使用语音识别引擎实时将所述视音频节目的语音转换成文本；
采用分词算法将所述文本生成字幕；
将生成的所述字幕匹配且叠加到所述视音频节目的画面上输出。

2.根据权利要求1所述的方法，其特征在于，采用分词算法将所述文本生成字幕，包括：
采用分词算法对所述文本进行分词、分句和分行处理后得到字幕。

3.根据权利要求2所述的方法，其特征在于，采用分词算法对所述文本进行分词、分句和分行处理后得到字幕，包括：
采用分词算法对所述文本进行分词，替换其中的特殊标点符号，按照语气间隔进行分句，且对过短语句进行自动拼接，然后进行分行，如果超过每行上限字数则进行切割，最终得到字幕。

4.根据权利要求2所述的方法，其特征在于，所述方法还包括：
在分行之前，过滤掉背景音乐和歌曲的识别结果，处理病句和错句，过滤重复文字。

5.根据权利要求1-4中任一项所述的方法，其特征在于，所述方法还包括：
获取视音频节目之后，判断当前设置的字幕状态，如果为开启状态，则执行后续生成字幕及输出的流程，如果为关闭状态，则直接输出所述视音频节目。

6.一种为视音频节目实时添加...

【专利技术属性】
技术研发人员：宣振生，
申请(专利权)人：北京甲骨今声科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人