直播字幕添加方法、装置及设备制造方法及图纸

技术编号：37842824 阅读：23 留言：0更新日期：2023-06-14 09:47

本发明专利技术实施例涉及音视频技术领域，公开了一种体育直播字幕方法、装置及设备，该方法包括：将从直播流中提取的待转写音频实时进行文本转写，得到第一文本；所述第一文本中包括字幕时间戳；对所述第一文本进行纠错，得到第二文本；所述对所述第一文本进行纠错，包括根据预设的图谱热词对所述第一文本进行纠错；所述预设的图谱热词为根据预设的知识图谱及所述直播流对应的直播信息确定；据所述第二文本生成带有字幕时间戳的第一字幕；根据所述字幕时间戳将所述第一字幕添加至所述直播流中。通过上述方式，本发明专利技术实施例通过预设的图谱热词，使最后得到的直播字幕在垂直场景下准确率有效提高，提高用户的观看体验。提高用户的观看体验。提高用户的观看体验。

全部详细技术资料下载

【技术实现步骤摘要】
直播字幕添加方法、装置及设备

[0001]本专利技术实施例涉及音视频
，具体涉及一种直播字幕添加方法、装置及设备。

技术介绍

[0002]目前实现字幕添加主要是针对离线文件字幕及会议字幕，尚没有在视频直播的成熟应用，本申请的专利技术人发现，现有方案在垂直场景例如赛事直播场景下准确率较低，存在同音字识别不准、无法准确识别人名及专业术语以及时间轴不对齐等一系列问题。

技术实现思路

[0003]鉴于上述问题，本专利技术实施例提供了一种直播字幕添加方法、装置及设备，用于解决现有技术中存在的字幕添加方案在垂直场景下准确率较低的问题。
[0004]根据本专利技术实施例的一个方面，提供了一种直播字幕添加方法，所述方法包括：
[0005]将从直播流中提取的待转写音频实时进行文本转写，得到第一文本；所述第一文本中包括字幕时间戳；
[0006]对所述第一文本进行纠错，得到第二文本；所述对所述第一文本进行纠错，包括根据预设的图谱热词对所述第一文本进行纠错；所述预设的图谱热词为根据预设的知识图谱及所述直播流对应的直播信息确定；
[0007]据所述第二文本生成带有字幕时间戳的第一字幕；
[0008]根据所述字幕时间戳将所述第一字幕添加至所述直播流中。
[0009]在一种可选的方式中，所述根据所述字幕时间戳将所述第一字幕添加至所述直播流中，包括：
[0010]根据所述字幕时间戳与所述直播流时间戳，对所述第一字幕及所述直播流进行对齐处理，得到对齐信息；
[001...

【技术保护点】

【技术特征摘要】
1.一种直播字幕添加方法，其特征在于，所述方法包括：将从直播流中提取的待转写音频实时进行文本转写，得到第一文本；所述第一文本中包括字幕时间戳；对所述第一文本进行纠错，得到第二文本；所述对所述第一文本进行纠错，包括根据预设的图谱热词对所述第一文本进行纠错；所述预设的图谱热词为根据预设的知识图谱及所述直播流对应的直播信息确定；据所述第二文本生成带有字幕时间戳的第一字幕；根据所述字幕时间戳将所述第一字幕添加至所述直播流中。2.根据权利要求1所述的方法，其特征在于，所述根据所述字幕时间戳将所述第一字幕添加至所述直播流中，包括：根据所述字幕时间戳与所述直播流时间戳，对所述第一字幕及所述直播流进行对齐处理，得到对齐信息；根据所述对齐信息，将所述第一字幕添加至所述直播流中。3.根据权利要求2所述的方法，其特征在于，所述根据所述字幕时间戳与所述直播流时间戳，对所述第一字幕及所述直播流进行对齐处理，得到对齐信息，还包括：确定所述直播流是否发生网络抖动；当发生网络抖动时，获取新的直播流时间戳；根据所述字幕时间戳与所述新的直播流时间戳，对所述第一字幕及所述直播流进行对齐处理，得到对齐信息。4.根据权利要求3所述的方法，其特征在于，所述对所述第一字幕及所述直播流进行对齐处理，得到对齐信息之后，所述方法还包括：根据所述对齐信息，将所述第一字幕插入到TS流中的SEI，得到TS流字幕；将所述TS流字幕添加至所述直播流中。5.根据权利要求4所述的方法，其特征在于，所述将所述TS流字幕添加至所述直播流中之后，所述方法还包括：将添加了TS流字幕的直播流推送至CDN；从CDN获取并分离所述添...

【专利技术属性】
技术研发人员：周效军，相迎迎，陆彦良，宋国栋，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人