字幕识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：36860941 阅读：22 留言：0更新日期：2023-03-15 18:30

本申请公开了一种字幕识别方法、装置、电子设备及可读存储介质，所述字幕识别方法包括：获取视频数据；检测所述视频数据对应的字幕文件；当未检测到所述视频数据对应的字幕文件时，检测所述视频数据是否具备内置字幕信息；当检测到所述视频数据具备内置字幕信息时，遍历所述视频数据的所有文本框；基于所述文本框以及预设的运动检测算法，识别所述视频数据的字幕。本申请提供的字幕识别方案提高字幕识别的准确率。幕识别的准确率。幕识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
字幕识别方法、装置、电子设备及可读存储介质

[0001]本申请涉及通信领域，具体涉及一种字幕识别方法、装置、电子设备及可读存储介质。

技术介绍

[0002]随着多媒体技术和网络技术的迅速发展，现代计算机技术特别是海量数据存储与传输技术的成熟，视频作为一种主要的媒体类型在人们的生活、教育、娱乐等方面日益成为不可或缺的信息载体。视频文件播放，尤其是对于观看国外影片，字幕成为一个非常重要的部分。
[0003]目前的主流播放器都提供播放视频和在线字幕匹配的功能，但是匹配成功的效率差别很大，直接造成了播放字幕体验很差。造成这种问题的主要原因是，没有足够丰富的字幕文件与视频文件对应关系能够被播放客户端使用，从而导致播放匹配的命中率不高。

技术实现思路

[0004]针对上述技术问题，本申请提供一种字幕识别方法、装置、电子设备及可读存储介质，可以提高字幕识别的准确率。
[0005]为解决上述技术问题，本申请提供一种字幕识别方法，包括：获取视频数据；检测所述视频数据对应的字幕文件；当未检测到所述视频数据对应的字幕文件时，检测所述视频数据是否具备内置字幕信息；当检测到所述视频数据具备内置字幕信息时，遍历所述视频数据的所有文本框；基于所述文本框以及预设的运动检测算法，识别所述视频数据的字幕。
[0006]可选的，在本申请的一些实施例中，所述基于所述文本框以及预设的运动检测算法，识别所述视频数据的字幕，包括：获取所述视频数据的分辨率；基于所述分辨率，构建初始矩阵；根据所述文本框、初始矩阵以及预设的运动...

【技术保护点】

【技术特征摘要】
1.一种字幕识别方法，其特征在于，包括：获取视频数据；检测所述视频数据对应的字幕文件；当未检测到所述视频数据对应的字幕文件时，检测所述视频数据是否具备内置字幕信息；当检测到所述视频数据具备内置字幕信息时，遍历所述视频数据的所有文本框；基于所述文本框以及预设的运动检测算法，识别所述视频数据的字幕。2.根据权利要求1所述的方法，其特征在于，所述基于所述文本框以及预设的运动检测算法，识别所述视频数据的字幕，包括：获取所述视频数据的分辨率；基于所述分辨率，构建初始矩阵；根据所述文本框、初始矩阵以及预设的运动检测算法，识别所述视频数据的字幕。3.根据权利要求2所述的方法，其特征在于，所述根据所述文本框、初始矩阵以及预设的运动检测算法，识别所述视频数据的字幕，包括：基于预设的运动检测算法，计算所述文本框的运动矢量；将当前处理的文本框确定为当前处理对象；计算所述当前处理对象与所述文本框之间的交并比；基于所述交并比、初始矩阵以及运动矢量，识别所述视频数据的字幕。4.根据权利要求3所述的方法，其特征在于，所述基于所述交并比、初始矩阵以及运动矢量，识别所述视频数据的字幕，包括：基于所述交并比对所述文本框进行更新；根据所述初始矩阵以及运动矢量，对更新后文本框进行滤除处理；将处理后文本框的字幕确定为所述视频数据的字幕。5.根据权利要求2所述的方法，其特征在于，所述当未检测到所述视频数据对应的字幕文件时，检测所述视频数据是否具备内置字幕信息，...

【专利技术属性】
技术研发人员：刘艳鑫，
申请(专利权)人：北京探境科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人