一种视频字幕关键词识别方法及装置制造方法及图纸

技术编号：21433057 阅读：37 留言：0更新日期：2019-06-22 12:10

本发明专利技术公开一种视频字幕关键词识别方法及装置，该方法包括：从视频数据中提取视频关键帧；获取视频关键帧对应的文本行图像；识别文本行图像中包括的所有文字字符；根据预设的关键词库，从所有文字字符中提取关键词。本发明专利技术从视频数据中提取了视频关键帧，基于深度神经网络对视频关键帧进行处理，去除视频复杂背景中的噪声影响，从视频关键帧中获取对应的文本行图像，基于文本行图像实现视频复杂背景中的文字检测、识别及关键词提取，提高了视频字幕识别及关键词提取的效率及准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频字幕关键词识别方法及装置
本专利技术属于图像识别
，具体涉及一种视频字幕关键词识别方法及装置。
技术介绍
文字包含着丰富准确的语义信息，可传达人类的思想和情感。文字识别是智能视觉识别技术中的一个重要技术，在很多领域得到了广泛地研究及应用。其中，视频字幕识别就是文字识别技术在视频数据处理领域的应用。目前，相关技术中提供了一种视频字幕识别的方法，从视频帧中分割出文字图像区域，从文字图像区域中分离出单个文字，识别单个文字，将识别出的多个单个文字连接起来。但上述相关技术需要切割单个文字进行识别，识别效率很低。
技术实现思路
为解决上述问题，本专利技术提供一种视频字幕关键词识别方法及装置，基于深度神经网络对视频关键帧进行处理，去除视频复杂背景中的噪声影响，提高了视频字幕识别及关键词提取的效率及准确性。本专利技术通过以下几个方面来解决以上问题：第一方面，本专利技术实施例提供了一种视频字幕关键词识别方法，所述方法包括：从视频数据中提取视频关键帧；获取所述视频关键帧对应的文本行图像；识别所述文本行图像中包括的所有文字字符；根据预设的关键词库，从所述所有文字字符中提取关键...

【技术保护点】
1.一种视频字幕关键词识别方法，其特征在于，所述方法包括：从视频数据中提取视频关键帧；获取所述视频关键帧对应的文本行图像；识别所述文本行图像中包括的所有文字字符；根据预设的关键词库，从所述所有文字字符中提取关键词。

【技术特征摘要】
1.一种视频字幕关键词识别方法，其特征在于，所述方法包括：从视频数据中提取视频关键帧；获取所述视频关键帧对应的文本行图像；识别所述文本行图像中包括的所有文字字符；根据预设的关键词库，从所述所有文字字符中提取关键词。2.根据权利要求1所述的方法，其特征在于，所述从视频数据中提取视频关键帧，包括：每隔预设时长从所述视频数据中提取一帧图像；将提取的当前帧图像与上一帧图像进行灰度值差值运算，得到所述当前帧图像对应的差值矩阵；根据所述差值矩阵包括的非零像素值，计算判定阈值；根据所述差值矩阵及所述判定阈值，确定所述当前帧图像是否为视频关键帧。3.根据权利要求2所述的方法，其特征在于，所述根据所述差值矩阵包括的非零像素值，计算判定阈值，包括：计算所述差值矩阵包括的所有非零像素值的平均值及方差；确定所述差值矩阵中像素值大于所述平均值的非零像素值的第一数量，及像素值大于所述方差的非零像素值的第二数量；根据所述第一数量和所述第二数量，计算判定阈值。4.根据权利要求2所述的方法，其特征在于，所述根据所述差值矩阵及所述判定阈值，确定所述当前帧图像是否为视频关键帧，包括：统计所述差值矩阵包括的非零像素值的数量；若所述非零像素值的数量大于所述判定阈值，则将所述当前帧图像确定为视频关键帧。5.根据权利要求1所述的方法，其特征在于，所述获取所述视频关键帧对应的文本行图像，包括：通过预设的卷积神经网络对所述视频关键帧进行特征提取，得到所述视频关键帧对应的特征图；识别所述特征图中包括的各个文本框；根据所述各个文本框，获取所述视频关键帧对应的文本行图像。6.根据权利要求5所述的方法，其特征在于，所述识别所述特征图中包括的各个文本...

【专利技术属性】
技术研发人员：熊荔，张峰，王子玮，
申请(专利权)人：中国电子科技集团公司信息科学研究院，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人