一种基于深度学习的视频分段方法、系统、终端及介质技术方案

技术编号：30230589 阅读：19 留言：0更新日期：2021-09-29 10:02

本发明专利技术公开了一种基于深度学习的视频分段方法，包括以下步骤：获取待处理的视频数据，从视频数据中获取音频数据；将所述音频数据转化为文本信息，对文本信息进行预处理和文本向量化，得到词向量；将词向量输入训练好的文本分类模型进行文本分类，输出识别的文本类别；将识别的文本类别与预设的视频分段中的文本类别进行对比；根据符合分段的文本类别对视频数据进行分段。该方法通过将视频中的语音数据转化为文本信息，将文本信息输入文本分类模型中进行预测，输出文本类别，并将输出的文本类别与可视频分段的文本类别进行对比，根据符合分段的文本类别对视频数据进行分段，通过这种方式能快速、准确地对视频分段，提高视频分段的准确性。的准确性。的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的视频分段方法、系统、终端及介质

[0001]本专利技术涉及视频处理
，具体涉及一种基于深度学习的视频分段方法、系统、终端及介质。

技术介绍

[0002]随着网络的迅速发展，在线教育成为学生学习知识的重要途径，各种课程中的历程可以记录成不同的资料形态，而要把课程中的历程记录下来最简单的方式就是存储成课程视频。对课程视频进行分析，不仅可以了解教师的教学质量也可以了解学生的学习情况。为了方便观看视频，可以将完整的视频划分为多个分段，便于直接观看感兴趣的分段。

技术实现思路

[0003]针对现有技术中的缺陷，本专利技术实施例提供一种基于深度学习的视频分段方法及系统，能快速、准确地对视频进行分段。
[0004]第一方面，本专利技术实施例提供的一种基于深度学习的视频分段方法，包括以下步骤：
[0005]获取待处理的视频数据，从视频数据中获取音频数据；
[0006]将所述音频数据转化为文本信息，对文本信息进行预处理和文本向量化，得到词向量；
[0007]将词向量输入训练好的文本分类模型进行文本分类，输出识别的文本类别；
[0008]将识别的文本类别与预设的视频分段中的文本类别进行对比；
[0009]根据符合分段的文本类别对视频数据进行分段。
[0010]可选地，所述对文本信息进行预处理和文本向量化具体包括：
[0011]将文本信息进行数据清洗，得到清洗后的文本信息；
[0012]将清洗后的文本信息进行分词处理得到文本数据...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的视频分段方法，其特征在于，包括以下步骤：获取待处理的视频数据，从视频数据中获取音频数据；将所述音频数据转化为文本信息，对文本信息进行预处理和文本向量化，得到词向量；将词向量输入训练好的文本分类模型进行文本分类，输出识别的文本类别；将识别的文本类别与预设的视频分段中的文本类别进行对比；根据符合分段的文本类别对视频数据进行分段。2.如权利要求1所述的基于深度学习的视频分段方法，其特征在于，所述对文本信息进行预处理和文本向量化具体包括：将文本信息进行数据清洗，得到清洗后的文本信息；将清洗后的文本信息进行分词处理得到文本数据；将文本数据输入转化模型中转化为分布式表示的词向量。3.如权利要求2所述的基于深度学习的视频分段方法，其特征在于，所述转化模型为Word2vec模型。4.如权利要求1所述的基于深度学习的视频分段方法，其特征在于，文本分类模型的训练方法包括：将词向量分别输入卷积神经网络和分层注意力模型中进行训练，分别得到第一概率预测矩阵和第二概率预测矩阵；将第一概率预测矩阵和第二概率预测矩阵利用权值进行数据融合，得到融合后的数据；将融合后的数据输入到全连接层，预测出文本类别。5.一种基于深度学习的视频分段系统，其特征在于，包括：获取模块、数据预处理模块、文本分类模块、对比模块和分段模块；所述获取模块用于获取待处理的视频数据，从视频数据中获取音频数据；所述数据预处理模块用于将所述音频数据转化为文本信息，对文本信息进行预处理和文本向量化，得到词向量；所述文本分类模块用于将词向量输入训练好的文本分类模型进行文本分类，输出识别的文本类别；所述对比模块...

【专利技术属性】
技术研发人员：李志雄，
申请(专利权)人：深圳市中科网威科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人