一种视频片段处理方法、装置及计算机可读存储介质制造方法及图纸

技术编号：21478652 阅读：26 留言：0更新日期：2019-06-29 05:02

本发明专利技术提供了一种视频片段处理方法、装置及计算机可读存储介质，包括：提取视频样本的视频特征，及视频特征对应的视频时间序列；根据视频特征和预设的行为片段生成模型，生成目标视频片段，目标视频片段包括片段时间序列；根据片段时间序列和视频时间序列的匹配，从视频特征中确定与目标视频片段对应的目标视频特征；将目标视频特征输入预设的行为类别分类器，得到目标视频片段中动作行为的分类类别，本发明专利技术利用了视频特征中对应的时间序列，找到目标视频片段对应的目标视频特征输入分类器，避免了重复对目标视频片段进行特征提取，提高了分类效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频片段处理方法、装置及计算机可读存储介质
本专利技术属于计算机
，特别是涉及一种视频片段处理方法、装置及计算机可读存储介质。
技术介绍
从未经处理的长视频中提取出用户感兴趣的行为片段，及确定行为片段的行为类别，对后续的视频分析具有重要意义。在实际应用中，可以为用户提供更丰富的个性化服务。现有技术中，通常采用基于边界敏感网络的双流网络模型，分别提取视频样本的图像特征和光流特征，并将图像特征和光流特征进行融合，得到融合特征。其中，光流特征是由于视频样本中前景目标本身的移动、相机的运动，或者两者的共同运动所产生的，表述了视频样本中运动特征的相关规律。在得到融合特征后，可以将融合特征输入行为片段生成模型，并输出行为片段，并将整个行为片段作为分类模型的输入，输出该行为片段的类别信息。但是，在进行行为片段的类别确定时，需将整个行为片段作为视频输入，重新提取特征并对其分类，增加了时间消耗。
技术实现思路
有鉴于此，本专利技术提供一种视频片段处理方法、装置及计算机可读存储介质，在一定程度上解决了目前方案中在进行行为片段的类别确定时，需将整个行为片段作为视频输入，重新提取特征并对其分类，增加了时间消耗的问题。依据本专利技术的第一方面，提供了一种视频片段处理方法，该方法可以包括：提取视频样本的视频特征，及所述视频特征对应的视频时间序列；根据所述视频特征和预设的行为片段生成模型，生成目标视频片段，所述目标视频片段包括片段时间序列；根据所述片段时间序列和所述视频时间序列的匹配，从所述视频特征中确定与所述目标视频片段对应的目标视频特征；将所述目标视频特征输入预设的行为类别分...

【技术保护点】
1.一种视频片段处理方法，其特征在于，所述方法包括：提取视频样本的视频特征，及所述视频特征对应的视频时间序列；根据所述视频特征和预设的行为片段生成模型，生成目标视频片段，所述目标视频片段包括片段时间序列；根据所述片段时间序列和所述视频时间序列的匹配，从所述视频特征中确定与所述目标视频片段对应的目标视频特征；将所述目标视频特征输入预设的行为类别分类器，得到所述目标视频片段中动作行为的分类类别。

【技术特征摘要】
1.一种视频片段处理方法，其特征在于，所述方法包括：提取视频样本的视频特征，及所述视频特征对应的视频时间序列；根据所述视频特征和预设的行为片段生成模型，生成目标视频片段，所述目标视频片段包括片段时间序列；根据所述片段时间序列和所述视频时间序列的匹配，从所述视频特征中确定与所述目标视频片段对应的目标视频特征；将所述目标视频特征输入预设的行为类别分类器，得到所述目标视频片段中动作行为的分类类别。2.根据权利要求1所述的方法，其特征在于，所述根据所述视频特征和预设的行为片段生成模型，生成目标视频片段，包括：根据所述视频特征和预设的行为片段生成模型，获取至少一个候选片段；在所述至少一个候选片段中确定目标视频片段，所述目标视频片段还包括完整的预设动作行为。3.根据权利要求2所述的方法，其特征在于，所述根据所述视频特征和预设的行为片段生成模型，获取至少一个候选片段，包括：在所述视频样本中确定多个时间点；将所述视频特征输入所述行为片段生成模型，输出所述视频样本的时间点属于起始点的第一概率、所述时间点属于结束点的第二概率以及所述时间点包括所述动作行为的第三概率；在所述时间点中，确定所述第一概率大于第一预设阈值的候选起始点和所述第二概率大于第二预设阈值的候选结束点；将每个所述候选起始点分别和每个所述候选结束点进行组合，生成至少一个候选片段。4.根据权利要求3所述的方法，其特征在于，所述时间点关联有所述视频样本中的多帧连续视频帧，且所述多帧连续视频帧中，存在一帧视频帧与所述时间点对应；所述确定所述时间点包括所述动作行为的第三概率，包括：在所述行为片段生成模型中，根据所述时间点关联的多帧连续视频帧，确定所述时间点包括所述动作行为的第三概率。5.根据权利要求3所述的方法，其特征在于，所述在所述至少一个候选片段中确定目标视频片段，包括：将所述候选片段包括的时间点的第三概率，输入预设的片段评价模型，输出所述候选片段包括所述动作行为的第四概率；将所述候选片段包括的时间点的第三概率，以及相邻片段包括的时间点的第三概率，输入预设的完整性判断模型，输出所述候选片段包括所述完整的预设动作行为的第五概率，所述相邻片段为与所述候选片段相邻的视频片段；将所述第四概率和所述第五概率进行加权求和，得到所述候选片段的初始得分；根据所述初始得分，在所述至少一个候选片段中确定目标视频片段。6.根据权利要求5所述的方法，其特征在于，所述根据所述初始得分，在所述至少一个候选片段中确定目标视频片段，包括：在多个所述候选片段中，确定任意两个候选片段之间的重合度；在所述两个候选片段的重合度大于或等于预设阈值时，将所述两个候选片段中初始得分最高的候选片段确定为所述目标视频片段。7.根据权利要求1所述的方法，其特征在于，所述将所述目标视频特征输入预设的行为类别分类器，得到所述目标视频片段中动作行为的分类类别，包括：确定所述目标视频片段拆分得到的多个子片段，以及与所述目标视频片段相邻的相邻子片段；将所述目标视频片段对应的目标视频特征、所述子片段对应的子视频特征、所述相邻子片段对应的相邻视频特征输入预设的行为类别分类器，得到所述目标视频片段中动作行为的分类类别。8.根据权利要求7所述的方法，其特征在于，所述确定所述目标视频片段拆分得到的多个子片段，以及与所述目标视频片段相邻的相邻子片段，包括：从所述目标视频片段的中点，将所述目标视频片段剪切为第一子片段和第二子片段；根据所述片段时间序列和所述视频时间序列的匹配，从所述视频样本中确定与所述目标视频片段前后相邻的第一相邻子片段和第二相邻子片段。9.根据权利要求8所述的方法，其特征在于，所述将所述目标视频片段对应的目标视频特征、所述子片段对应的子视频特征、所述相邻子片段对应的相邻视频特征输入预设的行为类别分类器，得到所述目标视频片段中动作行为的分类类别，包括：根据所述目标视频片段对应的目标视频特征，计算得到第一平均向量；根据所述第一子片段对应的第一子视频特征和所述第二子片段对应的第二子视频特征，计算得到所述第一子片段对应的第二平均向量，以及所述第二子片段对应的第三平均向量；根据所述第一相邻子片段对应的第一相邻视频特征和所述第二相邻子片段对应的第二相邻视视频特征，计算得到所述第一相邻子片段对应的第四平均向量，以及所述第二相邻子片段对应的第五平均向量；将所述第一平均向量、所述第二平均向量、所述第三平均向量、所述第四平均向量和所述第五平均向量输入所述行为类别分类器，得到所述目标视频片段中动作行为的分类类别。10.根据权利要求2所述的方法，其特征在于，所述根据所述视频特征和预设的行为片段生成模型，获取至少一个候选片段；按照主成分分析降维算法，对所述视频特征进行降维处理，得到所述降维特征；根据所述降维特征和所述预设的行为片段生成模型，获取至少一个候选片段。11.根据权利要求1所述的方法，其特征在于，所述提取视频样本的视频特征，及所述视频特征对应的视频时间序列，包括：通过3D卷积神经网络模型，提取所述视频样本的视频特征，及所述视频特征对应的视频时间序列。12.一种视频片段处理装置...

【专利技术属性】
技术研发人员：王影影，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人