视频片段的识别方法和装置制造方法及图纸

技术编号:16550714 阅读:37 留言:0更新日期:2017-11-11 14:04
本发明专利技术提供了一种视频片段的识别方法和装置,包括:提取教学视频中包含的每个视频片段的知识点标签,得到至少一个知识点标签;基于视频片段的知识点标签和视频片段的字幕信息对目标试题按照知识点进行分类,得到至少一种类别的试题分组,目标试题为所属于教学视频的试题,且不同类别的试题分组对应的知识点标签不同;基于获取到的每个试题分组的答题结果在知识点标签中确定目标知识点标签所对应的目标知识点,其中,目标知识点为至少一个知识点中难度大于预设难度的知识点;将视频片段中目标知识点所对应的视频片段作为难点片段,缓解了采用现有技术中的方法进行难点识别时识别精度较差,且识别过程较为缓慢的技术问题。

Method and device for identifying video clips

The present invention provides a method and apparatus for identifying a video clip, including: knowledge of label extraction of each video segment contains the teaching video, at least a knowledge point label; subtitle information video clips and video footage of the knowledge point labels on target test in accordance with the classification of knowledge points based on the obtained test packet at least one category, for the target questions belong to the teaching video questions, questions and grouping different categories corresponding knowledge of different labels; each packet access to answer questions based on the results to determine the knowledge points corresponding to the target label target point of knowledge, the knowledge points in the label which target knowledge is at least difficulty a knowledge point in more than a preset knowledge of difficulty; the corresponding target knowledge points in video clips of video clips as difficult fragments, easing Using the existing methods to identify difficult points, the problem of poor recognition accuracy and slow identification process is identified.

【技术实现步骤摘要】
视频片段的识别方法和装置
本专利技术涉及视频数据处理
,尤其是涉及一种视频片段的识别方法和装置。
技术介绍
视频是在线学习的重要载体,老师在录制教学视频时,不同老师录制的视频侧重点不同,对知识点的难易把握也不尽相同。传统的教学视频较长,一节课对应一个视频,一个视频包含多个知识点。因此,想要从该视频中识别较难的知识点,以及识别这些知识点对应于视频的起始位置是相当困难的。现有技术方案中,一般是通过大量学生反馈,得出视频难点大概位置。但是人工反馈存在一定的缺点,例如,当网络课堂视频数量较大,学生数量较多时,由于缺少面对面的沟通,学生的主动式反馈比较困难。且众多学生中个别学生的反馈,不一定是难点;大量学生反馈同一个问题,才有可能是难点,需要引起老师重视,进而优化教案,更新教学视频。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种视频片段的识别方法和装置,以缓解采用现有技术中的方法进行难点识别时识别精度较差,且识别过程较为缓慢的技术问题。第一方面,本专利技术实施例提供了一种视频片段的识别方法,包括:提取教学视频中包含的每个视频片段的知识点标签,得到至少一个知识点标签,其中,所述至少一个知识点标签用于指示至少一个知识点;基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类,得到至少一种类别的试题分组,其中,所述目标试题为所属于所述教学视频的试题,且不同类别的所述试题分组对应的知识点标签不同;基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点,其中,所述目标知识点为所述至少一个知识点中难度大于预设难度的知识点;将所述视频片段中所述目标知识点所对应的视频片段作为难点片段。进一步地,提取教学视频中包含的每个视频片段的知识点标签包括:提取所述视频片段的字幕信息;对所述字幕信息进行文本分割处理,处理得到至少一个文本分割片段;采用TextRank算法在每个文本分割片段中提取TopN关键词,并将提取到的所述TopN关键词作为所述视频片段的知识点标签。进一步地,对所述字幕信息进行文本分割处理,处理得到至少一个文本分割片段包括:对所述字幕信息执行目标处理,得到处理之后的所述字幕信息,其中,所述目标处理包括:分词处理和去停用词处理;基于文本分割算法对处理之后的所述字幕信息进行文本分割,分割之后得到所述至少一个文本分割片段。进一步地,提取所述视频片段的字幕信息包括:判断所述视频片段是否包含所述字幕信息;如果判断出所述视频片段包含所述字幕信息,则提取所述字幕信息;如果判断出所述视频片段不包含所述字幕信息,则提取所述视频片段的音频信息,并将所述音频信息转换为所述字幕信息。进一步地,基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类,得到至少一种类别的试题分组包括:构建训练语料,其中,所述训练语料中包括所述至少一个知识点标签和字幕碎片,其中,所述字幕碎片为通过对所述字幕信息进行处理得到的碎片;通过所述训练语料对分类模型进行训练;基于训练好的所述分类模型对所述目标试题进行分类,得到所述至少一种类别的试题分组。进一步地,构建训练语料包括:将所述视频片段的字幕信息进行切分,得到所述字幕碎片,其中,所述字幕碎片中包括至少一个关键词;通过所述训练语料对分类模型进行训练包括:将所述字幕碎片和所述至少一个知识点标签作为所述分类模型的输入,将目标概率信息作为所述分类模型的输出,对所述分类模型进行训练,其中,所述目标概率信息表示所述至少一个关键词中每个关键词为所述至少一个知识点标签中的知识点标签的概率。进一步地,基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点包括:获取全部学习人员对所述试题分组中每个试题的答题结果;在所述答题结果中统计第一答题结果的数量和第二答题结果的数量,其中,所述第一答题结果为正确的答题结果,所述第二答题结果为错误的答题结果;基于第二答题结果的数量判断当前所述试题分组所对应的知识点标签是否为所述目标知识点标签;其中,如果判断出是,则将当前所述试题分组所对应的知识点标签作为所述目标知识点标签。进一步地,在将所述教学视频中所述目标知识点所对应的视频片段作为难点片段之后,所述方法还包括:生成目标图像,其中,所述目标图像中包括每个所述视频片段的难点视频的起始时间、每个所述视频片段的难点视频的结束时间和每个所述视频片段的难点视频的难易程度;将所述目标图像推送至教师,以使教师根据所述目标图像确定难点视频,其中,所述教师为所述教学视频中的教师。第二方面,本专利技术实施例还提供一种视频片段的识别装置,包括:提取单元,用于提取教学视频中包含的每个视频片段的知识点标签,得到至少一个知识点标签,其中,所述至少一个知识点标签用于指示至少一个知识点;分类单元,用于基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类,得到至少一种类别的试题分组,其中,所述目标试题为所属于所述教学视频的试题,且不同类别的所述试题分组对应的知识点标签不同;第一确定单元,用于基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点,其中,所述目标知识点为所述至少一个知识点中难度大于预设难度的知识点;第二确定单元,用于将所述视频片段中所述目标知识点所对应的视频片段作为难点片段。进一步地,所述提取单元包括:第一提取模块,用于提取所述视频片段的字幕信息;分割处理模块,用于对所述字幕信息进行文本分割处理,处理得到至少一个文本分割片段;第二提取模块,用于采用TextRank算法在每个文本分割片段中提取TopN关键词,并将提取到的所述TopN关键词作为所述视频片段的知识点标签。在本专利技术实施例中,首先提取教学视频中包含的每个视频片段的知识点标签,然后,基于知识点标签和视频片段的字幕信息对目标试题按照知识点进行分类,得到至少一种类别的试题分组;接下来,基于每个试题分组的答题结果在知识点标签中确定目标知识点标签所对应的目标知识点;最后,将视频片段中目标知识点所对应的视频片段作为难点片段。在本专利技术实施例中,通过上述方式,能够快速有效的在教学视频中识别难点片段,进而缓解了采用现有技术中的方法进行难点识别时识别精度较差,且识别过程较为缓慢的技术问题。本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例的一种视频片段的识别方法的流程图;图2是根据本专利技术实施例的一种目标图像的示意图;图3是根据本专利技术实施例的另一种视频片段的识别方法的流程图;图4是根据本专利技术实施例的一种视频片段的识别本文档来自技高网...
视频片段的识别方法和装置

【技术保护点】
一种视频片段的识别方法,其特征在于,包括:提取教学视频中包含的每个视频片段的知识点标签,得到至少一个知识点标签,其中,所述至少一个知识点标签用于指示至少一个知识点;基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类,得到至少一种类别的试题分组,其中,所述目标试题为所属于所述教学视频的试题,且不同类别的所述试题分组对应的知识点标签不同;基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点,其中,所述目标知识点为所述至少一个知识点中难度大于预设难度的知识点;将所述视频片段中所述目标知识点所对应的视频片段作为难点片段。

【技术特征摘要】
1.一种视频片段的识别方法,其特征在于,包括:提取教学视频中包含的每个视频片段的知识点标签,得到至少一个知识点标签,其中,所述至少一个知识点标签用于指示至少一个知识点;基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类,得到至少一种类别的试题分组,其中,所述目标试题为所属于所述教学视频的试题,且不同类别的所述试题分组对应的知识点标签不同;基于获取到的每个所述试题分组的答题结果在所述知识点标签中确定目标知识点标签所对应的目标知识点,其中,所述目标知识点为所述至少一个知识点中难度大于预设难度的知识点;将所述视频片段中所述目标知识点所对应的视频片段作为难点片段。2.根据权利要求1所述的方法,其特征在于,提取教学视频中包含的每个视频片段的知识点标签包括:提取所述视频片段的字幕信息;对所述字幕信息进行文本分割处理,处理得到至少一个文本分割片段;采用TextRank算法在每个文本分割片段中提取TopN关键词,并将提取到的所述TopN关键词作为所述视频片段的知识点标签。3.根据权利要求2所述的方法,其特征在于,对所述字幕信息进行文本分割处理,处理得到至少一个文本分割片段包括:对所述字幕信息执行目标处理,得到处理之后的所述字幕信息,其中,所述目标处理包括:分词处理和去停用词处理;基于文本分割算法对处理之后的所述字幕信息进行文本分割,分割之后得到所述至少一个文本分割片段。4.根据权利要求2所述的方法,其特征在于,提取所述视频片段的字幕信息包括:判断所述视频片段是否包含所述字幕信息;如果判断出所述视频片段包含所述字幕信息,则提取所述字幕信息;如果判断出所述视频片段不包含所述字幕信息,则提取所述视频片段的音频信息,并将所述音频信息转换为所述字幕信息。5.根据权利要求2所述的方法,其特征在于,基于所述视频片段的知识点标签和所述视频片段的字幕信息对目标试题按照知识点进行分类,得到至少一种类别的试题分组包括:构建训练语料,其中,所述训练语料中包括所述至少一个知识点标签和字幕碎片,其中,所述字幕碎片为通过对所述字幕信息进行处理得到的碎片;通过所述训练语料对分类模型进行训练;基于训练好的所述分类模型对所述目标试题进行分类,得到所述至少一种类别的试题分组。6.根据权利要求5所述的方法,其特征在于,构建训练语料包括:将所述视频片段的字幕信息进行切分,得到所述字幕碎片,其中,所述字幕碎片中包括至少一个关键词;通过所述训练语料对分类模型进行训练包括:将所...

【专利技术属性】
技术研发人员:朱海军
申请(专利权)人:北京慕华信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1