The invention provides a video classification method based on session, and relates to the technical field of video classification. The invention comprises the following steps: A. Converting the conversational content of video into text; B. Preprocessing text; C. Extracting text features; D. Representing text; E. Classifying text and classifying video according to text classification results. The invention introduces an improved TF IDF algorithm in the feature extraction step by adding structural weight Loc and
【技术实现步骤摘要】
基于会话的视频分类方法
本专利技术涉及视频分类
,具体指一种基于会话的视频分类方法。
技术介绍
随着互联网的发展,网络上的视频数量呈几何倍数增长,如何有效地对这些网络视频进行分类成为一个非常重要的课题。视频分类是指在已有的已分类的视频样本基础上构建一个分类器,它按照预先定义的分类体系为每一个待分类视频确定一个或多个类别,使得用户可以更加方便地检索视频。视频自动分类就是用带有大量特征的视频对分类规则或模型参数进行训练,然后使用训练后的分类规则或模型对待分类视频进行分类。国内外已有许多关于视频分类的研究,它们大多采用基于视觉的视频分类方法,其步骤包括首先对视频进行基于视觉的特征提取,然后进行行为表示,最后对视频进行分类。这种方法对场景特征鲜明、人物动作变化较大的视频有较好的分类效果。但对于场景单一、富含对话内容的视频(如访谈类节目)则无法有效分类。
技术实现思路
为了克服现有的基于视觉的视频分类方法无法有效对富合会话的视频进行分类的问题,提出一种基于会话的视频分类方法。本专利技术一种基于会话的视频分类方法,包含以下步骤:A.将视频中的会话内容转换成文本;B.对文本进行预处理;C.对文本进行特征提取;D.对文本进行表示;E.对文本进行分类并根据文本分类结果对视频进行分类。所述步骤A包含以下步骤:A1为每个视频提取音频;A2将音频转换为文本;所述步骤B包含以下步骤:B1对文本进行分词;B2对文本去除停用词;B3为所有视频统计会话部分持续的总时长;B4根据分词结果为视频库生成词袋;B5统计每个词对应的会话部分在视频中持续的时间;所述步骤C包含以下步骤:C1取词袋中 ...
【技术保护点】
1.一种基于会话的视频分类方法,其特征在于,包含以下步骤:A.将视频中的会话内容转换成文本;B.对文本进行预处理;C.对文本进行特征提取;D.对文本进行表示;E.对文本进行分类并根据文本分类结果对视频进行分类。
【技术特征摘要】
1.一种基于会话的视频分类方法,其特征在于,包含以下步骤:A.将视频中的会话内容转换成文本;B.对文本进行预处理;C.对文本进行特征提取;D.对文本进行表示;E.对文本进行分类并根据文本分类结果对视频进行分类。2.如权利要求1所述的基于会话的视频分类方法,其特征在于,所述步骤A还包含以下步骤:A1为每个视频提取音频;A2将音频转换为文本。3.如权利要求1所述的基于会话的视频分类方法,其特征在于,所述步骤B还包含以下步骤:B1对文本进行分词;B2对文本去除停用词;B3为所有视频统计会话部分持续的总时长;B4根据分词结果为视频库生成词袋;B5统计每个词对应的会话部分在视频中持续的时间。4.如权利要求1所述的基于会话的视频分类方法,其特征在于,所述步骤C还包含以下步骤:C1取词袋中的词作为所有文本的特征词;C2为所有文本的每个特征词计算词频;C3为每个特征词计算逆向文件概率;C4使用改进的TF-IDF算法为视频库中的每个视频的所有特征词计算权重。5.如权利要求1所述的基于会话的视频分类方法,其特征在于,所述步骤D还包含以下步骤:D1为视频库中的每个视频生成权重向量;D2为视频样本的各类别产生基准权重向量;所述步骤D中所采用的文本表示模型为词袋模型。6.如权利要求1所述的基于会话的视频分类方法,其特征...
【专利技术属性】
技术研发人员:黄继风,但宇豪,林晓,
申请(专利权)人:上海师范大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。