一种情感分类方法及装置制造方法及图纸

技术编号:19009207 阅读:22 留言:0更新日期:2018-09-22 09:04
本申请实施例提供一种情感分类方法及装置,通过获取确定包括与待测视频中的对应的至少一条对白文本的对白信息(对白信息包括待测视频对应的至少一条对白文本);对至少一条对白文本中的每条对白文本进行数据清洗,得到分别与每条对白文本对应的第一对白文本;确定分别与每条第一对白文本对应的满足预设对白规则的第二对白文本;分别确定每条第二对白文本的文本向量;将每条第二对白文本的文本向量作为预设的情感分类模型的输入信息输入至情感分类模型,得到分别与每条第二对白文本对应的对白文本的情感分类结果的方式,实现了基于对白文本的视频人物情感分类,降低了从计算机视觉的角度对视频中的人物进行情感分类时,所导致的对视频中人物情感分类不准确的情况的发生。

An emotion classification method and device

The embodiment of the present application provides an emotional classification method and apparatus, which are obtained by acquiring a dialog information that determines to include at least one dialog text corresponding to the video to be measured (the dialog information includes at least one dialog text corresponding to the video to be measured); and data cleaning is performed on each dialog text in at least one dialog text. The first pair of white text corresponding to each pair of white text is determined; the second pair of white text corresponding to each pair of white text is determined; the text vector of the second pair of white text of each article is determined; and the text vector of the second pair of white text of each article is used as input information of the preset emotional classification model. Input into the emotional classification model, we get the emotional classification results corresponding to the second pair of white text of each article, and realize the emotional classification of video characters based on the dialogue text, which reduces the emotional classification of video characters from the perspective of computer vision. The occurrence of inaccurate classifications.

【技术实现步骤摘要】
一种情感分类方法及装置
本专利技术涉及计算机领域,特别是涉及一种情感分类方法及装置。
技术介绍
影视作品(如,电影、电视剧人物等)的情感总是跌宕起伏的,通过分析视频中人物的情感,可以让观众更好的把握影视作品的节奏。目前,通常是从计算机视觉的角度对视频中的人物进行情感分类,比如,识别视频中的关键场景、视频中的人物表情等。但是,由于视频中的人物过多、场景复杂,故往往存在对视频中人物情感分类不准确的问题。有鉴于此,提供一种情感分类方法及装置,以提高对视频中人物情感分类的准确性,是亟待解决的问题。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种情感分类方法及装置,以提高对视频中人物情感分类的准确性,具体实施方案如下:一种情感分类方法,包括:确定待测视频中的对白信息,所述对白信息包括所述待测视频对应的至少一条对白文本;对所述至少一条对白文本中的每条对白文本进行数据清洗,得到分别与每条对白文本对应的第一对白文本;确定分别与每条所述第一对白文本对应的满足预设对白规则的第二对白文本;分别确定每条所述第二对白文本的文本向量;将每条所述第二对白文本的文本向量作为预设的情感分类模型的输入信息输入至所述情感分类模型,得到分别与每条所述第二对白文本对应的对白文本的情感分类结果。可选的,所述确定待测视频中的对白信息,包括:确定所述待测视频对应的至少一条字幕信息;确定预先设置的语言模型分别对每条所述字幕信息的评分结果;针对每条所述字幕信息,若所述字幕信息的评分结果在预先设置的评分阈值内,将所述字幕信息确定为一条对白文本。可选的,所述确定待测视频对应的至少一条字幕信息,包括:采用OCR识别方法识别所述待测视频中的每一帧图像的字幕信息;将识别到各条所述字幕信息确定为与所述待测视频对应的至少一条字幕信息。可选的,所述对所述至少一条对白文本中的每条对白文本进行数据清洗,得到分别与每条对白文本对应的第一对白文本,包括:将满足预设的删除条件的字符删除后的所述对白文本中的文本内容,确定为与所述对白文本对应的第一对白文本。可选的,所述确定分别与每条所述第一对白文本对应的满足预设对白规则的第二对白文本,包括:确定所述第一对白文本中的字符数;若所述第一对白文本中的字符数超过预设对白字符数时,从所述第一对白文本中选取所述预设对白字符数的字符,并将由选取到的各字符组成的文本确定为与所述第一对白文本对应的第二对白文本;若所述第一对白文本中的字符数未超过预设对白字符数时,在所述第一对白文本中添加预设字符,生成与所述第一对白文本对应的第二对白文本,其中,生成的与所述第一对白文本对应的第二对白文本包括的字符数与所述预设对白字符数相同。可选的,所述分别确定每条所述第二对白文本的文本向量,包括:根据所述第二对白文本中字符的顺序,依次确定所述第二对白文本中的每个字符的向量;由依次确定的各向量构成所述第二对白文本的文本向量。可选的,还包括:确定所述待测视频中的每条所述对白文本在所述待测视频中的播放时间点;基于所述待测视频中的每条所述对白文本的情感分类结果和播放时间点,生成与所述待测视频对应的情感分析曲线图。可选的,所述预设的情感分类模型的构建方法包括:确定至少一条训练对白文本;对所述至少一条训练对白文本中的每条训练对白文本进行数据清洗,得到分别与每条训练对白文本对应的第一训练对白文本;确定分别与每条所述第一训练对白文本对应的满足所述预设对白规则的第二训练对白文本;分别确定每条所述第二训练对白文本的文本向量;将所述训练对白文本对应的文本向量和所述训练对白文本所属的情感类别,作为预先设置的情感分类生成算法的输入信息输入至所述情感分类生成算法,以生成情感分类模型。一种情感分类装置,包括:对白信息确定单元,用于确定待测视频中的对白信息,所述对白信息包括所述待测视频对应的至少一条对白文本;数据清洗单元,用于对所述至少一条对白文本中的每条对白文本进行数据清洗,得到分别与每条对白文本对应的第一对白文本;第二对白文本确定单元,用于确定分别与每条所述第一对白文本对应的满足预设对白规则的第二对白文本;文本向量确定单元,用于分别确定每条所述第二对白文本的文本向量;情感分类结果确定单元,用于将每条所述第二对白文本的文本向量作为预设的情感分类模型的输入信息输入至所述情感分类模型,得到分别与每条所述第二对白文本对应的对白文本的情感分类结果。可选的,所述对白信息确定单元,包括:字幕信息确定单元,用于确定所述待测视频对应的至少一条字幕信息;评分结果确定单元,用于确定预先设置的语言模型分别对每条所述字幕信息的评分结果;对白信息确定子单元,用于针对每条所述字幕信息,若所述字幕信息的评分结果在预先设置的评分阈值内,将所述字幕信息确定为一条对白文本。本申请实施例提供一种情感分类方法及装置,通过获取确定包括与待测视频中的对应的至少一条对白文本的对白信息(对白信息包括待测视频对应的至少一条对白文本);对至少一条对白文本中的每条对白文本进行数据清洗,得到分别与每条对白文本对应的第一对白文本;确定分别与每条第一对白文本对应的满足预设对白规则的第二对白文本;分别确定每条第二对白文本的文本向量;将每条第二对白文本的文本向量作为预设的情感分类模型的输入信息输入至情感分类模型,得到分别与每条第二对白文本对应的对白文本的情感分类结果的方式,实现了基于对白文本的视频人物情感分类,降低了从计算机视觉的角度对视频中的人物进行情感分类时,所导致的对视频中人物情感分类不准确的情况的发生。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种情感分类方法流程图;图2为本申请实施例提供的另一种情感分类方法流程图;图3为本申请实施例提供的一种待测视频的情感分析曲线图;图4为本申请实施例提供的一种情感分类模型的构建方法流程图;图5为本申请实施例提供的一种情感分类装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例:图1为本申请实施例提供的一种情感分类方法流程图。如图1所示,该方法包括:S101、确定待测视频中的对白信息,对白信息包括待测视频对应的至少一条对白文本;在本申请实施例中,优选的,确定待测视频中的对白信息,包括:确定待测视频对应的至少一条字幕信息;确定预先设置的语言模型分别对每条字幕信息的评分结果;针对每条字幕信息,若该字幕信息的评分结果在预先设置的评分阈值内,将该字幕信息确定为一条对白文本。可选的,确定待测视频对应的至少一条字幕信息,包括:采用OCR识别方法识别待测视频中的每一帧图像的字幕信息;将识别到各条字幕信息确定为与待测视频对应的至少一条字幕信息。在本申请实施例中,优选的,采用OCR识别方法,分别识别待测视频中的每一帧图像的字幕信息,以得到待测视频本文档来自技高网...
一种情感分类方法及装置

【技术保护点】
1.一种情感分类方法,其特征在于,包括:确定待测视频中的对白信息,所述对白信息包括所述待测视频对应的至少一条对白文本;对所述至少一条对白文本中的每条对白文本进行数据清洗,得到分别与每条对白文本对应的第一对白文本;确定分别与每条所述第一对白文本对应的满足预设对白规则的第二对白文本;分别确定每条所述第二对白文本的文本向量;将每条所述第二对白文本的文本向量作为预设的情感分类模型的输入信息输入至所述情感分类模型,得到分别与每条所述第二对白文本对应的对白文本的情感分类结果。

【技术特征摘要】
1.一种情感分类方法,其特征在于,包括:确定待测视频中的对白信息,所述对白信息包括所述待测视频对应的至少一条对白文本;对所述至少一条对白文本中的每条对白文本进行数据清洗,得到分别与每条对白文本对应的第一对白文本;确定分别与每条所述第一对白文本对应的满足预设对白规则的第二对白文本;分别确定每条所述第二对白文本的文本向量;将每条所述第二对白文本的文本向量作为预设的情感分类模型的输入信息输入至所述情感分类模型,得到分别与每条所述第二对白文本对应的对白文本的情感分类结果。2.根据权利要求1所述的方法,其特征在于,所述确定待测视频中的对白信息,包括:确定所述待测视频对应的至少一条字幕信息;确定预先设置的语言模型分别对每条所述字幕信息的评分结果;针对每条所述字幕信息,若所述字幕信息的评分结果在预先设置的评分阈值内,将所述字幕信息确定为一条对白文本。3.根据权利要求2所述的方法,其特征在于,所述确定待测视频对应的至少一条字幕信息,包括:采用OCR识别方法识别所述待测视频中的每一帧图像的字幕信息;将识别到各条所述字幕信息确定为与所述待测视频对应的至少一条字幕信息。4.根据权利要求1所述的方法,其特征在于,所述对所述至少一条对白文本中的每条对白文本进行数据清洗,得到分别与每条对白文本对应的第一对白文本,包括:将满足预设的删除条件的字符删除后的所述对白文本中的文本内容,确定为与所述对白文本对应的第一对白文本。5.根据权利要求1所述的方法,其特征在于,所述确定分别与每条所述第一对白文本对应的满足预设对白规则的第二对白文本,包括:确定所述第一对白文本中的字符数;若所述第一对白文本中的字符数超过预设对白字符数时,从所述第一对白文本中选取所述预设对白字符数的字符,并将由选取到的各字符组成的文本确定为与所述第一对白文本对应的第二对白文本;若所述第一对白文本中的字符数未超过预设对白字符数时,在所述第一对白文本中添加预设字符,生成与所述第一对白文本对应的第二对白文本,其中,生成的与所述第一对白文本对应的第二对白文本包括的字符数与所述预设对白字符数相同。6.根据权利要求1所述的方法,其特征在于,所述分别确定每条所...

【专利技术属性】
技术研发人员:余咸国
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1