一种情感分类方法及装置制造方法及图纸

技术编号：19009207 阅读：22 留言：0更新日期：2018-09-22 09:04

本申请实施例提供一种情感分类方法及装置，通过获取确定包括与待测视频中的对应的至少一条对白文本的对白信息(对白信息包括待测视频对应的至少一条对白文本)；对至少一条对白文本中的每条对白文本进行数据清洗，得到分别与每条对白文本对应的第一对白文本；确定分别与每条第一对白文本对应的满足预设对白规则的第二对白文本；分别确定每条第二对白文本的文本向量；将每条第二对白文本的文本向量作为预设的情感分类模型的输入信息输入至情感分类模型，得到分别与每条第二对白文本对应的对白文本的情感分类结果的方式，实现了基于对白文本的视频人物情感分类，降低了从计算机视觉的角度对视频中的人物进行情感分类时，所导致的对视频中人物情感分类不准确的情况的发生。

An emotion classification method and device

The embodiment of the present application provides an emotional classification method and apparatus, which are obtained by acquiring a dialog information that determines to include at least one dialog text corresponding to the video to be measured (the dialog information includes at least one dialog text corresponding to the video to be measured); and data cleaning is performed on each dialog text in at least one dialog text. The first pair of white text corresponding to each pair of white text is determined; the second pair of white text corresponding to each pair of white text is determined; the text vector of the second pair of white text of each article is determined; and the text vector of the second pair of white text of each article is used as input information of the preset emotional classification model. Input into the emotional classification model, we get the emotional classification results corresponding to the second pair of white text of each article, and realize the emotional classification of video characters based on the dialogue text, which reduces the emotional classification of video characters from the perspective of computer vision. The occurrence of inaccurate classifications.

全部详细技术资料下载

【技术实现步骤摘要】
一种情感分类方法及装置
本专利技术涉及计算机领域，特别是涉及一种情感分类方法及装置。
技术介绍
影视作品(如，电影、电视剧人物等)的情感总是跌宕起伏的，通过分析视频中人物的情感，可以让观众更好的把握影视作品的节奏。目前，通常是从计算机视觉的角度对视频中的人物进行情感分类，比如，识别视频中的关键场景、视频中的人物表情等。但是，由于视频中的人物过多、场景复杂，故往往存在对视频中人物情感分类不准确的问题。有鉴于此，提供一种情感分类方法及装置，以提高对视频中人物情感分类的准确性，是亟待解决的问题。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种情感分类方法及装置，以提高对视频中人物情感分类的准确性，具体实施方案如下：一种情感分类方法，包括：确定待测视频中的对白信息，所述对白信息包括所述待测视频对应的至少一条对白文本；对所述至少一条对白文本中的每条对白文本进行数据清洗，得到分别与每条对白文本对应的第一对白文本；确定分别与每条所述第一对白文本对应的满足预设对白规则的第二对白文本；分别确定每条所述第二对白文本的文本向量；将每条所述第二对白文本的文本向量作为预设的情感分类模型的输入信息输入至所述情感分类模型，得到分别与每条所述第二对白文本对应的对白文本的情感分类结果。可选的，所述确定待测视频中的对白信息，包括：确定所述待测视频对应的至少一条字幕信息；确定预先设置的语言模型分别对每条所述字幕信息的评分结果；针对每条所述字幕信息，若所述字幕信息的评分结果在预先设置的评分阈值内，将所述字幕信息确定为一条对白文本。可选的，所述确定待测视频对应的至少一条字幕信息，包括：采用OCR...
一种情感分类方法及装置

【技术保护点】
1.一种情感分类方法，其特征在于，包括：确定待测视频中的对白信息，所述对白信息包括所述待测视频对应的至少一条对白文本；对所述至少一条对白文本中的每条对白文本进行数据清洗，得到分别与每条对白文本对应的第一对白文本；确定分别与每条所述第一对白文本对应的满足预设对白规则的第二对白文本；分别确定每条所述第二对白文本的文本向量；将每条所述第二对白文本的文本向量作为预设的情感分类模型的输入信息输入至所述情感分类模型，得到分别与每条所述第二对白文本对应的对白文本的情感分类结果。

【技术特征摘要】
1.一种情感分类方法，其特征在于，包括：确定待测视频中的对白信息，所述对白信息包括所述待测视频对应的至少一条对白文本；对所述至少一条对白文本中的每条对白文本进行数据清洗，得到分别与每条对白文本对应的第一对白文本；确定分别与每条所述第一对白文本对应的满足预设对白规则的第二对白文本；分别确定每条所述第二对白文本的文本向量；将每条所述第二对白文本的文本向量作为预设的情感分类模型的输入信息输入至所述情感分类模型，得到分别与每条所述第二对白文本对应的对白文本的情感分类结果。2.根据权利要求1所述的方法，其特征在于，所述确定待测视频中的对白信息，包括：确定所述待测视频对应的至少一条字幕信息；确定预先设置的语言模型分别对每条所述字幕信息的评分结果；针对每条所述字幕信息，若所述字幕信息的评分结果在预先设置的评分阈值内，将所述字幕信息确定为一条对白文本。3.根据权利要求2所述的方法，其特征在于，所述确定待测视频对应的至少一条字幕信息，包括：采用OCR识别方法识别所述待测视频中的每一帧图像的字幕信息；将识别到各条所述字幕信息确定为与所述待测视频对应的至少一条字幕信息。4.根据权利要求1所述的方法，其特征在于，所述对所述至少一条对白文本中的每条对白文本进行数据清洗，得到分别与每条对白文本对应的第一对白文本，包括：将满足预设的删除条件的字符删除后的所述对白文本中的文本内容，确定为与所述对白文本对应的第一对白文本。5.根据权利要求1所述的方法，其特征在于，所述确定分别与每条所述第一对白文本对应的满足预设对白规则的第二对白文本，包括：确定所述第一对白文本中的字符数；若所述第一对白文本中的字符数超过预设对白字符数时，从所述第一对白文本中选取所述预设对白字符数的字符，并将由选取到的各字符组成的文本确定为与所述第一对白文本对应的第二对白文本；若所述第一对白文本中的字符数未超过预设对白字符数时，在所述第一对白文本中添加预设字符，生成与所述第一对白文本对应的第二对白文本，其中，生成的与所述第一对白文本对应的第二对白文本包括的字符数与所述预设对白字符数相同。6.根据权利要求1所述的方法，其特征在于，所述分别确定每条所...

【专利技术属性】
技术研发人员：余咸国，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人