将情绪相关元数据标注到多媒体文件的方法和装置制造方法及图纸

技术编号:33525683 阅读:18 留言:0更新日期:2022-05-19 01:46
本发明专利技术描述了用于概述具有主要叙述的多媒体对象的装置、系统、架构和方法。方法和过程可以包括:执行数据分析以在所述多媒体对象的场景中标识所述场景中指示的场景相关情绪;生成将所述场景中的每个场景与相应的一个或多个场景相关情绪关联的知识图;使用所述知识图计算多个分数,每个分数指示所述多个场景中的一个场景对传达所述主要叙述的相对重要性;根据所述多个分数选择所述多个场景的子集;和/或根据所述子集生成所述多媒体对象的摘要。或根据所述子集生成所述多媒体对象的摘要。或根据所述子集生成所述多媒体对象的摘要。

【技术实现步骤摘要】
【国外来华专利技术】将情绪相关元数据标注到多媒体文件的方法和装置

技术介绍

[0001]本专利技术在一些实施例中涉及媒体技术,并且更具体地、但不限于涉及电影标注软件。
[0002]和等流媒体和视频点播平台的推出,为电影业提供了向目标受众交付产品的新工具。因此,可供用户使用的在线视频内容急剧增加。这样的结果之一是观看者越来越难以从丰富的内容中发现与个人喜好相关的内容。传统的视频搜索工具只能通过通用指标来查找电影内容,无法全面地反映内容。此外,主观方面,制作电影的压缩版本的传统方法通常需要耗费大量的人力。这些方法通常也耗费大量时间,而且不一定能在用户之间正常转换。

技术实现思路

[0003]本专利技术的目的是提供用于丰富电影元数据的装置、系统和方法。本专利技术的目的是提供创建有意义的、语义丰富的电影场景描述的装置、系统和方法。本专利技术的目的是提供用于高效地生成多媒体对象的压缩版本的装置、系统和方法。本专利技术的目的是提供用于创建电影的简约形式的装置、系统和方法,保持电影的整体色调和基本叙述。本专利技术的目的是提供用于根据更全面表示内容的指标来搜索和分类多媒体内容的装置、系统和方法。本专利技术的目的是为了促进观看者根据特定兴趣、色调、模式和/或情绪选择的优选多媒体对象类型的装置、系统和方法。
[0004]前述和其它目的通过独立权利要求的特征实现。其它实现方式在从属权利要求、具体说明和附图中显而易见。
[0005]根据本专利技术的第一方面,提供了一种用于概述具有主要叙述的多媒体对象的系统,包括:处理器,执行可读指令从而进行以下操作:执行数据分析以在所述多媒体对象的多个场景中的每个场景中标识所述场景中指示的一个或多个场景相关情绪;生成将所述多个场景中的每个场景与相应的一个或多个场景相关情绪关联的知识图;使用所述知识图计算多个分数,每个分数指示所述多个场景中的一个场景对传达所述主要叙述的相对重要性;根据所述多个分数选择所述多个场景的子集;根据所述子集生成所述多媒体对象的摘要。
[0006]根据本专利技术的第二方面,提供了一种用于概述具有主要叙述的多媒体对象的方法,包括:执行数据分析以在所述多媒体对象的多个场景中的每个场景中标识所述场景中指示的一个或多个场景相关情绪;生成将所述多个场景中的每个场景与相应的一个或多个场景相关情绪关联的知识图;使用所述知识图计算多个分数,每个分数指示所述多个场景中的一个场景对传达所述主要叙述的相对重要性;根据所述多个分数选择所述多个场景的子集;根据所述子集生成所述多媒体对象的摘要。
[0007]在本专利技术各个方面的实现方式中,所述数据分析包括对所述多媒体对象的预处理,所述预处理包括从所述多媒体对象中提取以下中的至少一个:视频文件;字幕文件;详细描述所述多媒体对象的章节的起始时间的章节文本文件;演员语音和非语音部分的音频
文件片段。
[0008]在本专利技术各个方面的可能实现方式中,所述数据分析包括:擦除描述所述多媒体对象的关联元数据;分析所述关联元数据以指示所述一个或多个场景相关情绪。
[0009]在本专利技术各个方面的可能实现方式中,所述数据分析包括根据场景本体实现语义提升以捕获所述多媒体对象的原始多媒体信息。
[0010]在本专利技术各个方面的可能实现方式中,所述数据分析包括与描述所述多媒体对象的特征的外部源互联。
[0011]在本专利技术各个方面的可能实现方式中,所述特征包括以下中的至少一个:所述多媒体对象的场景;所述多媒体对象场景中的活动;在所述多媒体对象中表演的演员;所述多媒体对象中描绘的人物。
[0012]在本专利技术各个方面的可能实现方式中,所述数据分析包括分析所述多媒体对象的描述性音频原声带以指示所述一个或多个场景相关情绪。
[0013]在本专利技术各个方面的可能实现方式中,所述数据分析包括从视觉情绪指示符中提取所述情绪,所述视觉情绪指示符包括以下中的至少一个:面部表情图像;身体姿势图像;情绪指示行为的视频序列。
[0014]在本专利技术各个方面的可能实现方式中,所述数据分析包括从听觉情绪指示符中提取所述情绪,所述听觉情绪指示符包括以下中的至少一个:表示音乐原声带的情绪;情绪暗示性发声指示符。
[0015]在本专利技术各个方面的可能实现方式中,所述数据分析包括从文本情绪指示符中提取所述情绪,所述文本情绪指示符包括以下中的至少一个:显式情绪描述符;暗示性情绪指示符。
[0016]除非另有定义,否则本文所用的所有技术和科学术语都具有与本专利技术普通技术人员公知的含义相同的含义。虽然与本文描述的方法和材料类似或等效的方法和材料可以用于本专利技术实施例的实践或测试,但下文描述了示例性方法和/或材料。如有冲突,以本说明书为准。此外,这些材料、方法和示例仅是说明性的,并不一定具有限制性。
附图说明
[0017]此处仅作为示例,结合附图描述了本专利技术的一些实施例。现在具体结合附图,需要强调的是所示的项目作为示例,为了说明性地讨论本专利技术的实施例。这样,根据附图说明,如何实践本专利技术实施例对本领域技术人员而言是显而易见的。
[0018]在附图中:
[0019]图1A为本专利技术一些实施例提供的可选的操作流程的示意性流程图;
[0020]图1B为本专利技术一些实施例提供的示例性系统的示意图;
[0021]图1C为本专利技术一些实施例提供的示例性系统的示意图;
[0022]图2为本专利技术一些实施例提供的示例性系统架构的示意图;
[0023]图3为本专利技术一些实施例提供的示例性系统架构的示意图;
[0024]图4为本专利技术一些实施例提供的示例性系统架构的示意图;
[0025]图5A为表示图4的示例性系统架构的各个方面的原理图;
[0026]图5B为表示图4的示例性系统架构的各个方面的原理图;
[0027]图6为本专利技术一些实施例提供的示例性系统架构的示意图;
[0028]图7为本专利技术一些实施例提供的示例性系统架构的示意图;
[0029]图8为本专利技术一些实施例提供的示例性系统架构的示意图;
[0030]图9为本专利技术一些实施例提供的示例性系统架构的示意图;
[0031]图10为本专利技术一些实施例提供的示例性系统架构的示意图;
[0032]图11为本专利技术一些实施例提供的示例性系统架构的示意图;
[0033]图12A为本专利技术一些实施例提供的示例性系统架构的示意图;
[0034]图12B为图12A的架构指示的场景的示意图。
具体实施方式
[0035]在详细解释本专利技术的至少一个实施例之前,应理解,本专利技术在应用时并不一定限于以下描述和/或附图和/或示例中阐述的组件和/或方法的构造和布置的细节。本专利技术具有其它实施例,或者能够以各种方式实践或执行。
[0036]本专利技术实施例包括一个或多个装置、一个或多个系统、一个或多个方法、一个或多个架构和/或一个或多个计算机程序产品。所述计算机程序产品可包括具有计算机可读程序指令的计算机可读存储介质,计算机可读程序指令使得处理器执行本专利技术的各方面。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于概述具有主要叙述的多媒体对象的系统,其特征在于,包括:处理器,执行可读指令从而进行以下操作:执行数据分析以在所述多媒体对象的多个场景中的每个场景中标识所述场景中指示的一个或多个场景相关情绪;生成将所述多个场景中的每个场景与相应的一个或多个场景相关情绪关联的知识图;使用所述知识图计算多个分数,每个分数指示所述多个场景中的一个场景对传达所述主要叙述的相对重要性;根据所述多个分数选择所述多个场景的子集;根据所述子集生成所述多媒体对象的摘要。2.根据权利要求1所述的系统,其特征在于,所述数据分析包括对所述多媒体对象进行预处理,所述预处理包括从所述多媒体对象中提取以下中的至少一个:视频文件;字幕文件;详细描述所述多媒体对象的章节的起始时间的章节文本文件;演员语音和非语音部分的音频文件片段。3.根据权利要求1所述的系统,其特征在于,所述数据分析包括:擦除描述所述多媒体对象的关联元数据;分析所述关联元数据以指示所述一个或多个场景相关情绪。4.根据权利要求1所述的系统,其特征在于,所述数据分析包括根据场景本体实现语义提升以捕获所述多媒体对象的原始多媒体信息。5.根据权利要求1所述的系统,其特征在于,所述数据分析包括与描述所述多媒体对象的特征的外部源互联。6.根据权利要求5所述的系统,其特征在于,所述特征包括以下中的至少一个:所述多媒体对象的场景;所述多媒体对象场景中的活动;在所述多媒体对象中表演的演员;所述多媒体对象中描绘的人物。7.根据权利要求1所述的系统,其特征在于,所述数据分析包括分析所述多媒体对象的描述性音频原声带以指示所述一个或多个场景相关情绪。8.根据权利要求1所述的系统,其特征在于,所述数据分析包括从视觉情绪指示符中提取所述情绪,所述视觉情绪指示符包括以下中的至少一个:面部表情图像;身体姿势图像;情绪指示行为的视频序列。9.根据权利要求1所述的系统,其特征在于,所述数据分析包括从听觉情绪指示符中提取所述情绪,所述听觉情绪指示符包括以下中的至少一个:表示音乐原声带的情绪;情绪暗示性发声指示符。10.根据权利要求1所述的系统,其特征在于,所述数据分析包括从文本情绪指示符中
提取所述情绪,所述文本情绪指示符包括以下中的至少一个:显式情绪描述符;暗示性情绪指示符。11....

【专利技术属性】
技术研发人员:塔里克
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1