一种影视剧本人物情绪识别方法技术

技术编号:17912504 阅读:26 留言:0更新日期:2018-05-10 18:19
本发明专利技术公开了一种影视剧本人物情绪识别方法,涉及软件开发技术领域,通过建立合理的技术指标,利用数据挖掘,自然语言处理技术,实现对影视剧本内容自动化进行分析评估,科学、快速、准确的评估结果,大大提高了影视剧本分析评估工作的效率,减少了人力和时间的消耗,降低情感词库的依赖。此外,通过可视化的效果展示评估结果,方便阅读和理解。可视化的效果展示还可促进发现新的技术指标,对影视剧本进行进一步的深入分析,提升影视剧本分析评估的深度和广度,促进影视剧本创作质量和市场价值的提高。

【技术实现步骤摘要】
一种影视剧本人物情绪识别方法
本专利技术涉及软件开发
,特别是涉及一种影视剧本人物情绪识别方法。
技术介绍
在影视剧本中,人物情绪识别技术目前主要采用人工阅读剧本、分析影视剧本人物情绪的变化、结合专家评估意见进行人物情绪识别。由于人物情绪表现复杂度高,细粒度非常强,识别难度较大,受评估分析人员的主观喜好、文学修养、教育背景等影响比较大,针对同一种剧本的人物情绪识别结果存在比较大的差异;利用剧本主题、情感词、情绪词库等特征作为情绪识别的依据,甚至有可能得到完全相反的结论。在分析影视剧本人物情绪模型的过程中,需要考虑情绪词库,进行影视剧本的情绪匹配。这种利用情绪词库的情绪识别技术在准确度上依赖于词库的质量和词库大小,在时间方面消耗较大,且由于主观影响,不同人对语料库的标注产生不同信息,影响分类的结果。此外评估过程还需要与剧本作者、专家或业内人士进行深入沟通,需要不断进行文字修改和完善评估报告,评估中的数据和基于数据生成的图表不断变化,导致评估过程整体效率不高。通过以上分析,可以看出现有的影视剧本中人物情绪识别技术存在以下的弊端:a.评估过程和评估报告受评估人员影响比较大,缺乏标准。b.获取数据和分析数据需要消耗大量人力和时间成本。c.缺乏合适的数据处理工具,评估工作整体效率不高。d.严重依赖情绪词库的判断,对情绪词库的质量要求很高。
技术实现思路
本专利技术实施例提供了一种影视剧本人物情绪识别方法,可以解决现有技术中存在的问题。本专利技术提供了一种影视剧本人物情绪识别方法,该方法包括以下步骤:步骤1,对影视剧本的文本数据进行预处理,将多行数据的对白转换为一行,形成一人一句的对白数据;步骤2,特征提取,获取情绪得分,该步骤具体包括:(1)通过分词计算步骤1预处理过的每一句剧本的得分,得到剧本情绪得分指标,并提取相应的人物形成人物列表;(2)根据剧本内容计算文本情绪得分,建立情绪得分表,形成情绪得分字段表;(3)对情绪得分实现聚类分析,将得分持续处于某一阈值段的情绪得分打上标签;(4)根据标签、得分形成情绪标签库;(5)对情绪标签库和情绪标签做关联,形成改造后的对白情绪标签库;(6)计算场景数量,作为影视剧本拍摄难度指标;(7)根据场景、剧集、情绪标签、人物列表实现字段关联,得到最终的情绪得分。优选地,所述方法还包括:将步骤2中的计算结果以可视化方式进行展现。本专利技术实施例中的一种影视剧本人物情绪识别方法,根据专家评估的经验和依据,数字化的解读,建立情绪识别模型,以剧本对话内容作为数据分析对象,以情绪得分作为分析指标,利用情绪模型识别方法,实现影视剧本中人物情绪的定量和定性分析。通过提取情绪分析指标进行定量分析可达到以下目的:a.建立情绪得分指标,进行影视剧本的数字化分析,减少词库和人为因素对评估结果的干扰。b.使用软件技术实现分析指标的快速计算,获取情绪得分数据、生成图表,减少人工分析评估的工作量、提高数据的准确性。c.优化情绪得分分析指标,发现数据之间的内在联系,获取更多的评估结论,达到分析评估精细化、准确化的目的。d.通过建立在情绪模型上的可视化信息展示方式,准确识别情绪,研究新的分析评估方法。具体实施方式下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了一种影视剧本人物情绪识别方法,该方法包括以下步骤:步骤1,对影视剧本的文本数据进行预处理,将多行数据的对白转换为一行,形成一人一句的对白数据;步骤2,特征提取,获取情绪得分,该步骤具体包括:(1)通过分词计算步骤1预处理过的每一句剧本的得分,得到剧本情绪得分指标,并提取相应的人物形成人物列表;(2)根据剧本内容计算文本情绪得分,建立情绪得分表,形成情绪得分字段表;(3)对情绪得分实现聚类分析,将得分持续处于某一阈值段的情绪得分打上标签;(4)根据标签、得分形成情绪标签库;(5)对情绪标签库和情绪标签做关联,形成改造后的对白情绪标签库;(6)计算场景数量,作为影视剧本拍摄难度指标;(7)根据场景、剧集、情绪标签、人物列表实现字段关联,得到最终的情绪得分。步骤3,将步骤2中的计算结果以可视化方式进行展现。本领域内的技术人员应明白,本专利技术的实施例可提供为方法、系统、或计算机程序产品。因此,本专利技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本专利技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本专利技术是参照根据本专利技术实施例的方法、设备(系统)、和计算机程序产品的流程来描述的。应理解可由计算机程序指令实现每一流程以及流程的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在一个流程或多个流程中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在一个流程或多个流程中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在一个流程或多个流程中指定的功能的步骤。尽管已描述了本专利技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本专利技术范围的所有变更和修改。显然,本领域的技术人员可以对本专利技术进行各种改动和变型而不脱离本专利技术的精神和范围。这样,倘若本专利技术的这些修改和变型属于本专利技术权利要求及其等同技术的范围之内,则本专利技术也意图包含这些改动和变型在内。本文档来自技高网...

【技术保护点】
一种影视剧本人物情绪识别方法,其特征在于,该方法包括以下步骤:步骤1,对影视剧本的文本数据进行预处理,将多行数据的对白转换为一行,形成一人一句的对白数据;步骤2,特征提取,获取情绪得分,该步骤具体包括:(1)通过分词计算步骤1预处理过的每一句剧本的得分,得到剧本情绪得分指标,并提取相应的人物形成人物列表;(2)根据剧本内容计算文本情绪得分,建立情绪得分表,形成情绪得分字段表;(3)对情绪得分实现聚类分析,将得分持续处于某一阈值段的情绪得分打上标签;(4)根据标签、得分形成情绪标签库;(5)对情绪标签库和情绪标签做关联,形成改造后的对白情绪标签库;(6)计算场景数量,作为影视剧本拍摄难度指标;(7)根据场景、剧集、情绪标签、人物列表实现字段关联,得到最终的情绪得分。

【技术特征摘要】
1.一种影视剧本人物情绪识别方法,其特征在于,该方法包括以下步骤:步骤1,对影视剧本的文本数据进行预处理,将多行数据的对白转换为一行,形成一人一句的对白数据;步骤2,特征提取,获取情绪得分,该步骤具体包括:(1)通过分词计算步骤1预处理过的每一句剧本的得分,得到剧本情绪得分指标,并提取相应的人物形成人物列表;(2)根据剧本内容计算文本情绪得分,建立情绪得分表,形成情绪得分字段表;(3)对情绪得...

【专利技术属性】
技术研发人员:李乐
申请(专利权)人:西安影视数据评估中心有限公司
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1