用于多模态故事内容输出的音效控制方法及系统技术方案

技术编号:20723761 阅读:34 留言:0更新日期:2019-03-30 17:27
本发明专利技术提供一种用于多模态故事内容输出的音效控制方法,其包含以下步骤:获取输出故事内容指令并响应;对待输出文本进行文本处理,提取文本处理结果中的场景信息,场景信息包括:对话场景;若检测到当前场景信息为预设场景,调整输出数据中的音乐参数及音效参数,音乐参数包括:背景音乐参数;音效参数包括角色音效参数。本发明专利技术提供了一种儿童专用智能设备,具备讲故事能力,能够向用户输出故事内容。并且,本发明专利技术还能够根据不同的故事内容以及故事场景,改变输出的音效效果,配合故事情节的发展,提升了用户的绘本阅读等内容获取的使用体验。

【技术实现步骤摘要】
用于多模态故事内容输出的音效控制方法及系统
本专利技术涉及人工智能领域,具体地说,涉及一种用于多模态故事内容输出的音效控制方法及系统。
技术介绍
随着科学技术的不断发展,信息技术、计算机技术以及人工智能技术的引入,机器人的研究已经逐步走出工业领域,逐渐扩展到了医疗、保健、家庭、娱乐以及服务行业等领域。而人们对于机器人的要求也从简单重复的机械动作提升为具有拟人问答、自主性及与其他机器人进行交互的智能机器人,人机交互也就成为决定智能机器人发展的重要因素。因此,提升智能机器人的交互能力,改善机器人的类人性和智能性,是现在亟需解决的重要问题。因此,本专利技术提供了一种用于多模态故事内容输出的音效控制方法及系统。
技术实现思路
为解决上述问题,本专利技术提供了一种用于多模态故事内容输出的音效控制方法,所述方法包含以下步骤:获取输出故事内容指令并响应;对待输出文本进行文本处理,提取文本处理结果中的场景信息,所述场景信息包括:对话场景;若检测到当前场景信息为预设场景,调整输出数据中的音乐参数及音效参数,所述音乐参数包括:背景音乐参数;所述音效参数包括角色音效参数。根据本专利技术的一个实施例,若检测到当前场景信息为预设场景,调整输出数据中的音乐参数及音效参数,包含以下步骤:当所述预设场景为对话场景时,降低当前背景音乐参数的媒体音量;当所述故事人物对话场景中的角色结束对话时,恢复当前背景音乐参数的媒体音量至预设音量。根据本专利技术的一个实施例,还包含以下步骤:当所述预设场景为对话场景时,插入文本中实体对应的音效参数。根据本专利技术的一个实施例,所述方法还包含以下步骤:对所述音效参数的循环播放次数进行设定。根据本专利技术的一个实施例,所述音效参数包含:落石音效、大海音效、风声音效、雨声音效以及打雷音效。根据本专利技术的另一个方面,还提供了一种程序产品,其包含用于执行如上任一项所述的方法步骤的一系列指令。根据本专利技术的另一个方面,还提供了一种用于多模态故事内容输出的音效控制装置,所述装置包含:响应模块,其用于获取输出故事内容指令并响应;提取模块,其用于对待输出文本进行文本处理,提取文本处理结果中的场景信息,所述场景信息包括:对话场景;调整模块,其用于若检测到当前场景信息为预设场景,调整输出数据中的音乐参数及音效参数,所述音乐参数包括:背景音乐参数;所述音效参数包括角色音效参数。根据本专利技术的一个实施例,所述调整模块包含:降低单元,其用于当所述预设场景为对话场景时,降低当前背景音乐参数的媒体音量;恢复单元,其用于当所述故事人物对话场景中的角色结束对话时,恢复当前背景音乐参数的媒体音量至预设音量。根据本专利技术的另一个方面,还提供了一种儿童专用智能设备,用于执行如上任一项所述的方法步骤的一系列指令。根据本专利技术的另一个方面,还提供了一种用于多模态故事内容输出的音效控制系统,所述系统包含:如上所述的儿童专用智能设备;云端大脑,其具备语义理解、视觉识别、认知计算以及情感计算,以决策所述儿童专用智能设备输出多模态数据。本专利技术提供的用于多模态故事内容输出的音效控制方法及系统提供了一种儿童专用智能设备,具备讲故事能力,能够向用户输出故事内容。并且,本专利技术还能够根据不同的故事内容以及故事场景,改变输出的音效效果,配合故事情节的发展,提升了用户的绘本阅读等内容获取的使用体验。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例共同用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1显示了根据本专利技术的一个实施例的用于多模态故事内容输出的音效控制方法流程图;图2显示了根据本专利技术的另一个实施例的用于多模态故事内容输出的音效控制方法流程图;图3显示了根据本专利技术的一个实施例的用于多模态故事内容输出的音效控制装置的模块框图;图4显示了根据本专利技术的一个实施例的用于多模态故事内容输出的音效控制系统的结构框图;图5显示了根据本专利技术的另一个实施例的用于多模态故事内容输出的音效控制系统的结构框图;以及图6显示了根据本专利技术的一个实施例的用于多模态故事内容输出的音效控制方法的另一流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,以下结合附图对本专利技术实施例作进一步地详细说明。为表述清晰,需要在实施例前进行如下说明:本专利技术提到的儿童专用智能设备支持多模态人机交互,具备自然语言理解、视觉感知、语言语音输出、情感表情动作输出等AI能力;可配置社会属性、人格属性、人物技能等,使用户享受智能化及个性化流畅体验。在具体的实施例中,儿童专用智能设备可以是儿童故事机、儿童平板、儿童手表以及儿童AI机器人等。儿童专用智能设备获取用户多模态数据,在云端大脑的能力支持下,对多模态数据进行语义理解、视觉识别、认知计算、情感计算,以完成决策输出的过程。所提到的云端大脑为提供所述儿童专用智能设备对用户的交互需求进行语义理解(语言语义理解、动作语义理解、视觉识别、情感计算、认知计算)的处理能力的终端,实现与用户的交互,以决策所述儿童专用智能设备输出多模态数据。下面结合附图对本专利技术的各个实施例进行详细描述。图1显示了根据本专利技术的一个实施例的用于多模态故事内容输出的音效控制方法流程图。如图1所示,在步骤S101中,获取输出故事内容指令并响应。在本专利技术的一个实施例中,儿童专用智能设备在启动后获取用户或周边环境输出的故事内容指令,在获取故事内容指令后,对故事内容指令进行响应。输出故事内容指令所指向的故事内容。需要说明的是,故事内容指令的形式为多模态的,可以是语音指令、动作指令、感知指令以及表情指令等多模态的指令。为了获取多模态的故事内容指令,儿童专用智能设备上也配备相应的输入输出装置。根据本专利技术的一个实施例,儿童专用智能设备上可以配置有虚拟人物“阿Q姐姐”,阿Q姐姐基于人工智能的虚拟角色,可以通过文本转语音的方式给小朋友讲故事,在小朋友听故事的过程中,如果小朋友有什么疑问,可以直接向阿Q姐姐提问,阿Q姐姐通过云端大脑决策答案,并使用小朋友能够易于接受的语音合成结果为小朋友输出故事内容。接着,在步骤S102中,对待输出文本进行文本处理,提取文本处理结果中的场景信息,场景信息包括:对话场景。所述文本的拾取可通过云端获取、本地内容库提取或绘本视觉识别进行,并不局限。在本步骤中,对于故事内容的文本进行文本处理,提取文本处理结果中的场景信息,为了对不同场景的音效进行区别控制,需要获知当前的场景。在一个实施例中,场景信息包括对话场景。在对话场景下,包含不同的角色,角色与角色之间展开对话,展现故事的内容。最后,在步骤S103中,若检测到当前场景信息为预设场景,调整输出数据中的音乐参数及音效参数,音乐参数包括:背景音乐参数;音效参数包括角色音效参数。在本步骤中,根据本专利技术的一个实施例,当预设场景为对话场景时,降低当前背景音乐参数的媒体音量。当故事人物对话场景中的角色结束对话时,恢复当前背景音乐参数的媒体音量至预设音量。另外,在一个实施例中,当预设场景为对话场景时,插入文本中实体对应的音效参数。音效参数包含:落石音效、本文档来自技高网...

【技术保护点】
1.一种用于多模态故事内容输出的音效控制方法,其特征在于,所述方法包含以下步骤:获取输出故事内容指令并响应;对待输出文本进行文本处理,提取文本处理结果中的场景信息,所述场景信息包括:对话场景;若检测到当前场景信息为预设场景,调整输出数据中的音乐参数及音效参数,所述音乐参数包括:背景音乐参数;所述音效参数包括角色音效参数。

【技术特征摘要】
1.一种用于多模态故事内容输出的音效控制方法,其特征在于,所述方法包含以下步骤:获取输出故事内容指令并响应;对待输出文本进行文本处理,提取文本处理结果中的场景信息,所述场景信息包括:对话场景;若检测到当前场景信息为预设场景,调整输出数据中的音乐参数及音效参数,所述音乐参数包括:背景音乐参数;所述音效参数包括角色音效参数。2.如权利要求1所述的方法,其特征在于,若检测到当前场景信息为预设场景,调整输出数据中的音乐参数及音效参数,包含以下步骤:当所述预设场景为对话场景时,降低当前背景音乐参数的媒体音量;当所述故事人物对话场景中的角色结束对话时,恢复当前背景音乐参数的媒体音量至预设音量。3.如权利要求1或2所述的方法,其特征在于,还包含以下步骤:当所述预设场景为对话场景时,插入文本中实体对应的音效参数。4.如权利要求3所述的方法,其特征在于,所述方法还包含以下步骤:对所述音效参数的循环播放次数进行设定。5.如权利要求1-4中任一项所述的方法,其特征在于,所述音效参数包含:落石音效、大海音效、风声音效、雨声音效以及打雷音效。6.一种程序产品,其包含用于...

【专利技术属性】
技术研发人员:贾志强俞晓君
申请(专利权)人:北京光年无限科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1