虚拟形象控制方法、虚拟形象控制装置和电子设备制造方法及图纸

技术编号:21345780 阅读:13 留言:0更新日期:2019-06-13 23:18
本申请提供的虚拟形象控制方法、虚拟形象控制装置和电子设备,涉及直播技术领域。详细地,本申请通过获取主播输入的语音信息;并对所述语音信息进行语音分析处理,得到对应的语音参数。然后,根据预设的参数转换算法将所述语音参数转换为控制参数,并根据该控制参数对所述虚拟形象的口型进行控制。通过上述方法,可以改善现有技术中对虚拟形象的控制存在精度较低的问题。

【技术实现步骤摘要】
虚拟形象控制方法、虚拟形象控制装置和电子设备
本申请涉及直播
,具体而言,涉及一种虚拟形象控制方法、虚拟形象控制装置和电子设备。
技术介绍
现有技术中,为了提高直播的趣味性,可以采用虚拟形象替代主播的实际形象在直播画面中进行展示。但是,在现有的直播技术中对虚拟形象的控制精度一般较低,在用户观看展示的虚拟形象时存在着体验度较低的问题。
技术实现思路
有鉴于此,本申请的目的在于提供一种虚拟形象控制方法、虚拟形象控制装置和电子设备,以改善现有技术中对虚拟形象的控制存在精度较低的问题。为实现上述目的,本申请实施例采用如下技术方案:一种虚拟形象控制方法,应用于直播设备,用于对直播画面中展示的虚拟形象进行控制,所述方法包括:获取主播输入的语音信息;对所述语音信息进行语音分析处理,得到对应的语音参数;根据预设的参数转换算法将所述语音参数转换为控制参数,并根据该控制参数对所述虚拟形象的口型进行控制。在本申请实施例较佳的选择中,在上述虚拟形象控制方法中,所述对所述语音信息进行语音分析处理,得到对应的语音参数的步骤,包括:将所述语音信息进行分段处理,并提取分段后每一段语音信息中设定时长度的语音片段;对提取的每个语音片段分别进行语音分析处理,得到每个语音片段对应的语音参数。在本申请实施例较佳的选择中,在上述虚拟形象控制方法中,所述将所述语音信息进行分段处理,并提取分段后每一段语音信息中设定长度内的语音片段的步骤,具体为:按照每间隔设定长度提取所述语音信息中该设定长度内的语音片段。在本申请实施例较佳的选择中,在上述虚拟形象控制方法中,所述将所述语音信息进行分段处理,并提取分段后每一段语音信息中设定时长内的语音片段的步骤,具体为:按照所述语音信息的连续性对该语音信息进行分段处理,并提取分段后每一段语音信息中设定长度内的语音片段。在本申请实施例较佳的选择中,在上述虚拟形象控制方法中,所述对提取的每个语音片段进行语音分析处理,得到每个语音片段对应的语音参数的步骤,包括:提取每个语音片段的振幅信息;针对每个语音片段,根据该语音片段的振幅信息计算得到该语音片段对应的语音参数。在本申请实施例较佳的选择中,在上述虚拟形象控制方法中,所述根据该语音片段的振幅信息计算得到该语音片段对应的语音参数的步骤,具体为:根据该语音片段的帧长信息和所述振幅信息按照归一化算法进行计算,得到该语音片段对应的语音参数。在本申请实施例较佳的选择中,在上述虚拟形象控制方法中,所述控制参数包括所述虚拟形象的上下嘴唇之间的唇间距以及嘴角角度二者中的至少一个。在本申请实施例较佳的选择中,在上述虚拟形象控制方法中,当所述控制参数包括所述唇间距时,该唇间距根据所述语音参数和预设的与所述虚拟形象对应的最大唇间距按照预设的参数转换算法计算得到;当所述控制参数包括所述嘴角角度时,该嘴角角度根据所述语音参数和预设的与所述虚拟形象对应的最大嘴角角度按照预设的参数转换算法计算得到。在本申请实施例较佳的选择中,在上述虚拟形象控制方法中,当所述控制参数包括所述唇间距时,所述最大唇间距根据所述主播的唇间距设置;当所述控制参数包括所述嘴角角度时,所述最大嘴角角度根据所述主播的嘴角角度设置。本申请实施例还提供了一种虚拟形象控制装置,应用于直播设备,用于对直播中的虚拟形象进行控制,所述装置包括:语音获取模块,用于获取主播输入的语音信息;语音分析模块,用于对所述语音信息进行语音分析处理,得到对应的语音参数;口型控制模块,用于根据预设的参数转换算法将所述语音参数转换为控制参数,并根据该控制参数对所述虚拟形象的口型进行控制。在上述基础上,本申请实施例还提供了一种电子设备,包括存储器、处理器和存储于该存储器并能够在该处理器上运行的计算机程序,该计算机程序在该处理器上运行时实现上述的虚拟形象控制方法的步骤。在上述基础上,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现上述的虚拟形象控制方法的步骤。本申请提供的虚拟形象控制方法、虚拟形象控制装置和电子设备,通过获取主播的语音信息,并基于该语音信息和预设的参数转换算法对虚拟形象的口型进行控制,使得在直播时播放的语音与虚拟形象的口型具有较高的一致性,从而改善现有技术中因对虚拟形象的控制精度较低而导致直播时播放的语音与虚拟形象的口型不匹配的问题,进而有效地提高用户体验。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明图1为本申请实施例提供的电子设备的方框示意图。图2为本申请实施例提供的虚拟形象控制方法的流程示意图。图3为图2中步骤S130包括的子步骤的流程示意图。图4为图3中步骤S133包括的子步骤的流程示意图。图5为本申请实施例提供的20帧语音数据的示意图。图6为本申请实施例提供的虚拟形象的唇间距和嘴角角度的示意图。图7为本申请实施例提供的直播设备的交互示意图。图8为本申请实施例提供的直播界面的一种示意图。图9为本申请实施例提供的虚拟形象控制装置包括的功能模块的方框示意图。图标:10-电子设备;12-存储器;14-处理器;20-第一终端;30-第二终端;40-服务器;100-虚拟形象控制装置;110-语音获取模块;130-语音分析模块;150-口型控制模块。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本申请的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。在本申请的描述中,术语“第一”、“第二”、“第三”、“第四”等仅用于区分描述,而不能理解为只是或暗示相对重要性。如图1所示,本申请实施例提供了一种电子设备10。其中,该电子设备10可以作为一种直播设备,例如,可以是主播在直播时使用的终端设备(如手机、平板电脑、电脑等),也可以是与主播在直播时使用终端设备通信连接的后台服务器。详细地,所述电子设备10可以包括存储器12、处理器14和虚拟形象控制装置100。所述存储器12和处理器14之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述虚拟形象控制装置100包括至少一个可以软件或固件(firmware)的形式存储于所述存储器12中的软件功能模块。所述处理器14用于执行所述存储器12中存储的可执行的计算机程序,例如,所述虚拟形象控制装置100所包括的软件功能模块及计算机程序等,以实现虚拟形象控制方法,进而保证可以对虚拟形象进行较高精度的控制。其中,所述存储器12可以是,但不限于,随机存取存储器(RandomAccessMemory,RAM),只读存储器(Rea本文档来自技高网...

【技术保护点】
1.一种虚拟形象控制方法,其特征在于,应用于直播设备,用于对直播画面中展示的虚拟形象进行控制,所述方法包括:获取主播输入的语音信息;对所述语音信息进行语音分析处理,得到对应的语音参数;根据预设的参数转换算法将所述语音参数转换为控制参数,并根据该控制参数对所述虚拟形象的口型进行控制。

【技术特征摘要】
1.一种虚拟形象控制方法,其特征在于,应用于直播设备,用于对直播画面中展示的虚拟形象进行控制,所述方法包括:获取主播输入的语音信息;对所述语音信息进行语音分析处理,得到对应的语音参数;根据预设的参数转换算法将所述语音参数转换为控制参数,并根据该控制参数对所述虚拟形象的口型进行控制。2.根据权利要求1所述的虚拟形象控制方法,其特征在于,所述对所述语音信息进行语音分析处理,得到对应的语音参数的步骤,包括:将所述语音信息进行分段处理,并提取分段后每一段语音信息中设定长度内的语音片段;对提取的每个语音片段分别进行语音分析处理,得到每个语音片段对应的语音参数。3.根据权利要求2所述的虚拟形象控制方法,其特征在于,所述将所述语音信息进行分段处理,并提取分段后每一段语音信息中设定长度内的语音片段的步骤,具体为:按照每间隔设定长度提取所述语音信息中该设定长度内的语音片段。4.根据权利要求2所述的虚拟形象控制方法,其特征在于,所述将所述语音信息进行分段处理,并提取分段后每一段语音信息中设定长度内的语音片段的步骤,具体为:按照所述语音信息的连续性对该语音信息进行分段处理,并提取分段后每一段语音信息中设定长度内的语音片段。5.根据权利要求2所述的虚拟形象控制方法,其特征在于,所述对提取的每个语音片段进行语音分析处理,得到每个语音片段对应的语音参数的步骤,包括:提取每个语音片段的振幅信息;针对每个语音片段,根据该语音片段的振幅信息计算得到该语音片段对应的语音参数。6.根据权利要求5所述的虚拟形象控制方法,其特征在于,所述根据该语音片段的振幅信息计算得到该语音片段对应的语音参数的步骤,具体为:根据该语音片段的...

【专利技术属性】
技术研发人员:王云刚徐子豪周志颖李政
申请(专利权)人:广州虎牙信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1