System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 直播间的语音互动方法、装置、直播系统、设备及介质制造方法及图纸_技高网

直播间的语音互动方法、装置、直播系统、设备及介质制造方法及图纸

技术编号:40810411 阅读:4 留言:0更新日期:2024-03-28 19:32
本申请涉及一种直播间的语音互动方法、装置、直播系统、电子设备及计算机可读存储介质;所述方法包括:在主播开启AI语音互动模式时,利用AI服务器上预先训练的主播的声音模型生成相应的口播语音模板集合,口播语音模板保存至少一段与直播间的动态变化事件相关联的语音内容;当检测到观众用户触发设定的动态变化事件时,选择与该动态变化相匹配的第一口播语音模板;根据观众用户的用户属性信息调用所述主播的声音模型生成主播声音发音的用户信息语音;将用户信息语音和第一口播语音模板进行合成得到AI互动语音,并在直播间播放所述AI互动语音;该技术方案,提升主播的直播效率,提升了直播间互动的真实性,有助于提升直播间活跃度。

【技术实现步骤摘要】

本申请涉及视频直播,特别是一种直播间的语音互动方法、装置、直播系统、电子设备及计算机可读存储介质。


技术介绍

1、随着网络技术发展,网络直播已经得到大部分网络用户的使用,其中视频直播以其内容和形式的直观性、即时性和互动性,在促进灵活就业、促进经济社会发展、丰富人民群众精神文化生活等方面发挥了重要作用,主播可以在直播中更好地展现自己才艺才华,从而为更多主播实现了自我价值。

2、在直播平台的直播间中,主播与观众主要是进行音视频的互动,特别是有些语音房,主要就是语音直播,在语音直播中,主播经常需要通过口述的形式欢迎观众进场,或者在收到用户赠送的虚拟礼物时,口述感谢观众,或者一些赠送的礼物需要主播读播,在观众用户进场比较多或者刷礼比较多时,主播需要花费大量时间进行口播,降低了主播的直播效率,导致主播无法在直播中更好地展现其他才艺才华。

3、目前,提高主播的直播效率,在一些直播平台上提供了系统读播方式来欢迎观众进场和感谢观众送礼等,可以让主播在直播的过程中可以有更多时间去做更多内容的直播,但是系统读播效果与真实口播之间存在较大差距,且表达形式有限,在与观众的互动中缺乏真实性,容易影响观众观看直播的积极性,降低了直播间的日活量。


技术实现思路

1、基于此,有必要提供一种直播间的语音互动方法、装置、直播系统、电子设备及计算机可读存储介质,以提升主播的直播效率以及直播间互动真实性。

2、一种直播间的语音互动方法,包括:

3、在主播开启ai语音互动模式时,利用ai服务器上预先训练的所述主播的声音模型生成相应的口播语音模板集合;其中,所述口播语音模板保存至少一段与直播间的动态变化事件相关联的语音内容;

4、当检测到观众用户触发设定的动态变化事件时,从所述口播语音模板集合中选择与该动态变化相匹配的第一口播语音模板;

5、获取所述观众用户的用户属性信息,并根据所述用户属性信息调用所述主播的声音模型生成所述主播声音发音的用户信息语音;

6、将所述用户信息语音和第一口播语音模板进行合成得到ai互动语音,并在直播间播放所述ai互动语音。

7、在一个实施例中,所述口播语音模板保存欢迎观众用户进入直播间的话术语音,所述观众用户触发动态变化为新的观众用户进入直播间;

8、或者

9、所述口播语音模板保存感谢观众用户赠送礼物的话术语音,所述观众用户触发动态变化为直播间的观众用户向主播赠送礼物。

10、在一个实施例中,所述当检测到观众用户触发设定的动态变化事件时,从所述口播语音模板集合中选择与该动态变化相匹配的第一口播语音模板,包括:

11、当检测到观众用户进入直播间时,从所述口播语音模板集合中选择与观众用户进入直播间相匹配的欢迎观众用户进入直播间的话术语音;

12、或者

13、当检测到直播间的观众用户向主播赠送礼物时,从所述口播语音模板集合中选择与观众用户所赠送礼物相匹配的感谢观众用户赠送礼物的话术语音。

14、在一个实施例中,所述获取所述观众用户的用户属性信息,并根据所述用户属性信息调用所述主播的声音模型生成所述主播声音发音的用户信息语音,包括:

15、获取所述观众用户的用户昵称信息;

16、将所述用户昵称信息的第一文本内容发送至ai服务器,调用所述主播的声音模型转换为所述主播声音的用户昵称语音;

17、所述将所述用户信息语音和第一口播语音模板进行合成得到ai互动语音,包括:

18、将所述用户昵称语音与所述欢迎观众用户进入直播间的话术语音按顺序进行合成得到欢迎观众用户进入直播间的ai互动语音;

19、或者

20、将所述用户昵称语音与所述感谢观众用户赠送礼物的话术语音按顺序进行合成得到感谢观众用户赠送礼物的ai互动语音。

21、在一个实施例中,在主播开启ai语音互动模式时,还包括:

22、获取直播间的实时状态信息,生成所述实时状态信息的第二文本内容;

23、将所述第二文本内容发送至ai服务器,利用所述主播的声音模型预先生成描述直播间实时状态的第二口播语音模板;其中,所述口播语音模板保存所述实时状态信息相关联的语音内容;

24、将所述用户信息语音、第一口播语音模板和第二口播语音模板进行合成得到ai互动语音。

25、在一个实施例中,所述口播语音模板集合包括多种动态变化类型的口播语音模板;其中每种动态变化类型包括多个口播语音模板;

26、所述从所述口播语音模板集合中选择与该动态变化相匹配的第一口播语音模板,包括:

27、确定口播语音模板集合中与动态变化类型相匹配的口播语音模板类型,以随机方式从所述相匹配的口播语音模板类型中选择第一口播语音模板。

28、在一个实施例中,所述在直播间播放所述ai互动语音,包括:

29、响应于主播触发开启ai互动语音功能的指令,获取设定时间内产生的ai互动语音;

30、将获取的ai互动语音按产生时间顺序缓存到队列中,根据队列的排序在直播间逐一播放所述ai互动语音;

31、当主播触发关闭ai互动语音功能的指令时,停止生成和播放所述ai互动语音。

32、在一个实施例中,在开启ai互动语音功能之后,还包括:

33、实时监测主播端麦克风的输入状态;

34、当检测到麦克风输入主播语音时,暂停播放所述ai互动语音,并在直播间播放所述主播语音;

35、当检测到麦克风停止输入主播语音时,恢复播放设定时间内产生的ai互动语音。

36、在一个实施例中,所述的直播间的语音互动方法,还包括:

37、收集各个主播的干声数据;

38、提取各个主播的干声数据的声音特征;

39、建立学习模型,并利用所述声音特征对所述学习模型进行训练,分别得到克隆各个主播声音的声音模型;

40、建立各个声音模型与主播的用户身份证明之间的对应关系,并将所述声音模型存储到ai服务器上。

41、一种直播间的语音互动装置,包括:

42、模板生成模块,用于在主播开启ai语音互动模式时,利用ai服务器上预先训练的所述主播的声音模型生成相应的口播语音模板集合;其中,所述口播语音模板保存至少一段与直播间的动态变化事件相关联的语音内容;

43、模板匹配模块,用于当检测到观众用户触发设定的动态变化事件时,从所述口播语音模板集合中选择与该动态变化相匹配的第一口播语音模板;

44、语音生成模块,用于获取所述观众用户的用户属性信息,并根据所述用户属性信息调用所述主播的声音模型生成所述主播声音发音的用户信息语音;

45、语音互动模块,用于将所述用户信息语音和第一口播语音模板进行合成得到ai互动语音,并在直播间播放所述ai互动语音。

46、一种直播系统本文档来自技高网...

【技术保护点】

1.一种直播间的语音互动方法,其特征在于,包括:

2.根据权利要求1所述的直播间的语音互动方法,其特征在于,所述口播语音模板保存欢迎观众用户进入直播间的话术语音,所述观众用户触发动态变化为新的观众用户进入直播间;

3.根据权利要求2所述的直播间的语音互动方法,其特征在于,所述当检测到观众用户触发设定的动态变化事件时,从所述口播语音模板集合中选择与该动态变化相匹配的第一口播语音模板,包括:

4.根据权利要求3所述的直播间的语音互动方法,其特征在于,所述获取所述观众用户的用户属性信息,并根据所述用户属性信息调用所述主播的声音模型生成所述主播声音发音的用户信息语音,包括:

5.根据权利要求1所述的直播间的语音互动方法,其特征在于,在主播开启AI语音互动模式时,还包括:

6.根据权利要求1所述的直播间的语音互动方法,其特征在于,所述口播语音模板集合包括多种动态变化类型的口播语音模板;其中每种动态变化类型包括多个口播语音模板;

7.根据权利要求1所述的直播间的语音互动方法,其特征在于,所述在直播间播放所述AI互动语音,包括:

8.根据权利要求7所述的直播间的语音互动方法,其特征在于,在开启AI互动语音功能之后,还包括:

9.根据权利要求1-8任一项所述的直播间的语音互动方法,其特征在于,还包括:

10.一种直播间的语音互动装置,其特征在于,包括:

11.一种直播系统,其特征在于,包括:主播端、观众端以及直播服务器;其中,所述主播端和观众端分别通过通信网络连接至所述直播服务器;

12.一种电子设备,其特征在于,该电子设备,其包括:

13.一种计算机可读存储介质,其特征在于,所述存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行权利要求1-9任一项所述的直播间的语音互动方法的步骤。

...

【技术特征摘要】

1.一种直播间的语音互动方法,其特征在于,包括:

2.根据权利要求1所述的直播间的语音互动方法,其特征在于,所述口播语音模板保存欢迎观众用户进入直播间的话术语音,所述观众用户触发动态变化为新的观众用户进入直播间;

3.根据权利要求2所述的直播间的语音互动方法,其特征在于,所述当检测到观众用户触发设定的动态变化事件时,从所述口播语音模板集合中选择与该动态变化相匹配的第一口播语音模板,包括:

4.根据权利要求3所述的直播间的语音互动方法,其特征在于,所述获取所述观众用户的用户属性信息,并根据所述用户属性信息调用所述主播的声音模型生成所述主播声音发音的用户信息语音,包括:

5.根据权利要求1所述的直播间的语音互动方法,其特征在于,在主播开启ai语音互动模式时,还包括:

6.根据权利要求1所述的直播间的语音互动方法,其特征在于,所述口播语音模板集合包括多种动态变化类型的口播语音模板;其中每种动态变...

【专利技术属性】
技术研发人员:曾衍
申请(专利权)人:广州方硅信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1