一种全感数字人直播系统及其操作方法技术方案

技术编号:37871837 阅读:18 留言:0更新日期:2023-06-15 21:01
本发明专利技术公开了一种全感数字人直播系统及其操作方法,包括场景模块,预览模块,直播工具栏模块,输出模块以及文案播报模块,场景模块能够插入不同类型的若干层,且场景模块通过拖拉调节若干层之间的层叠关系,预览模块内设置预览窗,输出模块内设置输出窗;文案播报模块支持导入xls格式的文案库,文案库提取主持人带有关键字的整行,且能够对文案库中的文案进行自动分段,文案库导入后自动按顺序调用接口生成视频。通过AI自动匹配或半人工决策方式进行互动播放处理,解决直播场景过程中,数字内容生产、直播间互动、数字互动白板提示、画面融合等核心问题;能够降低门槛拥有更稳定、超写实、智能化的数字主播,实现企业生产力的真正解放。解放。解放。

【技术实现步骤摘要】
一种全感数字人直播系统及其操作方法


[0001]本专利技术涉及数字直播系统
,尤其涉及一种全感数字人直播系统及其操作方法。

技术介绍

[0002]直播已经成为企业及品牌获客、转化不可或缺的手段,国内已有百度智能云曦灵数字人直播平台,聚焦电商直播、品牌营销、互动娱乐等领域,实现超写实数字人24小时纯AI直播,微软小冰、科大讯飞等国内外厂商都在数字人与直播方面加大投入研究。
[0003]然而,在直播爆火的背后,真人主播能力参差不齐和稳定性弱、直播硬件及场景成本高、运营门槛高、闲时流量无法有效利用,也成为大多数品牌方做好直播的制约因素。另一方面,现有的数字人直播系统交互性较差,实际应用场景对数字人2D\3D形象及数字人互动实时性的要求越来越高,目前的数字直播间互动实时性并不理想,无论是从底层算法的优化,还是到应用模式的落地创新,都需要进行优化改善,因此急需一种较为专业的数字人直播系统以解决上述缺陷。

技术实现思路

[0004]本专利技术克服了现有技术的不足,提供一种全感数字人直播系统及其操作方法。
[0005]为达到上述目的,本专利技术提供了一种技术方案为:
[0006]一种全感数字人直播系统及其操作方法,包括:场景模块,预览模块,直播工具栏模块,资源模块,输出模块以及文案播报模块,所述场景模块能够插入不同类型的若干层,所述层的类型包括:视频,场景图片、数字人视频以及互动白板,且所述场景模块通过拖拉调节若干所述层之间的层叠关系,所述预览模块内设置预览窗,所述输出模块内设置输出窗
[0007]所述文案播报模块支持导入x l s格式的文案库,所述文案库提取主持人带有关键字的整行,且能够对文案库中的文案进行自动分段,所述文案库导入后自动按顺序调用接口生成视频。
[0008]本专利技术中的一个较佳实施例中,所述文案库中的文案状态包括:正在播放状态,生成中状态以及点击播放状态,所述生成中状态不可点击播放,所述点击播放状态能够在所述预览窗和所述输出窗播放。
[0009]本专利技术中的一个较佳实施例中,还包括菜单栏模块,所述菜单栏模块用于选择竖屏直播或横屏直播,且所述菜单栏模块分别在所述预览窗与所述输出窗以不同形式展现。
[0010]本专利技术中的一个较佳实施例中,所述预览模块用于播放各个层合成的效果,视频导入所述预览模块后默认自动播放,且能够将预览画面内容同步到所述输出窗。
[0011]本专利技术还提供了另一种技术方案为,一种全感数字人直播系统的操作方法,包括以下步骤:
[0012]步骤S1:开启数字人直播,选择开启一个新的数字人直播项目,设置直播名称、横
屏竖屏和分辨率;
[0013]步骤S2:资源设置,在编辑界面,左下侧菜单栏为资源模块,通过资源模块添加若干控件,若干所述控件包括:视频素材控件、数字人模板素材控件、场景图片素材控件以及互动白板素材控件;
[0014]步骤S3:播报文本导入,数字人直播内容需要提前通过exce l表的方式导入播报文本,预先生成数字人视频,同时根据直播间互动评论内容,实时输入文本生成数字人视频进行播报回复;
[0015]步骤S4:数字人视频的播放,根据播报文本生成的数字人保存在本地或通过视频流的方式拉取,点击指定的播报文本,驱动数字人进行播报;
[0016]步骤S5:预览画面同步到直播画面,在预览画面中调整好各个层级的画面后,可同步预览画面到直播画面中。
[0017]本专利技术中的一个较佳实施例中,数字人大小及位置,互动白板大小及位置以及背景图片大小及位置均可进行拖动。
[0018]本专利技术中的一个较佳实施例中,所述步骤S2中,还可通过资源模块对控件进行显示或隐藏、锁定以及删除,且能够通过拖拽控件进行调换显示层级。
[0019]本专利技术中的一个较佳实施例中,所述步骤S2中,若干所述控件包括:视频素材控件、数字人模板素材控件、场景图片素材控件以及互动白板素材控件。
[0020]本专利技术中的一个较佳实施例中,所述步骤S5中,在预览画面中调整好各个层级的画面后,同步预览画面到直播画面中,根据直播的需要,选择横屏或竖屏的画面,在预览画面中旋转横竖屏后,重新排版再同步到直播画面。
[0021]本专利技术解决了
技术介绍
中存在的缺陷,本专利技术具备以下有益效果:
[0022](1)本专利技术中的全感数字人直播系统主要针对文本实时编辑生成数字人视频并通过AI自动匹配或半人工决策方式进行互动播放进行处理,解决直播场景过程中,数字内容生产、直播间互动、数字互动白板提示、画面融合等核心问题。能够降低门槛拥有更稳定、超写实、智能化的数字主播,实现企业生产力的真正解放。
[0023](2)通过集成自然语言处理底层技术分析文本内容,获取语义意图与情绪波动,驱动数字人进行拟人化表现,实现数字人表情、动作及声音的自然表达,以确保数字人的表情更加丰富,动作姿势和语速更加地自然,观众在观看时会感觉很顺畅,更容易产生信任感,直播效果更好,相比于市场上采用预生成视频的方式,能够满足交互性较强实时性较高的直播应用场景,更好地实现直播间互动。
附图说明
[0024]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]图1为本专利技术优选实施例中的使用步骤流程示意图;
[0026]图2为本专利技术优选实施例中的产品架构示意图。
具体实施方式
[0027]为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施方式对本专利技术进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
[0028]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是,本专利技术还可以采用其他不同于在此描述的其他方式来实施,因此,本专利技术的保护范围并不受下面公开的具体实施例的限制。
[0029]如图1和图2所示,一种全感数字人直播系统及其操作方法,包括:场景模块,预览模块,直播工具栏模块,输出模块以及文案播报模块,还包括菜单栏模块,所述菜单栏模块用于选择竖屏直播或横屏直播,且所述菜单栏模块分别在所述预览窗与所述输出窗以不同形式展现,所述文案库中的文案状态包括:正在播放状态,生成中状态以及点击播放状态,所述生成中状态不可点击播放,所述点击播放状态能够在所述预览窗和所述输出窗播放,所述场景模块能够插入不同类型的若干层,所述层的类型包括:视频,场景图片、数字人视频以及互动白板,所述视频包括:数字人视频、背景视频以及已有视频,且所述场景模块通过拖拉调节若干所述层之间的层叠关系,所述预览模块内设置预览窗,所述输出模块内设置输出窗;
[0030]本专利技术中的一个较佳实施例中,所述文案播报模块支持导入x l s格式的文案库,所述文案库提取主持人本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种全感数字人直播系统,包括场景模块,预览模块,直播工具栏模块,资源模块,输出模块以及文案播报模块,其特征在于,所述场景模块能够插入不同类型的若干层,所述层的类型包括:视频,场景图片、数字人视频以及互动白板,且所述场景模块通过拖拉调节若干所述层之间的层叠关系,所述预览模块内设置预览窗,所述输出模块内设置输出窗;所述文案播报模块支持导入xls格式的文案库,所述文案库提取主持人带有关键字的整行,且能够对文案库中的文案进行自动分段,所述文案库导入后自动按顺序调用接口生成视频。2.根据权利要求1所述的一种全感数字人直播系统,其特征在于,所述文案库中的文案状态包括:正在播放状态,生成中状态以及点击播放状态,所述生成中状态不可点击播放,所述点击播放状态能够在所述预览窗和所述输出窗播放。3.根据权利要求1所述的一种全感数字人直播系统,其特征在于,还包括菜单栏模块,所述菜单栏模块用于选择竖屏直播或横屏直播,且所述菜单栏模块分别在所述预览窗与所述输出窗以不同形式展现。4.根据权利要求1所述的一种全感数字人直播系统,其特征在于,所述预览模块用于播放各个层合成的效果,视频导入所述预览模块后默认自动播放,且能够将预览画面内容同步到所述输出窗。5.一种全感数字人直播系统的操作方法,其特征在于,包括以下步骤:步骤S1:开启数字人直播,选择开启一个新的数字人直播项目,设置直播名称、横屏...

【专利技术属性】
技术研发人员:林云帆林龙符志成
申请(专利权)人:广州数娱信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1