数字人的控制方法、文本大模型的训练方法、系统技术方案

技术编号:41802826 阅读:37 留言:0更新日期:2024-06-24 20:24
本公开提供一种数字人的控制方法、文本大模型的训练方法、系统,包括:获得提示,提示包括待执行任务、动作候选集、待处理文本,待执行任务用于指示在待处理文本中插入与待处理文本对应的动作标签,动作候选集中包括动作标签列表,将提示输入至预设大模型,得到预测文本,预测文本包括待处理文本、以及插入至待处理文本中的目标动作标签,目标动作标签对应目标动作,根据预测文本控制数字人输出交互视频,交互视频包括数字人播报待处理文本、以及数字人执行的目标动作,以提高对数字人控制的准确性和可靠性。

【技术实现步骤摘要】

本说明书涉及人工智能,尤其涉及一种数字人的控制方法、文本大模型的训练方法、系统


技术介绍

1、随着人工智能技术的发展,数字人被广泛应用于多种场景,而如何进行数字人驱动,以提高用户与数字人之间的交互体验是数字人控制的重点方向之一。

2、在相关技术中,控制系统可以设置动作库,动作库中包括与各短语各自对应的动作信息,相应的,在控制系统获得数字人的待播报文本的情况下,可以基于待播报文本中的短语与动作库中的动作信息进行匹配,以获得相应的动作信息,并控制数字人执行获得的动作信息。

3、然而,在动作库中动作信息有限的情况下,存在覆盖率较低的弊端,且文本拆分和匹配度可能导致准确性偏低的弊端。

4、值得说明的是,上述相关技术的内容仅仅是专利技术人个人所知晓的信息,并不代表上述信息在本公开申请日之前已经进入公共领域,也不代表其可以成为本公开的现有技术。


技术实现思路

1、本公开提供一种数字人的控制方法、文本大模型的训练方法、系统,用以避免上述技术问题中的至少一种。

2、第一方面,本文档来自技高网...

【技术保护点】

1.一种数字人的控制方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述预测文本中,所述目标动作标签与所述待处理文本通过预设特殊符号区分;所述根据所述预测文本控制数字人输出交互视频,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述待处理文本和所述目标动作执行文件控制所述数字人输出所述交互视频,包括:

4.根据权利要求1所述的方法,其特征在于,所述获得提示,包括:

5.根据权利要求1所述的方法,其特征在于,所述待处理文本为与预设的待输出语句对应的文本;或者,

6.根据权利要求1所述的方法...

【技术特征摘要】

1.一种数字人的控制方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述预测文本中,所述目标动作标签与所述待处理文本通过预设特殊符号区分;所述根据所述预测文本控制数字人输出交互视频,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述待处理文本和所述目标动作执行文件控制所述数字人输出所述交互视频,包括:

4.根据权利要求1所述的方法,其特征在于,所述获得提示,包括:

5.根据权利要求1所述的方法,其特征在于,所述待处理文本为与预设的待输出语句对应的文本;或者,

6.根据权利要求1所述的方法,其特征...

【专利技术属性】
技术研发人员:杨明晖朱帅
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1