System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于人工势场的数字人目标位置移动方法和系统技术方案_技高网

一种基于人工势场的数字人目标位置移动方法和系统技术方案

技术编号:41335905 阅读:18 留言:0更新日期:2024-05-20 09:55
本发明专利技术提供了一种基于人工势场的数字人目标位置移动方法和系统,所述方法包括:获取数字人在虚拟世界中的初始位置数据,并获取数字需要行走到的目标位置数据;建立基于路径距离寻优的第一优势函数,根据所述第一优势函数查找数字人到所述目标位置的最优路径动作;建立基于场势的辅助优势函数,根据所述第一优势函数和辅助优势函数得到目标函数;根据所述目标函数采用强化学习模型计算所述数字人在虚拟世界中从所述初始位置到目标位置的最优路径。

【技术实现步骤摘要】

本专利技术涉及虚拟数字人控制,特别涉及一种基于人工势场的数字人目标位置移动方法和系统


技术介绍

1、目前随着元宇宙技术的发展,对于元宇宙中数字人的控制方式尤为重要,现有技术中,数字人类似人的属性,它不仅要能感知空间的环境信息,更需要能够根据拾取的环境信息做出最优(或次优)的行为决策,目前数字人的行为控制主要集中于对个体的行为建模等方面。然而对个体的行为建模导致数字人在环境中运动的“僵化”问题。因此现有数字人的控制方面缺乏环境适应性,对于环境中存在的虚拟障碍物,数字人无法自动地躲避该障碍物且准确高效执行某一移动操作。


技术实现思路

1、本专利技术其中一个专利技术目的在于提供一种基于人工势场的数字人目标位置移动方法和系统,所述方法和系统在获取到数字人在虚拟世界中的当前位置信息和目标位置信息后,基于所述人工势场查找到最优寻址路径,执行所述最优寻址路径的数字人动作移动策略,从而提高了所述数字人在虚拟世界中的寻址效率。

2、本专利技术其中一个专利技术目的在于提供一种基于人工势场的数字人目标位置移动方法和系统,所述方法和系统获取数字人所在的虚拟世界环境数据,在基于所述人工势场建立数字人路径寻优策略在环境中的奖励值,可设置根据数字人到目标位置移动距离的长短作为奖励值,从而得到奖励值最大的路径寻优策略作为目标数字人的移动路径寻优策略。

3、本专利技术另一个专利技术目的在于提供一种基于人工势场的数字人目标位置移动方法和系统,所述方法和系统在获取虚拟世界的环境数据后,根据所述虚拟世界环境数据中障碍物的高度建立势能值,并将势能值作为能否作为路径跨越的参考数据,通过所述势能值结合路径奖励策略可以有效地在虚拟世界环境中不同障碍物下快速查找到最优路径策略。

4、为了实现至少一个上述专利技术目的,本专利技术进一步提供一种基于人工势场的数字人目标位置移动方法,所述方法包括:

5、获取数字人在虚拟世界中的初始位置数据,并获取数字人需要行走到的目标位置数据;

6、建立基于路径寻优的第一优势函数,根据所述第一优势函数查找数字人到所述目标位置的最优路径动作;

7、建立基于场势的辅助优势函数,根据所述第一优势函数和辅助优势函数得到目标函数;

8、根据所述目标函数采用强化学习模型计算所述数字人在虚拟世界中从所述初始位置到目标位置的最优路径。

9、根据本专利技术其中一个较佳实施例,所述基于路径距离寻优的第一优势函数公式为:

10、其中st表示当前数字人所在位置的状态,at表示数字人在st状态下采取的动作,π为当前路径寻优策略,θ为神经网络参数,l为步长,λ为优势函数折扣率,γ为折扣率,v为数字人的价值函数;r为奖励函数。

11、根据本专利技术另一个较佳实施例,所述基于场势的辅助优势函数的计算公式为:ψ(st,at)=βu(pt+1),其中pt+1为数字人在当前位置,u(pt+1)为数字在当前位置的势能值,当所述势能值越高,则说明数字人当前位置存在对应高度的障碍物,其中所述β为超参数,用于控制所述基于场势的辅助优势函数ψ(st,at)作用大小。

12、根据本专利技术另一个较佳实施例,在构建所述基于场势的辅助优势函数ψ(st,at)后,进一步对所述基于场势的辅助优势函数ψ(st,at)提供比重函数μ(e),得到如下计算式:μ(e)*u(pt+1)。

13、根据本专利技术另一个较佳实施例,所述方法基于第一优势函数和第二优势函数得到的目标函数包括:所述数字人根据所述目标函数执行路径查找。

14、根据本专利技术另一个较佳实施例,所述方法进一步结合梯度策略计算优化的目标函数:其中θold为更新之前的神经网络参数,θ为更新后神经网络参数,ε为对应调节参数,根据所述优化的目标函数计算数字人从初始位置到目标位置的最佳路径。

15、根据本专利技术另一个较佳实施例,所述强化学习模型实现方法包括:以所述数字人作为智能体agent,将所述数字人在虚拟世界的移动方式作为路径寻优策略π,以所述数字人在当前状态st下执行对应的路径寻优策略π下的不同的具体动作at得到不同的新状态st+1,根据不同新状态的奖励策略得到不同的奖励值γ,选取奖励值γ最高的具体动作at作为路径寻优策略π的执行动作。

16、为了实现至少一个专利技术目的,本专利技术进一步提供一种基于人工势场的数字人目标位置移动系统,所述系统执行上述一种基于人工势场的数字人目标位置移动方法。

17、本专利技术进一步提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行一种基于人工势场的数字人目标位置移动方法。

本文档来自技高网...

【技术保护点】

1.一种基于人工势场的数字人目标位置移动方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于人工势场的数字人目标位置移动方法,其特征在于,所述基于路径距离寻优的第一优势函数公式为:

3.根据权利要求2所述的一种基于人工势场的数字人目标位置移动方法,其特征在于,所述基于场势的辅助优势函数的计算公式为:Ψ(st,at)=βU(pt+1),其中pt+1为数字人在当前位置,U(pt+1)为数字在当前位置的势能值,当所述势能值越高,则说明数字人当前位置存在对应高度的障碍物,其中所述β为超参数,用于控制所述基于场势的辅助优势函数Ψ(st,at)作用大小。

4.根据权利要求3所述的一种基于人工势场的数字人目标位置移动方法,其特征在于,在构建所述基于场势的辅助优势函数Ψ(st,at)后,进一步对所述基于场势的辅助优势函数Ψ(st,at)提供比重函数μ(e),得到如下计算式:μ(e)*U(pt+1)。

5.根据权利要求4所述的一种基于人工势场的数字人目标位置移动方法,其特征在于,所述方法基于第一优势函数和辅助优势函数得到的目标函数包括:所述数字人根据所述目标函数执行路径查找。

6.根据权利要求5所述的一种基于人工势场的数字人目标位置移动方法,其特征在于,所述方法进一步结合梯度策略计算优化的目标函数:其中θold为更新之前的神经网络参数,θ为更新后神经网络参数,ε为对应调节参数,根据所述优化的目标函数计算数字人从初始位置到目标位置的最佳路径。

7.根据权利要求1所述的一种基于人工势场的数字人目标位置移动方法,其特征在于,所述强化学习模型实现方法包括:以所述数字人作为智能体Agent,将所述数字人在虚拟世界的移动方式作为路径寻优策略π,以所述数字人在当前状态st下执行对应的路径寻优策略π下的不同的具体动作at得到不同的新状态st+1,根据不同新状态的奖励策略得到不同的奖励值γ,选取奖励值γ最高的具体动作at作为路径寻优策略π的执行动作。

8.一种基于人工势场的数字人目标位置移动系统,其特征在于,所述系统执行上述权利要求1-7中任意一项所述的一种基于人工势场的数字人目标位置移动方法。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行权利要求1-7中任意一项所述的一种基于人工势场的数字人目标位置移动方法。

...

【技术特征摘要】

1.一种基于人工势场的数字人目标位置移动方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于人工势场的数字人目标位置移动方法,其特征在于,所述基于路径距离寻优的第一优势函数公式为:

3.根据权利要求2所述的一种基于人工势场的数字人目标位置移动方法,其特征在于,所述基于场势的辅助优势函数的计算公式为:ψ(st,at)=βu(pt+1),其中pt+1为数字人在当前位置,u(pt+1)为数字在当前位置的势能值,当所述势能值越高,则说明数字人当前位置存在对应高度的障碍物,其中所述β为超参数,用于控制所述基于场势的辅助优势函数ψ(st,at)作用大小。

4.根据权利要求3所述的一种基于人工势场的数字人目标位置移动方法,其特征在于,在构建所述基于场势的辅助优势函数ψ(st,at)后,进一步对所述基于场势的辅助优势函数ψ(st,at)提供比重函数μ(e),得到如下计算式:μ(e)*u(pt+1)。

5.根据权利要求4所述的一种基于人工势场的数字人目标位置移动方法,其特征在于,所述方法基于第一优势函数和辅助优势函数得到的目标函数包括:所述数字人根据所述目标函数执行路径查找。

【专利技术属性】
技术研发人员:陈莉郑珺柴祯晖
申请(专利权)人:浙江传媒学院桐乡研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1