一种文本驱动虚拟人非语言行为的系统及方法技术方案

技术编号:34468594 阅读:14 留言:0更新日期:2022-08-10 08:42
本发明专利技术公开了一种文本驱动虚拟人非语言行为的系统及方法,包括以下步骤:预处理阶段:S1,编写匹配规则:在配置文件中,编写非语言行为与分词文本的匹配规则,即在合适的分词处触发播放对应的非语言行为动作;目前规则包括文本词性检测、文本相等、文本包含、文本起始处匹配、文本末尾处匹配;S2,制作动画文件:对演员说话进行分析,总结出其常用的非语言行为动作,由演员进行表演,通过optitrack动作捕捉系统捕捉所有的非语言行为动作,然后由动画师在MotionBuilder中进行修复。本发明专利技术通过文本驱动虚拟人的自然逼真的非语言行为动作,能在恰当的文本处触发播放非语言行为动作,拓展了虚拟人的应用领域。拟人的应用领域。拟人的应用领域。

【技术实现步骤摘要】
一种文本驱动虚拟人非语言行为的系统及方法


[0001]本专利技术涉及计算机软件
,具体为一种文本驱动虚拟人非语言行为的系统及方法。

技术介绍

[0002]当前随着Facebook、英伟达、微软等巨头相继大力投入打造元宇宙平台,虚拟人作为核心部分,是重点攻关的环节。虚拟人作为人的数字化化身,需要具备人的外观、人的行为和人的思想。而类人的行为又称为虚拟人智能行为交互。虚拟人智能行为交互中,非语言行为动作,比如点头、摆手、摊手等是可以辅助传达信息,也是人物性格特点的一种重要体现,是自然逼真地行为交互的重要模态通道。
[0003]当前虚拟人的非语言行为驱动技术研究基本集中在语音驱动非语言行为,很少涉及文本驱动非语言行为,在很多应用场景中,比如虚拟新闻主播、虚拟游戏主播、虚拟手语人等等,都是通过输入文本来进行驱动。而由于文本缺少语音的时序及语调信息,要准确同步地驱动非语言行为动作相对比较困难。

技术实现思路

[0004]针对现有技术的不足,本专利技术提供了一种文本驱动虚拟人非语言行为的系统及方法,解决了上述
技术介绍
中提出的问题。
[0005]为实现以上目的,本专利技术通过以下技术方案予以实现,一种文本驱动虚拟人非语言行为的系统及方法,包括以下步骤:
[0006]预处理阶段:
[0007]S1,编写匹配规则:在配置文件中,编写非语言行为与分词文本的匹配规则,即在合适的分词处触发播放对应的非语言行为动作;目前规则包括文本词性检测、文本相等、文本包含、文本起始处匹配、文本末尾处匹配;
[0008]S2,制作动画文件:对演员说话进行分析,总结出其常用的非语言行为动作,由演员进行表演,通过optitrack动作捕捉系统捕捉所有的非语言行为动作,然后由动画师在MotionBuilder中进行修复;
[0009]实时交互阶段:
[0010]S3,NLP分词模块,模块中包括以下步骤:
[0011]步骤S31:NLP对文本进行分词处理得到分词序列;
[0012]步骤S32:对文本进行词性计算并标记分词的词性,得到带词性的分词序列;
[0013]S4,非语言行为BML构造模块,模块中包括以下步骤:
[0014]步骤S41:解析带词性的分词序列获取分词;
[0015]步骤S42:为每个分词按规则匹配获得非语言行为动作;
[0016]步骤S43:构造BML,并标记动作开始播放的词,得到非语言行为BML;
[0017]S5,非语言行为BML解析模块,模块中包括以下步骤:
[0018]步骤S51:解析BML;
[0019]步骤S52:查找词对应的同步时间;
[0020]步骤S53:加载动作并添加到动画播放模块中,得到带同步时间的非语言行为动作;
[0021]S6,动画播放模块,模块中包括以下步骤:
[0022]步骤S61:按同步时间排序组织非语言行为动作;
[0023]步骤S62:根据当前时间获取前后两个动作;
[0024]步骤S63:判断当前时间是否处于两个动作之间;
[0025]步骤S64:如果是,则对两个动作进行插值,然后进入步骤S65;
[0026]步骤S65:如果否,则直接播放动作。
[0027]进一步的,在步骤S1所述的编写匹配规则中,为了让非语言行为表现得更加自然,需要加入一些随机性。
[0028]进一步的,在步骤S2所述的制作动画文件中,为了准确的还原演员的动作,在录制动作时需要同时在正前方、左侧方部署摄像头录制演员的动作,方便动画师从多个角度参考以修复动作。
[0029]进一步的,在步骤S4所述的非语言行为BML构造中,为了快速地进行分词匹配,规则按树形结构组织,关键字为文本的哈希值。
[0030]进一步的,在步骤S5所述的非语言行为BML解析中,为了保证拓展性,BML需要拓展支持说话口型,口型时间序列有连续性,由非语言行为的标记词查找对应的同步时间。
[0031]进一步的,在步骤S6所述的动画播放中,为了保证动作播放的连续性,在当前时间处于两个动作之间的情形,采用淡入淡出的双向插值算法进行插值。
[0032]进一步的,所述的一种文本驱动虚拟人非语言行为实现方法的系统,包括:
[0033]编写匹配规则模块:用于编写非语言行为匹配的规则;
[0034]制作动画文件模块:用于制作非语言行为动作;
[0035]NLP分词模块:用于对文本进行分词和词性计算;
[0036]非语言行为BML构造模块:用于对分词序列进行规则匹配并标记同步词,非语言行为BML构造;
[0037]非语言行为BML解析模块:用于解析BML并获取非语言行为动作的同步时间;
[0038]动画播放模块:用于根据当前时间对非语言行为动作进行插值播放;
[0039]编写匹配规则模块和制作动画文件模块属于预处理阶段,用于实时交互阶段的非语言行为BML解析模块和动画播放模块。
[0040]本专利技术提供了一种文本驱动虚拟人非语言行为的系统及方法,具备以下有益效果:该文本驱动虚拟人非语言行为的系统及方法实现输入文本驱动逼真自然的非语言行为动作,能在恰当的文本处触发播放非语言行为动作,使虚拟人的表现更真实自然;
[0041]提出了文本驱动非语言行为的机制,拓展了虚拟人的应用领域。
附图说明
[0042]图1为本专利技术文本驱动虚拟人非语言行为的系统及方法的预处理阶段的流程图。
[0043]图2为本专利技术文本驱动虚拟人非语言行为的系统及方法的实时交互阶段的流程
图。
[0044]图3为NLP分词模块流程图。
[0045]图4为非语言行为BML构造模块流程图。
[0046]图5为非语言行为BML解析模块流程图。
[0047]图6为动画播放模块流程图。
具体实施方式
[0048]在此记载的实施例为本专利技术的特定的具体实施方式,用于说明本专利技术的构思,均是解释性和示例性的,不应解释为对本专利技术实施方式及本专利技术范围的限制。除在此记载的实施例外,本领域技术人员还能够基于本申请权利要求书和说明书所公开的内容采用显而易见的其他技术方案,这些技术方案包括对在此记载的实施例做出任何显而易见的替换和修改的技术方案。
[0049]在进行具体实施方式陈述之前,需要解释一些专用名词:
[0050]optitrack是光学动作捕捉动捕系统。
[0051]MotionBuilder是欧特克公司制作的一款修复动捕系统捕捉的动作的编辑工具软件。
[0052]NLP是Nature Language Process的缩写,中文:自然语言处理。
[0053]BML是Behavior Mark Language的缩写,中文:行为标记语言。
[0054]如图1所示,文本驱动虚拟人非语言行为方法的预处理阶段,包括以下步骤:
[0055]S1、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本驱动虚拟人非语言行为的系统及方法,其特征在于,包括以下步骤:预处理阶段:S1,编写匹配规则:在配置文件中,编写非语言行为与分词文本的匹配规则,即在合适的分词处触发播放对应的非语言行为动作;目前规则包括文本词性检测、文本相等、文本包含、文本起始处匹配、文本末尾处匹配;S2,制作动画文件:对演员说话进行分析,总结出其常用的非语言行为动作,由演员进行表演,通过optitrack动作捕捉系统捕捉所有的非语言行为动作,然后由动画师在MotionBuilder中进行修复;实时交互阶段:S3,NLP分词模块,模块中包括以下步骤:步骤S31:NLP对文本进行分词处理得到分词序列;步骤S32:对文本进行词性计算并标记分词的词性,得到带词性的分词序列;S4,非语言行为BML构造模块,模块中包括以下步骤:步骤S41:解析带词性的分词序列获取分词;步骤S42:为每个分词按规则匹配获得非语言行为动作;步骤S43:构造BML,并标记动作开始播放的词,得到非语言行为BML;S5,非语言行为BML解析模块,模块中包括以下步骤:步骤S51:解析BML;步骤S52:查找词对应的同步时间;步骤S53:加载动作并添加到动画播放模块中,得到带同步时间的非语言行为动作;S6,动画播放模块,模块中包括以下步骤:步骤S61:按同步时间排序组织非语言行为动作;步骤S62:根据当前时间获取前后两个动作;步骤S63:判断当前时间是否处于两个动作之间;步骤S64:如果是,则对两个动作进行插值,然后进入步骤S65;步骤S65:如果否,则直接播放动作。2.根据权利要求1所述的一种文本驱动虚拟人非语言行为实现方法,其特征在于,在步骤S1所述的编写匹配规则中,为了让非语言行为表现得更加自然,...

【专利技术属性】
技术研发人员:高春鸣郭伟
申请(专利权)人:长沙千博信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1