对象控制方法、装置及计算机存储介质制造方法及图纸

技术编号:38938810 阅读:15 留言:0更新日期:2023-09-25 09:39
本申请提供了一种对象控制方法、装置及计算机存储介质。在实施例中方法包括:确定可控对象对应的第一参考表征向量;第一参考表征向量包括第一文本对应的文本表征向量和/或语音表征向量;对第一参考表征向量和信息量化数据中的参考表征向量进行匹配,确定第一动作表征向量集合;信息量化数据指示了可控对象的动作数据对应的动作表征向量和动作表征向量对应的参考表征向量;参考表征向量通过对动作数据对应的第二数据进行第一量化处理得到;第一动作表征向量集合包括匹配的参考表征向量对应的动作表征向量;基于第一动作表征向量集合和可控对象的前一动作对应的第二动作表征向量,确定目标表征向量,基于目标动作表征向量提高生成动作的质量。生成动作的质量。生成动作的质量。

【技术实现步骤摘要】
对象控制方法、装置及计算机存储介质


[0001]本申请涉及动作控制
,尤其涉及一种对象控制方法、装置及计算机存储介质。

技术介绍

[0002]在相关技术中,通过AI(Artificial Intelligence,人工智能)的动作模型生成动作。在具体实现时,AI模型可以基于语音特征和文本特征生成动作。
[0003]但是,基于AI的动作模型往往依赖于一个端到端的黑盒网络,容易导致生成的动作的质量较低。
[0004]公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

技术实现思路

[0005]本申请实施例提供了一种对象控制方法、装置及计算机存储介质,采用语音表征向量和/或文本表征向量匹配的方式确定匹配的动作表征向量,并基于前一动作的动作表征向量和匹配的动作表征向量,确定目标动作表征向量,由于目标动作表征向量考虑到文本和/或语音,以及,前一动作,后续,基于目标动作表征向量生成的动作和前一动作拼接后,能够提高生成动作的质量和自然度。另外,若单独考虑文本或语音进行匹配,能够较为准确的筛选出可能的下一动作;若同时考虑文本和语音进行匹配,不仅能够较为准确的筛选出可能的下一动作,而且综合考虑动作的语义和说话风格,对于语义动作(看到动作可以联想到文本或者看到文本可以联想到动作)的场景,通过文本能够反映出不同的说话内容导致的动作差异;对于节奏动作(语义动作无关的动作)的场景,通过语音节奏能够反映出不同的说话内容导致的动作差异,从而减低手势动作和语音不匹配(也即语音的语义无法联想到动作)的可能性。
[0006]第一方面,本申请实施例提供了一种对象控制方法,包括:对可控对象对应的第一数据进行第一量化处理,确定第一参考表征向量;第一参考表征向量包括第一文本对应的文本表征向量和/或语音表征向量;基于第一参考表征向量和信息量化数据中的参考表征向量,确定第一动作表征向量集合;信息量化数据指示了可控对象的动作数据对应的动作表征向量、动作表征向量对应的参考表征向量,参考表征向量通过对动作数据对应的第二数据进行第一量化处理得到;第一动作表征向量集合包括匹配的参考表征向量对应的动作表征向量;基于第一动作表征向量集合和可控对象的前一动作对应的第二动作表征向量,确定目标动作表征向量;其中,目标动作表征向量用于确定可控对象的动作。
[0007]本方案中,采用语音表征向量和/或文本表征向量匹配的方式确定匹配的动作表征向量,并基于前一动作的动作表征向量和匹配的动作表征向量,确定目标动作表征向量,由于目标动作表征向量考虑到文本和/或语音,以及,前一动作,后续,基于目标动作表征向量生成的动作和前一动作拼接后,能够提高生成动作的质量和自然度。另外,若单独考虑文
本或语音进行匹配,能够较为准确的筛选出可能的下一动作;若同时考虑文本和语音进行匹配,不仅能够较为准确的筛选出可能的下一动作,而且综合考虑动作的语义和说话风格,对于语义动作(看到动作可以联想到文本或者看到文本可以联想到动作)的场景,通过文本能够反映出不同的说话内容导致的动作差异;对于节奏动作(语义动作无关的动作)的场景,通过语音节奏能够反映出不同的说话内容导致的动作差异,从而减低手势动作和语音不匹配(也即语音的语义无法联想到动作)的可能性。
[0008]在一种可能的实现方式中,基于第一动作表征向量集合和可控对象的前一动作对应的第二动作表征向量,确定目标动作表征向量,包括:基于第二动作表征向量,从第一动作表征向量集合中,确定目标动作表征向量。
[0009]本方案中,采用筛选的方式可以提高数据处理效率,可更为快速的确定目标动作表征向量。
[0010]在该实现方式的一个例子中,方法还包括:基于第二动作表征向量和信息量化数据中的动作表征向量进行匹配,将匹配的动作表征向量加入第一动作表征向量集合中。
[0011]本方案中,将和上一动作相似的动作作为候选动作,充分考虑各种可能的动作,能够在一定程度上提高生成的动作的精准度,并且提高动作自然衔接的可能性。
[0012]在该实现方式的一个例子中,基于第一参考表征向量和信息量化数据中的参考表征向量进行匹配,确定第一动作表征向量集合,包括:基于第二动作表征向量和信息量化数据中的动作表征向量进行匹配,确定前一动作匹配的动作表征向量;基于第一参考表征向量和信息量化数据中的参考表征向量进行匹配,确定第一参考表征向量匹配的动作表征向量;基于前一动作匹配的动作表征向量和第一参考表征向量匹配的动作表征向量,确定第一动作表征向量集合。
[0013]本方案中,通过和上一动作相似的动作的动作表征向量,对语音表征向量和/或文本表征向量匹配的方式,所确定匹配的动作表征向量进行再次筛选,能够在一定程度上提高确定的第一动作表征向量集合的精准度,后续,在基于第一动作表征向量集合确定目标动作表征向量,可以提高基于目标动作表征向量生成的动作和前一动作拼接后的动作的质量和自然度。
[0014]在该实现方式的一个例子中,参考表征向量还包括口型表征向量和/或面部表征向量。
[0015]本方案中,在考虑文本和/或语音的基础上,进一步地考虑口型和/或面部表情,更为准确的分析说话风格的动作,较为准确的反映出不同的说话内容导致的动作差异,提高手势和语音匹配的可能性。
[0016]在该实现方式的一个例子中,基于第二动作表征向量,从第一动作表征向量集合中,确定目标动作表征向量,包括:
[0017]对第一动作表征向量集合中的第一动作表征向量进行相空间转化,确定第一动作表征向量集合中的第一动作表征向量对应的第一转换结果,第一转换结果指示了至少一个第一时刻的动作状态;对第二动作表征向量进行相空间转化,确定第二转换结果,第二转换结果指示了至少一个第二时刻的动作状态;基于第一动作表征向量集合中的第一动作表征向量对应的第一转换结果和第二转换结果,确定目标动作表征向量。
[0018]本方案中,将动作映射到相空间,在相空间进行动作衔接,从而提高动作衔接的自
然流程的可能性。
[0019]在该例子中的一个示例中,基于第一动作表征向量集合中的第一动作表征向量对应的第一转换结果和第二转换结果,确定目标动作表征向量,包括:
[0020]计算第一转换结果和第二转换结果的相似度;将最大的相似度对应的第一动作表征向量,确定为目标动作表征向量。
[0021]本方案中,在前一动作和当前的动作之间的时间间隔较短时,前一动作和当前的动作应当是相似的,因此可以直接基于相似度的方式,选择动作表征向量。
[0022]在该例子中的一个示例中,第一转换结果包括随时间变化的第一曲线,第二转换结果包括随时间变化的第二曲线,基于第一动作表征向量集合中的第一动作表征向量对应的第一转换结果和第二转换结果,确定目标动作表征向量,包括:
[0023]计算第一转换结果中的第一曲线和第二转换结果的第二曲线拼接后的质量分;将最大的质量分对应的第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象控制方法,其特征在于,包括:对可控对象对应的第一数据进行第一量化处理,确定第一参考表征向量;所述第一参考表征向量包括第一文本对应的文本表征向量和/或第一语音数据对应的语音表征向量,所述第一文本指示了所述第一语音数据的语义;基于所述第一参考表征向量和信息量化数据中的参考表征向量进行匹配,确定第一动作表征向量集合;所述信息量化数据指示了所述可控对象的动作数据对应的动作表征向量、所述动作表征向量对应的参考表征向量,所述参考表征向量通过对所述动作数据对应的第二数据进行所述第一量化处理得到;所述第一动作表征向量集合包括匹配的参考表征向量对应的动作表征向量;基于所述第一动作表征向量集合和所述可控对象的前一动作对应的第二动作表征向量,确定目标动作表征向量;其中,所述目标动作表征向量用于确定所述可控对象的动作。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一动作表征向量集合和所述可控对象的前一动作对应的第二动作表征向量,确定目标动作表征向量,包括:基于所述第二动作表征向量,从所述第一动作表征向量集合中,确定目标动作表征向量。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一参考表征向量和信息量化数据中的参考表征向量进行匹配,确定第一动作表征向量集合,包括:基于所述第二动作表征向量和所述信息量化数据中的动作表征向量进行匹配,确定前一动作匹配的动作表征向量;基于所述第一参考表征向量和信息量化数据中的参考表征向量进行匹配,确定所述第一参考表征向量匹配的动作表征向量;基于前一动作匹配的动作表征向量和所述第一参考表征向量匹配的动作表征向量,确定第一动作表征向量集合。4.根据权利要求2所述的方法,其特征在于,所述参考表征向量还包括口型表征向量和/或面部表征向量。5.根据权利要求2所述的方法,其特征在于,所述基于所述第二动作表征向量,从所述第一动作表征向量集合中,确定目标动作表征向量,包括:对所述第一动作表征向量集合中的第一动作表征向量进行相空间转化,确定所述第一动作表征向量集合中的第一动作表征向...

【专利技术属性】
技术研发人员:张镇嵩杨思程郝磊李明磊吴小飞许松岑
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1