一种数据处理方法技术

技术编号：39586780 阅读：4 留言：0更新日期：2023-12-03 19:38

本申请实施例公开了一种数据处理方法

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置、计算机设备及存储介质

[0001]本申请涉及计算机
，尤其涉及一种数据处理方法
、
装置
、
计算机设备及存储介质
。

技术介绍

[0002]随着人工智能技术的发展，虚拟对象
(
例如，虚拟人
)
相关的技术与应用也随之迸发
。
所谓虚拟人是指具有数字化外形的虚拟人物，并且拥有人的举止以及人的思想，可以根据会话交流做出语言
、
表情和动作的反馈，甚至不至于人类形态
。
目前在基于虚拟对象的待预测文本
(
例如，与虚拟对象相关联的上下文
)
，对虚拟对象的动作进行预测时，要么严重依赖于人工标注，要么直接基于待预测文本生成预测动作
。
[0003]其中，人工标注这种预测方式是指需要标注人员根据自己的理解，人工标注动作文本，难免会出现不同标注人员对同一动作文本的标注不一致的情况，这不仅导致成本高昂，还降低了预测效率以及预测准确度
。
而基于待预测文本的文字描述直接生成预测动作的这种预测方式，不仅要求文字描述足够精准，还需要收集大量的训练数据以及花费大量的训练资源，与此同时还会存在不可靠不可控的缺陷，以至于严重影响了动作预测的准确度
。
比如，待预测文本为“一只虚拟狗从左往右飞”，但最终生成的动作却包含了虚拟狗转头的动作
。
这意味着传统动作预测方式不仅存在人力成本高昂，预测效率低下...

【技术保护点】

【技术特征摘要】
1.
一种数据处理方法，其特征在于，包括：获取与虚拟对象相关联的待预测文本；分别获取动作库中的
M
个动作文本与所述待预测文本之间的文本匹配度，基于
M
个文本匹配度，从所述
M
个动作文本中选择所述待预测文本对应的
N
个动作文本；所述
M
为正整数；所述
N
为小于或者等于
M
的正整数；基于所述
N
个动作文本以及所述待预测文本，对所述虚拟对象进行动作预测，生成所述待预测文本对应的预测动作文本；所述预测动作文本属于所述
N
个动作文本；所述预测动作文本用于驱动所述虚拟对象执行所述预测动作文本对应的动作
。2.
根据权利要求1所述的方法，其特征在于，所述动作库包括
M
个动作文本以及所述
M
个动作文本分别对应的动作向量；所述分别获取动作库中的
M
个动作文本与所述待预测文本之间的文本匹配度，基于
M
个文本匹配度，从所述
M
个动作文本中选择所述待预测文本对应的
N
个动作文本，包括：将所述待预测文本输入至第一目标模型，通过所述第一目标模型，对所述待预测文本进行编码处理，得到所述待预测文本对应的文本编码向量；分别对所述文本编码向量和每个动作向量进行向量相似度计算，得到所述
M
个动作文本与所述待预测文本之间的文本匹配度；对
M
个文本匹配度进行降序排列处理，得到排序结果，从所述排序结果中按序获取
N
个文本匹配度；将获取到的
N
个文本匹配度分别对应的动作文本确定为所述待预测文本对应的
N
个动作文本
。3.
根据权利要求1所述的方法，其特征在于，所述基于所述
N
个动作文本以及所述待预测文本，对所述虚拟对象进行动作预测，生成所述待预测文本对应的预测动作文本，包括：获取用于对所述虚拟对象进行动作预测的预测指令文本；调用第二目标模型，将所述预测指令文本
、
所述
N
个动作文本以及所述待预测文本输入至所述第二目标模型；通过所述第二目标模型以及所述
N
个动作文本，对所述虚拟对象进行动作预测，生成所述待预测文本对应的预测动作文本
。4.
根据权利要求1所述的方法，其特征在于，所述动作库包括
M
个动作文本分别对应的动作；所述待预测文本是基于业务终端设备发送的动作预测请求所获取到的；所述动作预测请求还包括所述待预测文本对应的音频数据；所述方法还包括：从
M
个动作中，获取所述预测动作文本对应的动作；获取所述音频数据的播放时长；按照所述播放时长，将所述预测动作文本对应的动作与所述音频数据进行数据对齐，得到对齐数据；将所述对齐数据返回给所述业务终端设备，以使所述业务终端设备显示所述对齐数据；所述对齐数据用于展示所述虚拟对象在所述播放时长内执行所述预测动作文本对应的动作
。5.
一种数据处理方法，其特征在于，包括：
获取第一样本对象对应的第一样本文本以及所述第一样本文本对应的第一样本预测数据；所述第一样本预测数据是基于所述第一样本对象的正确动作文本以及所述第一样本文本所构造的；所述第一样本对象的正确动作文本是从用于进行动作预测的动作库中所确定的；基于所述正确动作文本
、
所述第一样本文本以及所述动作库，对第一初始模型进行训练，得到第一目标模型；获取第二样本对象对应的第二样本文本以及所述第二样本文本对应的第二样本预测数据；所述第二样本预测数据是基于所述第二样本文本对应的
N
个候选动作文本以及所述第二样本文本所构造的；所述
N
个候选动作文本是从用于进行动作预测的动作库中所确定的；
N
为正整数；基于所述
N
个候选动作文本以及所述第二样本文本，对第二初始模型进行训练，得到第二目标模型；所述第一目标模型与所述第二目标模型用于共同预测虚拟对象对应的预测动作文本；所述预测动作文本用于驱动所述虚拟对象执行所述预测动作文本对应的动作
。6.
根据权利要求5所述的方法，其特征在于，所述方法还包括：在获取到初始文本时，从所述初始文本中筛选出包括对话信息的文本；对筛选出的文本进行数据清洗，得到
M
个动作文本；所述
M
个动作文本包括动作文本
D
i
；
i
为小于或者等于
M
的正整数；
M
为大于或者等于
N
的正整数；从业务对象历史积累的动作资产中，确定与所述动作文本
D
i
相匹配的动作；在得到
M
个动作文本分别匹配的动作时，基于所述
M
个动作文本以及
M
个动作，构建所述动作库
。7.
根据权利要求5所述的方法，其特征在于，所述获取第一样本对象对应的第一样本文本以及所述第一样本文本对应的第一样本预测数据，包括：从用于构建动作库的初始文本中，获取与第一样本对象相关联的文本；基于所述句子分隔符，对所述与第一样本对象相关联的文本进行分割处理，得到所述第一样本对象对应的第一样本文本；对所述第一样本文本进行语义分析，从所述动作库中确定所述第一样本对象的正确动作文本；基于所述正确动作文本以及所述第一样本文本，构造所述第一样本文本对应的第一样本预测数据
。8.
根据权利要求5所述的方法，其特征在于，所述动作库包括
M
个动作文本以及所述
M
个动作文本分别对应的动作向量；
M
为大于或者等于
N
的正整数；所述基于所述正确动作文本
、
所述第一样本文本以及所述动作库，对第一初始模型进行训练，得到第一目标模型，包括：将所述第一样本文本输入至第一初始模型，通过所述第一初始模型，对所述第一样本文本进行编码处理，得到所述第一样本文本对应的样本文本向量；从所述动作库中获取
P
个动作文本的每个动作文本分别对应的动作向量；
P
为小于或者等于
M
的正整数；所述
P
个动作文本包括所述正确动作文本；分别对所述
P
个动作向量中的每个动作向量与所述样本文本向量进行向量相似度计算，得到
P
个文本匹配度；
基于所述
P
个文本匹配度以及与所述第一初始模型相关联的第一模型收敛条件，对所述第一初始模型进行训练，得到第一目标模型
。9.
根据权利要求8所述的方法，其特征在于，所述

【专利技术属性】
技术研发人员：杜文哲，陈万顺，杜楠，代勇，程鹏宇，郑哲，刘星言，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人