虚拟人多模态交互数据处理方法和系统技术方案

技术编号：17442450 阅读：47 留言：0更新日期：2018-03-10 15:17

本发明专利技术提供一种虚拟人多模态交互数据处理方法，其包括以下步骤：获取多模态输入数据；调用机器人能力接口解析多模态输入数据，并生成多模态输出数据，其中包括应答数据；将应答数据中的语音文件与虚拟人的头部运动模型进行匹配，其中，语音文件包括：音频旋律及文本切词结果；通过虚拟人的形象输出头部运动数据及其他多模态输出数据，其中，多模态输出数据与虚拟人的性格、属性以及技能关联。本发明专利技术提供的虚拟人多模态交互数据处理方法和系统中虚拟人的头部动作能够与输出的语音文件在输出的时间点以及表达意向上匹配，虚拟人头部的动作能够配合输出的语音进行点头、摇头以及头部摆动等多种动作，丰富了交互的内容，提升了用户的交互体验。

全部详细技术资料下载

【技术实现步骤摘要】
虚拟人多模态交互数据处理方法和系统
本专利技术涉及人工智能领域，具体地说，涉及一种虚拟人多模态交互数据处理方法和系统。
技术介绍
机器人聊天交互系统的开发致力于模仿人类对话。早期广为人知的聊天机器人应用程序包括小i聊天机器人、苹果手机上的siri聊天机器人等处理所接收到的输入(包括文本或语音)并进行响应，以试图在上下文之间模仿人类响应。然而，要想完全模仿人类进行多模态交互，丰富用户的交互体验，现有的这些机器人聊天系统远远达不到要求。
技术实现思路
为解决上述问题，本专利技术提供了一种虚拟人多模态交互数据处理方法，所述虚拟人搭载于具有操作系统的智能硬件设备中，所述虚拟人在被启动后显示在预设区域内，并具备特定的形象、性格设定、社会属性以及技能，所述虚拟人多模态交互数据处理方法包括以下步骤：获取多模态输入数据；调用机器人能力接口解析所述多模态输入数据，并生成多模态输出数据，其中包括应答数据；将所述应答数据中的语音文件与所述虚拟人的头部运动模型进行匹配，其中，所述语音文件包括：音频旋律及文本切词结果；通过虚拟人的形象输出头部运动数据及其他多模态输出数据，其中，所述多模态输出数据与所述虚拟人的性格、属性以及技能关联。根据本专利技术的一个实施例，在将所述应答数据中的语音文件与所述虚拟人的头部模型进行匹配的步骤中包含以下步骤：提取所述语音文件的音频旋律节奏并将所述语音文件转换为文本；将所述文本进行切词划分，提取出实体分词。根据本专利技术的一个实施例，在将所述应答数据中的语音文件与所述虚拟人的头部模型进行匹配的步骤中通过所述头部模型执行以下步骤：依据所述旋律节奏以及所述实体分...
虚拟人多模态交互数据处理方法和系统

【技术保护点】
一种虚拟人多模态交互数据处理方法，其特征在于，所述虚拟人搭载于具有操作系统的智能硬件设备中，所述虚拟人在被启动后显示在预设区域内，并具备特定的形象、性格设定、社会属性以及技能，所述虚拟人多模态交互数据处理方法包括以下步骤：获取多模态输入数据；调用机器人能力接口解析所述多模态输入数据，并生成多模态输出数据，其中包括应答数据；将所述应答数据中的语音文件与所述虚拟人的头部运动模型进行匹配，其中，所述语音文件包括：音频旋律及文本切词结果；通过虚拟人的形象输出头部运动数据及其他多模态输出数据，其中，所述多模态输出数据与所述虚拟人的性格、属性以及技能关联。

【技术特征摘要】
1.一种虚拟人多模态交互数据处理方法，其特征在于，所述虚拟人搭载于具有操作系统的智能硬件设备中，所述虚拟人在被启动后显示在预设区域内，并具备特定的形象、性格设定、社会属性以及技能，所述虚拟人多模态交互数据处理方法包括以下步骤：获取多模态输入数据；调用机器人能力接口解析所述多模态输入数据，并生成多模态输出数据，其中包括应答数据；将所述应答数据中的语音文件与所述虚拟人的头部运动模型进行匹配，其中，所述语音文件包括：音频旋律及文本切词结果；通过虚拟人的形象输出头部运动数据及其他多模态输出数据，其中，所述多模态输出数据与所述虚拟人的性格、属性以及技能关联。2.如权利要求1所述的虚拟人多模态交互数据处理方法，其特征在于，在将所述应答数据中的语音文件与所述虚拟人的头部模型进行匹配的步骤中包含以下步骤：提取所述语音文件的音频旋律节奏并将所述语音文件转换为文本；将所述文本进行切词划分，提取出实体分词。3.如权利要求2所述的虚拟人多模态交互数据处理方法，其特征在于，在将所述应答数据中的语音文件与所述虚拟人的头部模型进行匹配的步骤中通过所述头部模型执行以下步骤：依据所述旋律节奏以及所述实体分词将所述文本的内容进行分类，以确定所述头部运动风格以及对应的头部动作。4.如权利要求3所述的虚拟人多模态交互数据处理方法，其特征在于，还包括：依据所述实体分词的词性及该实体分词所属领域分类词组进行分类，以确定头部运动风格以及对应的头部动作。5.如权利要求3所述的虚拟人多模态交互数据处理方法，其特征在于，在输出所述多模态输出数据的步骤中，还包括：根据所述虚拟人的社会属性、性格设定以及当前场景选择最优的头部运动数据来进行输出，所述头部运动数据包括：头部运动动画数据。6.如权利要求3或5所述的虚拟人多模态交互数据处理方法，其特征在于，在输出所述多模态输出数据的步骤中，还将所述头部运动数据的动画播放时间点与对应的...

【专利技术属性】
技术研发人员：尚小维，李贺超，李晓丹，
申请(专利权)人：北京光年无限科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人