The invention provides a visual interaction method based on a virtual human, in which the virtual human starts the voice, emotion, vision and perception ability when it is in an interactive state through an intelligent device display. The method comprises: outputting multi-modal data through a virtual human; receiving multi-modal interactive data provided by a user for multi-modal data; and analyzing multi-modal interactive data; Modal interactive data, in which: through visual ability detection and extraction of multi-modal interactive data in hand praise action as an interactive intention; according to the interactive intention of the virtual human multi-modal interactive output. The method and system of visual interaction based on virtual human provided by the invention provides a virtual human, which has a preset image and preset attributes, and can interact with users in multi-modality. Furthermore, the invention also can judge the user's intention by the hand's praise action, and interact with the user, so that the user can communicate smoothly with the virtual person, and enable the user to enjoy the anthropomorphic interactive experience.
【技术实现步骤摘要】
基于虚拟人的视觉交互方法及系统
本专利技术涉及人工智能领域,具体地说,涉及一种基于虚拟人的视觉交互方法及系统。
技术介绍
机器人多模态交互系统的开发致力于模仿人类对话,以试图在上下文之间模仿人类之间的交互。但是,目前来说,对于虚拟人相关的机器人多模态交互系统的开发还不太完善,尚未出现进行多模态交互的虚拟人,更为重要的是,尚无针对肢体,尤其针对手势交互,且对肢体、尤其手势交互有响应的基于虚拟人的视觉交互产品。因此,本专利技术提供了一种基于虚拟人的视觉交互方法及系统。
技术实现思路
为解决上述问题,本专利技术提供了一种基于虚拟人的视觉交互方法,所述虚拟人通过智能设备展示,在处于交互状态时启动语音、情感、视觉以及感知能力,所述方法包含以下步骤:通过所述虚拟人输出多模态数据;接收用户针对所述多模态数据提供的多模态交互数据;解析所述多模态交互数据,其中:通过视觉能力检测并提取所述多模态交互数据中的手部点赞动作作为交互意图;通过所述虚拟人按照所述交互意图进行多模态交互输出。根据本专利技术的一个实施例,在通过视觉能力检测到所述手部点赞动作时,在判断周期内,如果用户的手部动作包含:大拇指竖立,与所述大拇指在同一只手的其余手指向掌心弯曲,则识别所述手部动作为手部点赞动作。根据本专利技术的一个实施例,在通过视觉能力检测并提取所述多模态交互数据中的手部点赞动作作为交互意图的步骤中,还包括:基于所述虚拟人已经输出的多模态数据将所述交互意图识别为赞扬意图,其中,所述赞扬意图指示用户对所述虚拟人输出的多模态数据的响应;或,基于所述虚拟人已经输出的多模态数据将所述交互意图识别为许可意图,其 ...
【技术保护点】
1.一种基于虚拟人的视觉交互方法,其特征在于,所述虚拟人通过智能设备展示,在处于交互状态时启动语音、情感、视觉以及感知能力,所述方法包含以下步骤:通过所述虚拟人输出多模态数据;接收用户针对所述多模态数据提供的多模态交互数据;解析所述多模态交互数据,其中:通过视觉能力检测并提取所述多模态交互数据中的手部点赞动作作为交互意图;通过所述虚拟人按照所述交互意图进行多模态交互输出。
【技术特征摘要】
1.一种基于虚拟人的视觉交互方法,其特征在于,所述虚拟人通过智能设备展示,在处于交互状态时启动语音、情感、视觉以及感知能力,所述方法包含以下步骤:通过所述虚拟人输出多模态数据;接收用户针对所述多模态数据提供的多模态交互数据;解析所述多模态交互数据,其中:通过视觉能力检测并提取所述多模态交互数据中的手部点赞动作作为交互意图;通过所述虚拟人按照所述交互意图进行多模态交互输出。2.如权利要求1所述的基于虚拟人的视觉交互方法,其特征在于,在通过视觉能力检测到所述手部点赞动作时,在判断周期内,如果用户的手部动作包含:大拇指竖立,与所述大拇指在同一只手的其余手指向掌心弯曲,则识别所述手部动作为手部点赞动作。3.如权利要求1-2中任一项所述的基于虚拟人的视觉交互方法,其特征在于,在通过视觉能力检测并提取所述多模态交互数据中的手部点赞动作作为交互意图的步骤中,还包括:基于所述虚拟人已经输出的多模态数据将所述交互意图识别为赞扬意图,其中,所述赞扬意图指示用户对所述虚拟人输出的多模态数据的响应;或,基于所述虚拟人已经输出的多模态数据将所述交互意图识别为许可意图,其中,所述许可意图表示用户对所述虚拟人输出的多模态数据的赞同。4.如权利要求1所述的基于虚拟人的视觉交互方法,其特征在于,在通过视觉能力检测并提取所述多模态交互数据中的手部点赞动作作为交互意图的步骤中,还包括:基于所述赞扬意图或许可意图将当前交互话题或交互事件存储为该用户的偏好数据。5.如权利要求1-4中任一项所述的基于虚拟人的视觉交互方法,其特征在于,所述虚拟人接收来自多个用户的针对所述多模态数据提供的多模态交互数据,识别出所述多个...
【专利技术属性】
技术研发人员:尚小维,李晓丹,俞志晨,
申请(专利权)人:北京光年无限科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。