用于智能机器人的主动交互方法和系统技术方案

技术编号:14817848 阅读:103 留言:0更新日期:2017-03-15 11:48
本发明专利技术提供一种用于智能机器人的主动交互方法,其包括以下步骤:图像捕获步骤,捕获当前场景中的图像,以得到图像数据;视觉语义解析步骤,通过视觉语义模型对所述图像数据进行视觉语义的识别;发起主动交互判断步骤,判断针对图像数据所识别出的视觉语义是否符合发起主动交互的条件,并在符合发起主动交互的情况下,主动发起交互。本发明专利技术的用于智能机器人的主动交互方法和系统可以根据视觉语义的分析来判断当前是否需要主动交互,使得智能机器人的类人化程度更高,与人类的交互更灵活。

【技术实现步骤摘要】

本专利技术涉及智能机器人领域,具体地说,涉及一种用于智能机器人的主动交互方法和系统
技术介绍
目前,在人机交互过程中,通常都是用户主动发起交互,机器人根据用户输入的多模态数据所代表的含义回答问题或者进行一些动作的输出。有的时候,用户处于情绪低落或者其他情况,而并未进行任何输入,例如长时间的没有发出任何声音或者动作。在这种情况下,现有的人机交互技术仅仅是简单的等待用户的进一步输入。可见,现有智能机器人的交互灵活度较差,类人性较低,带给用户的体验效果也较差。因此,需要一种能够进行人机主动交互的技术方案。
技术实现思路
本专利技术的目的在于解决现有技术中不能进行人机主动交互的技术问题,提供了一种用于智能机器人的主动交互方法。所述方法包括以下步骤:图像捕获步骤,捕获当前场景中的图像,以得到图像数据;视觉语义解析步骤,通过视觉语义模型对所述图像数据进行视觉语义的识别;发起主动交互判断步骤,判断针对图像数据所识别出的视觉语义是否符合发起主动交互的条件,并在符合发起主动交互的情况下,主动发起交互。根据本专利技术的用于智能机器人的主动交互方法,优选的是,所述视觉语义模型是通过如下步骤建立的:建立初始模型;针对输入的图像标注出视觉语义训练数据;基于深度学习技术训练所述初始模型。根据本专利技术的一个实施例的用于智能机器人的主动交互方法,优选的是,在判断发起主动交互步骤中,判断针对图像数据所识别出的当前视觉语义是否为特定时间内的特定事件。根据本专利技术的一个实施例的用于智能机器人的主动交互方法,优选的是,在判断发起主动交互步骤中,判断针对图像数据所识别出的当前视觉语义是否为用户处于特定的状态。根据本专利技术的一个实施例的用于智能机器人的主动交互方法,优选的是,在判断发起主动交互步骤中,判断针对图像数据所识别出的当前视觉语义是否为特定的场景。根据本专利技术的另一个方面,还提供了一种用于智能机器人的主动交互系统,所述系统包括以下单元:图像捕获单元,其用以使机器人捕获当前场景中的图像,以得到图像数据;视觉语义解析单元,其用以通过视觉语义模型对所述图像数据进行视觉语义的识别;发起主动交互判断单元,其用以判断针对图像数据所识别出的视觉语义是否符合发起主动交互的条件,并在符合发起主动交互的情况下,由机器人主动发起交互。根据本专利技术的用于智能机器人的主动交互系统,优选的是,所述视觉语义模型是通过如下步骤建立的:建立初始模型;针对输入的图像标注出视觉语义训练数据;基于深度学习技术训练所述初始模型。根据本专利技术的用于智能机器人的主动交互系统,优选的是,在发起主动交互判断单元中,还包括用以判断针对图像数据所识别出的当前视觉语义是否为特定时间内的特定事件的单元。根据本专利技术的用于智能机器人的主动交互系统,优选的是,在发起主动交互判断单元中,还包括用以判断针对图像数据所识别出的当前视觉语义是否为用户处于特定的状态的单元。根据本专利技术的用于智能机器人的主动交互系统,优选的是,在发起主动交互判断单元中,还包括用以判断针对图像数据所识别出的当前视觉语义是否为特定的场景的单元。本专利技术的有益之处在于,由于本专利技术的用于智能机器人的主动交互方法和系统可以根据视觉语义的分析来判断当前是否需要主动交互,使得智能机器人的类人化程度更高,与人类的交互更灵活。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例共同用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为根据本专利技术的一个实施例的面向智能机器人的主动交互方法的流程图;图2显示了根据本专利技术的一个实施例的面向智能机器人的主动交互方法中进行视觉语义建模的方法流程图;图3显示了根据本专利技术的一个实施例的面向智能机器人的主动交互方法中判断是否进行主动交互的方法流程图;以及图4显示了根据本专利技术的一个实施例的面向智能机器人的主动交互系统的结构框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,以下结合附图对本专利技术实施例作进一步地详细说明。如图1所示,其中显示了根据本专利技术实施例的面向智能机器人的主动交互方法的流程图。根据本专利技术的主动交互方法开始于步骤S101。在步骤S101中,执行图像捕获操作。具体地,智能能机器人可捕获当前场景中的图像,并通过图像处理得到相应的图像数据。例如,图像数据中包括当前用户的姿态、表情以及用户周围的环境等信息。针对所捕获的当前场景图像,其可以进行进一步的分类。例如针对人体图像,需要识别面部特征、表情特征等等。而对于物体图像,需要识别出是属于哪一类物体如文具、玩具、宠物等等。对于背景图像,需要识别出环境特征、天气、地理位置等等。而对于捕获的一系列动作,需要识别出人发出这些动作与语音配合的意图特征等。当然,场景图像中还包括了其他特征,这里不一一赘述。在捕获当前图像的时候,作为对图像识别的补充,机器人系统还可以监听声音,从而在进行图像识别的同时对监听到的与当前场景图像对应的语音进行语音特征识别,进一步还可以通过语音识别系统将监听到的语音按照语义、声调、语气等进行识别。也就是说,语音特征的识别还包括语义识别、语调识别、语气识别等等。语音数据的输入可以帮助系统进行更准确的视觉语义识别。接下来,在步骤S102中,进行视觉语义解析。智能机器人可通过已经得到训练的视觉语义模型对图像数据进行视觉语义的识别。视觉语义指的是机器人通过图像识别相关技术,识别出相关的人、人相关特征、动作、手势、物体等等以及他们之间的关系,并推断出整个图像的语义。例如,机器人通过图像识别相关技术识别出相关的人、人的相关特征、动作、手势、物体特征等,并通过推断过程来推测所捕获的图像所代表的语义或者含义。根据本专利技术的视觉语义模型的建立和训练一般包括如下步骤,如图2所示。在步骤S201中,系统建立初始模型。机器人操作系统内部在开始建立视觉语义初始模型时,先根据最基本的一些图像样本数据给出对应的语义关联。随后,例如通过神经网络学习算法对随后输入的图像进行语义关联。具体说,可以在步骤S202中,针对输入的图像数据标注出视觉语义训练数据。例如,针对捕获的图像为用户的表情比较沮丧,并且发出叹息声。这时,系统会对此类图片数据进行标注,用“沮丧”这样的文本数据或者其他能够代表此类感情的静态图片或图标或其他标记来对该图像资料进行标注。这里可以通过语音识别对图像识别语义进行辅助,实际应用中,进行视觉语义识别时也可以不需要进行语音识别。在这种情况下,即使用户没有发出其他要进行交互的指令时,机器人操作系统也能识别出当前用户的情感状态,从而在合适的时候发起主动交互。在步骤S203中,基于深度学习技术并结合所标注的视觉语义训练数据来训练所建立的初始模型。由于前述的视觉语义模型是初始建立的,它们仅代表以后进行学习训练的基本构架,根据初始模型的结构,系统可以通过机器人的深度学习过程,不断地丰富模型的内容。最后所训练得到的视觉语义模型可以解释图像、声音以及输入的文本。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制本文档来自技高网...
用于智能机器人的主动交互方法和系统

【技术保护点】
一种用于智能机器人的主动交互方法,其特征在于,所述方法包括以下步骤:图像捕获步骤,捕获当前场景中的图像,以得到图像数据;视觉语义解析步骤,通过视觉语义模型对所述图像数据进行视觉语义的识别;发起主动交互判断步骤,判断针对图像数据所识别出的视觉语义是否符合发起主动交互的条件,并在符合发起主动交互的情况下,主动发起交互。

【技术特征摘要】
1.一种用于智能机器人的主动交互方法,其特征在于,所述方法包括以下步骤:图像捕获步骤,捕获当前场景中的图像,以得到图像数据;视觉语义解析步骤,通过视觉语义模型对所述图像数据进行视觉语义的识别;发起主动交互判断步骤,判断针对图像数据所识别出的视觉语义是否符合发起主动交互的条件,并在符合发起主动交互的情况下,主动发起交互。2.如权利要求1所述的用于智能机器人的主动交互方法,其特征在于,所述视觉语义模型是通过如下步骤建立的:建立初始模型;针对输入的图像标注出视觉语义训练数据;基于深度学习技术训练所述初始模型。3.如权利要求2所述的用于智能机器人的主动交互方法,其特征在于,在判断发起主动交互步骤中,判断针对图像数据所识别出的当前视觉语义是否为特定时间内的特定事件。4.如权利要求2所述的用于智能机器人的主动交互方法,其特征在于,在判断发起主动交互步骤中,判断针对图像数据所识别出的当前视觉语义是否为用户处于特定的状态。5.如权利要求2所述的用于智能机器人的主动交互方法,其特征在于,在判断发起主动交互步骤中,判断针对图像数据所识别出的当前视觉语义是否为特定的场景。6.一种用于智能机器人的主动交互系统,其特...

【专利技术属性】
技术研发人员:韦克礼
申请(专利权)人:北京光年无限科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1