具有云端交互功能的智能机器人制造技术

技术编号:13615848 阅读:102 留言:0更新日期:2016-08-29 19:36
本实用新型专利技术提供一种具有云端交互功能的智能机器人,包括机器人本体,以及在机器人本体上设置的语音输入单元、口令识别处理单元、云端识别单元、主控单元和执行机构,主控单元控制执行云端识别单元和口令识别处理单元,并根据识别处理结果驱动执行机构执行动作或给出提示信息。智能机器人会根据云端识别和口令识别的之一的执行结果,确定是否执行另一个识别单元。本实用新型专利技术的智能机器人和云端交互系统,集成了离线的口令识别处理和云端在线识别处理两种功能,并能够根据实际场景或其他策略确定适用的识别处理单元以及顺序,扩展了语音识别适用范围,同时在云端识别中增加了语音识别和语义理解,提高了机器人的智能性。

【技术实现步骤摘要】

本技术涉及语音识别和人工智能领域,具体涉及一种具有云端交互功能的智能机器人和云端交互系统。
技术介绍
语音识别技术在过去二十年里获得了显著的进展,随着语音识别精度的提高,语音识别技术已经广泛地应用于不同的领域,也越来越为大众所熟悉和认可。在智能机器人领域,语音识别技术的应用提高了机器人的交互能力。目前比较流行的一种智能机器人,通过以硬件(语音识别类的处理器及相关信号处理电路)方式捕捉语音信号、处理信号、输出信号并驱动相关执行机构。这种机器人往往需要预先定义交互场景,根据交互场景开发响应的处理程序,因此只能提供有限的娱乐和智能功能。另外,进行语音识别需要在机器人内部存储语料库,通过语料库从输入的关键词的发音中捕捉信息,语料库的存储能力限制语音识别的范围和准确度。目前有一种宠物机器人,具有交互模块,该模块能够感应外界环境参数、接收外界语音信息并输出语音信息、与移动终端进行数据交互,但该类宠物机器人虽然具备听觉能力,但不能和云端交互,因此能够识别的语音信息会受到本地存储资源的限制。随着互联网技术的发展,一些科技公司开发出具有一定网络交互能力的系统,能够实现语音信息和互联网的实时互动,极大地扩展了语音系统的智能程度。该技术主要用于手机平板等手持设备的语音助手功能,根据输入的语音信息对文本内容进行简单逻辑的识别并给出合适的反馈。目前该技术未在消费型机器人市场体现,且只有在联网状态下才能工作,适用范围有限。
技术实现思路
有鉴于此,本技术提供具有云端交互功能的智能机器人和云端交互系统,在联网状态下获取云端语音服务,在网络中断时也具有一定的语音识别能力。根据本技术的一个方面,提供一种具有云端交互功能的智能机器人,所述智能机器人包括机器人本体,所述机器人本体上设置有:语音输入单元,包括分别安装在所述机器人本体上的两个麦克风,用于获得外部输入的语音信号;云端识别单元,用于将所述语音信号发送至云端服务器并由所述云端服务器执行云端语音识别和云端语义理解至少之一,接收所述云端服务器发来的云端识别处理结果;主控单元,用于发送所述语音信号至云端识别单元,并根据所述云端识别处理结果控制执行机构;执行机构,用于执行机械动作和\\或提供提示信息。优选地,所述执行机构为扬声器,用于以语音形式提供提示信息。优选地,所述执行机构为运动部件,用于以动作方式提供机械动作。优选地,所述智能机器人和所述云端服务器通过无线网络接口连接。本技术提供的智能机器人和云端交互系统,集成了离线的口令识别和云端在线识别,并能够根据实际场景或其他策略确定适用的识别单元以及执行顺序,适用范围得到了极大的扩展,并且在云端识别中增加了语音识别和语义理解,提高了机器人的智能性。附图说明通过参照以下附图对本技术实施例的描述,本技术的上述以及其它目的、特征和优点将更为清楚,在附图中:图1是本技术实施例的智能机器人的示意图;图2是本技术实施例的智能机器人的结构框图;图3是本技术另一个实施例的智能机器人的结构框图;图4是本技术实施例的云端识别方法的流程图;图5是本技术另一个实施例的云端识别方法的流程图;图6是本技术另一个实施例的云端识别方法的流程图;图7是本技术实施例的云端交互系统的示意图。具体实施方式以下基于实施例对本技术进行描述,但是本技术并不仅仅限于这些实施例。在下文对本技术的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本技术。为了避免混淆本技术的实质,公知的方法、过程、流程没有详细叙述。另外附图不一定是按比例绘制的。附图中的流程图、框图图示了本技术实施例的系统、方法、装置的可能的体系框架、功能和操作,流程图和框图上的方框可以代表一个模块、程序段或仅仅是一段代码,所述模块、程序段和代码都是用来实现规定逻辑功能的可执行指令。也应当注意,所述实现规定逻辑功能的可执行指令可以重新组合,从而生成新的模块和程序段。因此附图的方框以及方框顺序只是用来更好的图示实施例的过程和步骤,而不应以此作为对技术本身的限制。在本文中提到的声纹识别,指根据输入的声音信号,提取声纹特征,使用声纹特征辨识说话人。语音识别,指根据输入的声音信号经过一系列的声音算法提取出文本内容。语义理解,可以简单地看作是对声音信号所对应的现实世界中的事物所代表的概念的含义,以及这些含义之间的关系的理解,是声音信号在某个领域上的解释和逻辑表示。图1给出了本技术实施例中的本体为企鹅形状的智能机器人的示意图,作为宠物机器人的一种,企鹅形态的机器人深受儿童的喜爱。在企鹅机器人的头部左右耳处安装麦克风101,在企鹅机器人的内部控制板安装控制模块102。麦克风101通过信号线与控制模块102连接在一起。采用双耳的两个麦克风作为语音输入源,将采集到声音信息转为电信号,通过线束传输至位于企鹅腔体中的控制模块102中处理,控制模块102将声音信号信息提交到云端服务器,根据在云端的处理结果决定是否调用本地处理程序。图2给出了本技术一个实施例的智能机器人的结构框图。箭头方向表示数据的流向。所述智能机器人包括语音输入单元210、主控单元220、口令识别处理单元230、云端识别单元240和执行机构250。语音输入单元210接收外部输入的语音信号,该语音信号是自然语言的音频信息,需要进行降噪、过滤等处理。在优选实施例中,采用了智能化数字阵列降噪拾音器的麦克风,其具有2种降噪模式,最大可降低45dB噪音。另外,麦克风分别置于企鹅的双耳处,通过分散采集声音信号保证获取的音频信号的准确性和完整性。语音输入单元210还可以具有语音预处理功能,外部输入的语音信号可能受环境、场景、相对位置等因素的影响,需要对音频信息进行调制解调、语音降噪、音频放大等多种方式的预处理。其中,语音降噪可以采用DSP降噪算法进行降噪,能够去除背景噪声、抑制外部人声干扰、抑制回声、抑制混响。DSP降噪算法对稳态和非稳态的噪音以及机械噪音都有非常强的抑制能力。双麦克风和语音预处理单元结合使用,能将噪音几乎完全消除,同时能保证正常语音的清晰度和自然度,并能无延时的输出。主控单元220接收语音信号,根据预定策略确定适宜的语音识别单元。本技术实施例中提供的两种语音识别方式包括口令识别处理单元230和云端识别单元240,主控单元220确定一个具体的语音识别方式后将语音信息发送给它,并接收处理结果,根据处理结果驱动执行机构250工作或将该语音信号发送给另一个识别单元。其中可以设置多种类型的预定策略,例如,在语音信号中指定识别单元,或默认先执行口令识别,再执行云端识别,或者相反。策略的选择能够减少无用识别的时间,提高智能机器人的工作效率。例如,一般来说,本地识别的处理效率高于云端识别的处理效率,因此通常将语音信号先进行本地识别,再进行云端识别。在一个示例中,主控单元220根据口令识别处理结果,决定是否将语音信号发送至云端服务器进行云端识别。进一步地,主控单元220根据口令识别处理结果来判定语音信号是否被本地口令识别成功,若是,则根据口令识别处理结果控制执行机构,若否,则将语音信号发送至云端服务器进行云端识别。在另一个示例中,主控单元220根本文档来自技高网...

【技术保护点】
一种具有云端交互功能的智能机器人,其特征在于,所述智能机器人包括机器人本体,所述机器人本体上设置有:语音输入单元,包括分别安装在所述机器人本体上的两个麦克风,用于获得外部输入的语音信号;云端识别单元,用于将所述语音信号发送至云端服务器并由所述云端服务器执行云端语音识别和云端语义理解至少之一,接收所述云端服务器发来的云端识别处理结果;主控单元,用于发送所述语音信号至云端识别单元,并根据所述云端识别处理结果控制执行机构;执行机构,用于执行机械动作和\或提供提示信息。

【技术特征摘要】
1.一种具有云端交互功能的智能机器人,其特征在于,所述智能机器人包括机器人本体,所述机器人本体上设置有:语音输入单元,包括分别安装在所述机器人本体上的两个麦克风,用于获得外部输入的语音信号;云端识别单元,用于将所述语音信号发送至云端服务器并由所述云端服务器执行云端语音识别和云端语义理解至少之一,接收所述云端服务器发来的云端识别处理结果;主控单元,用于发送所述语音信号至云端识别...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:深圳光启合众科技有限公司
类型:新型
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1