一种智能机器人自动语音交互方法技术

技术编号:13908519 阅读:81 留言:0更新日期:2016-10-26 18:15
本发明专利技术提出了一种智能机器人自动语音交互方法,包括以下步骤:智能机器人接收交流对象的语音;将语音转换成文字;将转换的文字上传至服务器;在服务器进行语义解析,根据解析的语义在数据库中查找文字对话内容;将找到的文字对话内容发送至智能机器人;智能机器人将文字对话内容转换成语音播放。智能机器人能够根据声音找到交流对象的位置,实现了智能机器人与交流对象明对面交流。而且还能够根据交流对象的面部特征,自动增加称呼,形成良好的沟通氛围。

【技术实现步骤摘要】

本专利技术涉及人工智能
,特别涉及一种智能机器人自动语音交互方法
技术介绍
随着智能化时代的到来,机器人已经越来越走进人们的生活,生活中的服务机器人应用领域越来越广,我们的社会即将进入智能机器人的时代。例如,常见的服务机器人有送餐机器人、聊天机器人、导购机器人等等。这些机器人都需要与人进行互动交流。自然语言作为人类表达自己思想最方便、最自然的方式,已逐渐成为智能服务领域最主流的人机交互方式。由于自然语言具有开放性、随意性,表达方式多样,对自然语言进行语义解析,从而识别其真实含义,对于智能服务提供而言显得尤为重要。在机器人与人进行沟通的过程中,为了提高人机交互的体验性,需要机器人能够识别出交流对象表达的含义,并且迅速做出快速应答。现有的机器人通常是将一些常见的语段存储在机器人存储装置中,在收到交流对象的语音后,根据语义解析结果在存储装置中寻找应答语段进行播放。但是,现实生活中,交流对象提出的很多问题是无法预先预料的,经常会遇到找不到合适答复语段,因此无法顺畅地进行交流。而且,针对不同交流对象千篇一律的采用同一个对话模式,也不能形成良好的沟通氛围。因此,如何让机器人与交流对象之间充分友好地交流成为机器人领域一个亟待解决的问题。
技术实现思路
为了解决现有技术中存在的问题,本专利技术提供了一种智能机器人自动语音交互方法,包括以下步骤:智能机器人接收交流对象的语音;将语音转换成文字;将转换的文字上传至服务器;在服务器进行语义解析,根据解析的语义在数据库中查找文字对话内容;将找到的文字对话内容发送至智能机器人;智能机器人将文字对话内容转换成语音播放。进一步地,所述服务器预先根据语义场景对文字对话内容进行分类存储。进一步地,智能机器人在将转换的文字上传至服务器的同时,上传智能机器人的身份信息。进一步地,服务器根据智能机器人的身份信息,获得智能机器人的语义场景,根据该语义场景进行语义解析。进一步地,服务器在每种语义场景模式下,设置该语义场景的关键词。进一步地,服务器根据语义场景进行语义解析,得到多个语义解析结果,并根据该语义场景的解析结果的历史选择频次进行排序。进一步地,从所述排序中选择预设数量的语义解析结果作为最终语义解析结果,并针对所述最终语义解析结果作出响应。进一步地,智能机器人通过多个传感器获取交流对象的声音,通过定位函数确定交流对象的位置;根据确定的交流对象的位置,调整智能机器人的正面方向,使得智能机器人的正面对准交流对象。进一步地,智能机器人通过摄像头捕捉交流对象的头像,根据面部识别结果,在对话中增加称呼内容。进一步地,智能机器人记录交流对象的完整对话,上传至服务器,由服务器分析判断交流对象真正想表达的含义。本专利技术的方法通过在服务器端建立数据库,能够存储和管理庞大的数据,对于绝大部分的对话都能够给出合适的回答。通过在线传送文字对话内容数据包,能够有效提高传输速率,缩短机器人交流的反应时间。此外,智能机器人能够根据声音找到交流对象的位置,实现了智能机器人与交流对象明对面交流。而且还能够根据交流对象的面部特征,自动增加称呼,形成良好的沟通氛围。附图说明通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。图1为根据本专利技术实施例的智能机器人自动语音交互方法的流程图。图2是根据本专利技术一种实施方式的智能机器人寻声定位的示意图。图3是根据本专利技术一种实施方式的智能机器人寻声定位后转动的示意图。具体实施方式下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。如图1所示,本专利技术提供一种智能机器人自动语音交互方法,包括以下步骤:智能机器人接收交流对象的语音;将语音转换成文字;将转换的文字上传至服务器;在服务器进行语义解析,根据解析的语义在数据库中查找文字对话内容;将找到的文字对话内容发送至智能机器人;智能机器人将文字对话内容转换成语音播放。本专利技术的方法通过在服务器端建立数据库,能够存储和管理庞大的数据,对于绝大部分的对话都能够给出合适的回答。通过在线传送文字对话内容数据包,能够有效提高传输速率,缩短机器人交流的反应时间。语音与文字相互转换的技术为现有技术,在次不再赘述。优选地,服务器预先根据语义场景对文字对话内容进行分类存储。服务器可以根据智能机器人的工作环境设置不同的语义场景。并且很据不同的语义场景中可能出现的对话内容分类进行存储。例如,在酒店提供送物品服务的智能机器人,可以根据其工作环境设置多个语义场景。例如,领取物品、搭乘电梯、遇到问路、到达客人房间等多个场景。根据这些场景中高频出现的对话内容,设置关键词,便于检索。优选地,智能机器人在将转换的文字上传至服务器的同时,上传智能机器人的身份信息。每个智能机器人具有单独的身份标识符。服务器根据该身份标识符能够判断该智能机器人的服务场所,从而能够获得机器人的工作环境,快速调取针对该工作环境预设的语义场景,根据该语义场景进行语义解析,能够有效提高语义解析结果的正确率。此外,也能够根据语义场景实现快速准确的查找对话内容。优选地,由于客人的发音不标准或者语音转换的准确性不够等因素,将可能导致服务器语义解析的准确性不高。为了解决该问题,服务器首先根据语义场景进行语义解析,而且将得到多个语义解析结果。针对获得多个解析结果,服务器将根据该语义场景中的类似解析结果的历史选择频次进行排序。通常,在某一语义场景中会出现大量重复的类似对话内容。服务器激动记录历史解析结果及选择结果。根据最终选择的频次对多个解析结果排序,从而提高了解析结果的准确率。服务器从所述排序中选择预设数量的语义解析结果作为最终语义解析结果,并针对所述最终语义解析结果作出响应。服务器通常选择排序中的前几个解析结果做出响应,在数据库中查找对话内容,并且将对话内容按照排序发给智能机器人。智能机器人收到对话内容后,将其转换成语音播放。智能机器人根据交流对象的反应做出判断,如果交流对象没有反应,则智能机器人播放对话内容排序中的下一条内容。或者,智能机器人播放预设内容,例如“谢谢,请问还有什么问题么?”等。优选地,智能机器人通过多个传感器获取交流对象的声音,通过定位函数确定交流对象的位置;根据确定的交流对象的位置,调整智能机器人的正面方向,使得智能机器人的正面对准交流对象。例如,智能机器人通过三个以上的传感器(麦克风)接收交流对象的声音,通过测量声音到达不同传感器的时间差,利用定位函数确定交流对象的位置。智能机器人预先设置正面的方向,例如垂直于某两个传感器连线中心的方向为正面方向。当确定了交流对象的位置后,将智能机器人的正面方向对准该交流对象,这样交流对象就会有面对面交流的感觉,提高了用户体验。作为一个实施例,如图2所示,给出了根据本专利技术一种实施方式的智能机器人寻声定位的示意图。在本实施例中,传感器阵列采用正方形,传感器1、2、3、4的位置坐标分别为(-L,-L)、(L,-L)、(L,L),(-L,L),本文档来自技高网...

【技术保护点】
一种智能机器人自动语音交互方法,其特征在于,包括以下步骤:智能机器人接收交流对象的语音;将语音转换成文字;将转换的文字上传至服务器;在服务器进行语义解析,根据解析的语义在数据库中查找文字对话内容;将找到的文字对话内容发送至智能机器人;智能机器人将文字对话内容转换成语音播放。

【技术特征摘要】
1.一种智能机器人自动语音交互方法,其特征在于,包括以下步骤:智能机器人接收交流对象的语音;将语音转换成文字;将转换的文字上传至服务器;在服务器进行语义解析,根据解析的语义在数据库中查找文字对话内容;将找到的文字对话内容发送至智能机器人;智能机器人将文字对话内容转换成语音播放。2.根据权利要求1所述的方法,其特征在于,所述服务器预先根据语义场景对文字对话内容进行分类存储。3.根据权利要求1所述的方法,其特征在于,智能机器人在将转换的文字上传至服务器的同时,上传智能机器人的身份信息。4.根据权利要求3所述的方法,其特征在于,服务器根据智能机器人的身份信息,获得智能机器人的语义场景,根据该语义场景进行语义解析。5.根据权利要求2所述的方法,其特征在于,服务器在每种语义场景模式下,设置该语义场景的关键词。6.根据权利要求4...

【专利技术属性】
技术研发人员:张伟
申请(专利权)人:北京云迹科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1