【技术实现步骤摘要】
一种基于自然语言理解的机器人控制方法
本专利技术属于机器人运动领域,特别涉及一种基于自然语言理解的机器人控制方法。
技术介绍
随着机器人的智能性和灵活性越来越高,传统的机器人控制方式已经逐渐的无法满足智能机器人的需要。因此,寻找合适的机器人智能控制方式已经成为了目前的一项研究方向。通过智能控制方式,机器人只需要理解人类的意图,通过其本身的智能性来完成剩余的控制工作。如今,随着计算机技术以及语音识别技术的发展,语音作为同计算机的交流方式之一,已经逐步的被人们所接受。而语音作为人与人之间的常用交流方式,相比鼠标、键盘,具有更强的便利性。因此,语音成为了目前被人们所研究的机器人智能控制方式之一。相比传统的机器人控制方式,通过语音控制机器人不仅更加便捷,在工作效率上也能得到提高,十分符合人们的需要。目前,大多数的基于语音识别的机器人控制系统只能简单地识别一些诸如“前进”、“左转”、“停止”等的基本指令,即使有少部分的能实现连续语音识别的机器人控制系统,也只能识别固定模式的机器人控制指令,与所期望实现的机器人的智能语音控制相差甚远。
技术实现思路
本专利技术提出了一种基于自然语言理解的机器人控制方法。这个方法首先从用户对机器人下达的语音指令中读取出语音流,并将其转换为文本信息,而后将文本信息通过意图理解算法转换为机器人控制指令,最后通过机器人运动学变换实现机器人的控制。本专利技术一种基于自然语言理解的机器人控制方法,包括如下步骤:S1、获取及分析语音信号;S2、用户意图理解;S3、控制机器人运动。进一步地,所述步骤S1包括以下步骤:操作者通过麦克风发出一系列连续的语音指 ...
【技术保护点】
1.一种基于自然语言理解的机器人控制方法,其特征在于包括如下步骤:S1、获取及分析语音信号:通过麦克风发出一系列连续的语音指令,麦克风将语音信号化为语音流,计算机接收语音流,并将语音流转换为计算机可处理的数字信号;S2、用户意图理解,包括文本信息提取及分割、文本信息分类、控制指令转换;S3、控制机器人运动,通过获取的机器人控制指令,将获得的机械臂末端执行器空间坐标反解为旋转关节的关节变量,控制机器人进行运动。
【技术特征摘要】
1.一种基于自然语言理解的机器人控制方法,其特征在于包括如下步骤:S1、获取及分析语音信号:通过麦克风发出一系列连续的语音指令,麦克风将语音信号化为语音流,计算机接收语音流,并将语音流转换为计算机可处理的数字信号;S2、用户意图理解,包括文本信息提取及分割、文本信息分类、控制指令转换;S3、控制机器人运动,通过获取的机器人控制指令,将获得的机械臂末端执行器空间坐标反解为旋转关节的关节变量,控制机器人进行运动。2.根据权利要求1所述的一种基于自然语言理解的机器人控制方法,其特征在于所述步骤S1中,语音信号数字化之后反映为一副波形图,直观的表示其数字特征,首先通过预滤波、采样、A/D转换、分帧、数据加窗、高频提升步骤进行语音信号的预处理,由于得到的语音信号和参考模板长度不一,需要对处理好的语音信号进行规整。3.根据权利要求2所述的一种基于自然语言理解的机器人控制方法,其特征在于步骤S1所述规整采用了动态时间规整算法:假设有两个时间序列Q和C,它们的长度分别是n和m,n、m为正整数:Q=q1,q2,....,qi,qnC=c1,c2,....,cj,cm;为了对齐这两个序列,需要构造一个nxm的矩阵网格,矩阵元素(i,j)表示qi和cj两个点的距离d(qi,cj),i=1~n,j=1~m;采用欧式距离:d(qi,cj)=(qi-cj)2定义路径:W=w1,w2,....,wn表示两个序列的最短路径,因此有:其中K为补偿参数,是用于对不同的长度的规整路径做补偿,k=1~K;定义累积距离γ,从(0,0)点开始匹配这两个序列Q和C,每到一个点,之前所有的点计算的距离都会累加,到达终点(n,m)后,此距离γ(n,m)即为总距离,表示序列Q和C的相似度;累积距离γ(i,j)能按以下方式表示:γ(i,j)=d(qi,cj)+min{γ(i-1,j-1),γ(i-1,j),γ(i,j-1)}按照以上过程求得语音信号所符的参考模板,从而将该语音信号转换为文本信息。4.根据权利要求1所述的一种基于自然语言理解的机器人控制方法,其特征在于步骤S2所述文本信息提取及分割具体包括:在用户意图理解的过程中,首要步骤是从文本信息中采集出与机器人控制指令所关联的文本片段;在一段文本信息中,既存在与机器人控制指令相关的关键文本信息,也存在对一段文本信息的理解无关的冗余信息;关键文本信息包括动作词、物品的名字、物品的属性、位置词,而冗余信息则包括语气助词、无关字词;通过建立模型分别匹配这些关键信息和冗余信息;对于一段文本信息,分别对此文本信息中的关键信息和冗余信息进行匹配,而后插入分割符对关键信息和冗余信息进行分割。5.根据权利要求1所述的一种基于自然语言理解的机器人控制方法,其特征在于步骤S2所述文本信息分类具体包括:得到文本分割的结果之后,需要建立自然语言指令和对应机器人控制指令之间的映射关系,这个过程能看作是一个分类问题,利用基于最大熵模型的分类器来解决;采用向量空间模型来表示文本特征:针对训练语料库,统计库中所有出现的词;假设一语料文本中有N个词,那么该文本就表示为N...
【专利技术属性】
技术研发人员:张平,杜广龙,徐灿,金培根,何子平,陈明轩,李方,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。