一种用于意图理解的人机交互方法技术

技术编号：35974582 阅读：12 留言：0更新日期：2022-12-17 22:42

本发明专利技术涉及一种用于意图理解的人机交互方法，方法包括利用图像识别模型识别出所述图像中的目标区域信息；将所述自然语言指令进行语句分割形成若干个句子成分，并将各个句子成本标注为语义信息后，对各个语义信息进行序列标注，以提取出所述自然语言指令中的关键词信息；将所述图像中的目标区域信息和关键词信息进行转换，并放置在同一特征空间下后，找出转换后的目标区域信息以及关键词信息中相似度最高的结果，根据所述相似最高的结果生成结构化的机器人控制语言；根据所述机器人控制语言生成控制指令，以使机器人动作。本发明专利技术解决了目前机器人无法理解人类语言指令的真实意图的问题。的问题。的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于意图理解的人机交互方法

[0001]本专利技术涉及机器人控制
，特别涉及一种用于意图理解的人机交互方法。

技术介绍

[0002]现有技术提供的机器人的智能化程度也越来越高，目前，用户可直接发出语音指令来实现与机器人的人机交互。但是目前，更多的是让机器人根据人类的自然语言进行路径的规划与移动，但对于更为复杂的交互(人类自然语言所要表达的潜在含义)，机器人不能正确的理解从而做出相应的回应。故导致用户无法准确说出想要表达的意思时，及在用户发出模糊自然语言指令时，机器人可能无法做出正确的回应，不方便用户的使用。

技术实现思路

[0003]本专利技术提供一种用于意图理解的人机交互方法，解决目前机器人无法准确识别模糊自然语言指令的问题。
[0004]为了实现上述目的，本专利技术提供以下技术方案：
[0005]一种用于意图理解的人机交互方法，包括机器人，具体步骤如下：
[0006]S1、机器人接收到用户请求，所述用户请求包括自然语言指令以及图像指令；
[0007]S2、机器人利用预存好的图像识别模型对图像指令进行识别，并识别出图像指令中的目标区域信息；
[0008]S3、将自然语言指令进行语句分割形成若干个句子成分，并将各个句子成分标注为语义信息；
[0009]S4、对各个语义信息进行序列标注，以提取出自然语言指令中的关键词信息；
[0010]S5、将图像指令中的目标区域信息和自然语言指令中的关键词信息进行转换，然后将其放置在同一特征空间下，找出...

【技术保护点】

【技术特征摘要】
1.一种用于意图理解的人机交互方法，其特征在于，包括机器人，具体步骤如下：S1、机器人接收到用户请求，所述用户请求包括自然语言指令以及图像指令；S2、机器人利用预存好的图像识别模型对图像指令进行识别，并识别出图像指令中的目标区域信息；S3、将自然语言指令进行语句分割形成若干个句子成分，并将各个句子成分标注为语义信息；S4、对各个语义信息进行序列标注，以提取出自然语言指令中的关键词信息；S5、将图像指令中的目标区域信息和自然语言指令中的关键词信息进行转换，然后将其放置在同一特征空间下，找出转换后的目标区域信息以及关键词信息中相似度最高的结果；S6、根据得出的相似度最高的结果生成结构化的机器人控制语言；S7、根据机器人控制语言生成控制指令，并使机械臂按照用户发出的自然语言指令及图像指令进行动作。2.根据权利要求1所述的用于意图理解的人机交互方法，其特征在于，所述图像识别模型为Mask R
‑
CNN检测模型，所述Mask R
‑
CNN检测模型的骨干架构采用Resnet101
‑
FPN。3.根据权利要求1所述的用于意图理解的人机交互方法，其特征在于，所述目标区域信息包括目标物体名称信息以及送达处名称信息，所述关键词信息包括目标物体关...

【专利技术属性】
技术研发人员：林胜钊，陈功，蒙顺政，
申请(专利权)人：深圳无芯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人