机器人的交互方法及送物机器人技术

技术编号：40550817 阅读：13 留言：0更新日期：2024-03-05 19:09

本申请实施例适用于配送机器人技术领域，提供了一种机器人的交互方法及送物机器人，所述方法包括：在采集语音信息的过程中，通过安装在机器人上的摄像装置采集实时视频；从所述实时视频中，获取人脸信息；基于所述人脸信息和所述机器人的任务场景，从所述语音信息中确定目标语音信息；基于所述目标语音信息，进行选择性交互。通过上述方法，能够避免机器人进行无效交互，提高机器人语音交互的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于配送机器人，特别是涉及一种机器人的交互方法及送物机器人。

技术介绍

1、嘈杂环境下，机器人的语音交互功能会受到影响。嘈杂环境下，存在多个声源，自主移动机器人可能采集到来自多个声源的声音。在存在多个声源的声音的情况下，机器人难以从采集的声音中确定需要交互的声音，从而影响语音交互体验以及作业效率。

2、示例性的，配送机器人例如餐饮机器人，在餐厅送餐时，会受到很多环境噪音的影响。例如周围顾客的交谈、盘子碗碟的碰撞以及店里的背景音乐等声音均会在餐饮机器人进行语音交互时，影响餐饮机器人的有效拾音。餐饮机器人采集到的声音中包括多种来源的声音，若对采集的声音进行无差别拾音，则会使得在语音识别后产生很多无意义的脏文本数据，这种脏文本数据机器人理解不了，从而会导致机器人产生很多错误的理解和回复。机器人的错误理解和回复，影响用户的交互体验，同时影响送餐效率。

技术实现思路

1、有鉴于此，本申请实施例提供了一种机器人的交互方法及送物机器人，用以避免机器人进行无效交互，提高机器人的交互反馈准确度和语音交互的效率。

2、本申请实施例的第一方面提供了一种机器人的交互方法，包括：

3、在采集语音信息的过程中，通过安装在机器人上的摄像装置采集实时视频；

4、从所述实时视频中，获取人脸信息；

5、基于所述人脸信息和所述机器人的任务场景，从所述语音信息中确定目标语音信息；

6、基于所述目标语音信息，进行选择性交互。

7、本申

8、信息采集模块，用于在采集语音信息的过程中，通过安装在机器人上的摄像装置采集实时视频；

9、人脸信息获取模块，用于从所述实时视频中，获取人脸信息；

10、目标语音确定模块，用于基于所述人脸信息和所述机器人的任务场景，从所述语音信息中确定目标语音信息；

11、交互模块，用于基于所述目标语音信息，进行选择性交互。

12、本申请实施例的第三方面提供了一种送物机器人，包括安装在机器人上的摄像装置、设置拾音范围的拾音装置、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述摄像装置用于采集所述拾音范围内的实时视频，所述拾音装置用于采集语音信息，所述处理器基于所述实时视频和所述语音信息执行所述计算机程序时实现上述第一方面所述的方法。

13、本申请实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上述第一方面所述的方法。

14、本申请实施例的第五方面提供了一种计算机程序产品，当所述计算机程序产品在送物机器人上运行时，使得所述送物机器人执行上述第一方面所述的方法。

15、与现有技术相比，本申请实施例中的方法至少包括以下优点：

16、机器人应用本申请实施例中的方法进行语音交互时，可以在采集语音信息的过程中，通过安装在机器人上的摄像装置采集实时视频；从采集的实时视频中，可以获取人脸信息。从而机器人可以根据人脸信息和机器人的任务场景，从采集的语音信息中确定目标语音信息。在确定目标语音信息之后，机器人可以基于目标语音信息进行选择性交互。本申请实施例中，机器人可以根据实时视频中的人脸信息和任务场景确定目标语音信息，实现从多种语音信息中确定有效的拾音，提高机器人的交互反馈准确度，从而避免机器人进行无效交互，提高机器人语音交互的效率。

本文档来自技高网...

【技术保护点】

1.一种机器人的交互方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述从所述实时视频中，获取人脸信息，包括：

3.如权利要求2所述的方法，其特征在于，所述人脸信息包括唇部的口型变化率，所述基于所述人脸的多个所述关键点，提取人脸信息，包括：

4.如权利要求3所述的方法，其特征在于，在所述基于所述口型信息，计算所述唇部的口型变化率之后，所述方法还包括：

5.如权利要求3或4所述的方法，其特征在于，通过以下公式，基于所述口型信息，计算所述唇部的口型变化率：

6.如权利要求1-4任一项所述的方法，其特征在于，所述人脸信息包括口型变化率，所述基于所述人脸信息和所述机器人的任务场景，从所述语音信息中确定目标语音信息，包括：

7.如权利要求6所述的方法，其特征在于，所述根据所述口型变化率，确定发出语音的各个拾音对象，包括：

8.如权利要求6所述的方法，其特征在于，所述根据所述任务场景，从各个所述拾音对象中，确定目标拾音对象，包括：

9.如权利要求6所述的方法，其特征在于，所述根据

10.如权利要求6所述的方法，其特征在于，所述根据所述任务场景，从各个所述拾音对象中，确定目标拾音对象，包括：

11.一种送物机器人，其特征在于，包括安装在机器人上的摄像装置、设置拾音范围的拾音装置、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述摄像装置用于采集所述拾音范围内的实时视频，所述拾音装置用于采集语音信息，所述处理器基于所述实时视频和所述语音信息执行所述计算机程序时实现如权利要求1-10任一项所述的方法。

...

【技术特征摘要】

1.一种机器人的交互方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述从所述实时视频中，获取人脸信息，包括：

3.如权利要求2所述的方法，其特征在于，所述人脸信息包括唇部的口型变化率，所述基于所述人脸的多个所述关键点，提取人脸信息，包括：

4.如权利要求3所述的方法，其特征在于，在所述基于所述口型信息，计算所述唇部的口型变化率之后，所述方法还包括：

5.如权利要求3或4所述的方法，其特征在于，通过以下公式，基于所述口型信息，计算所述唇部的口型变化率：

7.如权利要求6所述的方法，其特征在于，所述根据所述...

【专利技术属性】
技术研发人员：涂海，周冲，李通，
申请(专利权)人：上海擎朗智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人