一种基于图像识别的跟随式机器人扩声方法及扩声系统技术方案

技术编号：26771208 阅读：34 留言：0更新日期：2020-12-18 23:51

本发明专利技术适用于扩声技术领域，提供一种基于图像识别的跟随式机器人扩声方法及扩声系统，该方法包括：在第一声音采集装置获取到解说员的语音的情况下，控制机器人的扩声装置对解说员的语音进行扩声播放；获取各用户的人脸图像，并对人脸图像进行图像识别，以获取各用户的年龄；将获取的各用户的年龄中的最大年龄确定为目标年龄，并判断目标年龄是否大于预设年龄；若目标年龄大于预设年龄，则调整机器人相对目标年龄对应的目标用户的位置。本发明专利技术通过跟随式可移动机器人对解说员的语音进行扩声播放，免去了解说员需要随身佩戴扩音设备的负担，且确保年龄较大用户也能够听清楚解说内容，改善了整体解说效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图像识别的跟随式机器人扩声方法及扩声系统
本专利技术属于扩声
，尤其涉及一种基于图像识别的跟随式机器人扩声方法及扩声系统。
技术介绍
在展厅的展示过程中，通常需要解说员对展厅的各个部分向用户进行介绍，当展厅面积较大或者人数众多时，解说员需要持续提高讲解的声音才能够确保用户可以听到其解说。然而，长时间大声讲解会使得解说员变得疲乏。目前常见的方式是解说员随身携带扩音设备，例如小蜜蜂或者喇叭等，其虽然可以起到扩声的作用，但是对于用户较多的情况，小蜜蜂或者喇叭等扩音设备无法根据不同的用户调整扩音方式，导致扩声效果不佳。
技术实现思路
有鉴于此，本专利技术实施例提供了一种基于图像识别的跟随式机器人扩声方法及扩声系统，以解决现有技术中扩音设备无法根据不同的用户调整扩音方式，导致扩声效果不佳的技术问题。本专利技术实施例的第一方面，提供了一种基于图像识别的跟随式机器人扩声方法，包括：在第一声音采集装置获取到解说员的语音的情况下，控制机器人的扩声装置对所述解说员的语音进行扩声播放；r>获取各用户的人脸本文档来自技高网...

【技术保护点】
1.一种基于图像识别的跟随式机器人扩声方法，其特征在于，包括：/n在第一声音采集装置获取到解说员的语音的情况下，控制机器人的扩声装置对所述解说员的语音进行扩声播放；/n获取各用户的人脸图像，并对所述人脸图像进行图像识别，以获取各所述用户的年龄；/n将获取的各所述用户的年龄中的最大年龄确定为目标年龄，并判断所述目标年龄是否大于预设年龄；/n若所述目标年龄大于预设年龄，则调整所述机器人相对所述目标年龄对应的目标用户的位置。/n

【技术特征摘要】
1.一种基于图像识别的跟随式机器人扩声方法，其特征在于，包括：
在第一声音采集装置获取到解说员的语音的情况下，控制机器人的扩声装置对所述解说员的语音进行扩声播放；
获取各用户的人脸图像，并对所述人脸图像进行图像识别，以获取各所述用户的年龄；
将获取的各所述用户的年龄中的最大年龄确定为目标年龄，并判断所述目标年龄是否大于预设年龄；
若所述目标年龄大于预设年龄，则调整所述机器人相对所述目标年龄对应的目标用户的位置。

2.如权利要求1所述的基于图像识别的跟随式机器人扩声方法，其特征在于，所述获取各用户的人脸图像，并对所述人脸图像进行图像识别，以获取各所述用户的年龄，包括：
对采集的用户的图像进行图像处理，获取所述图像中各用户的人脸图像；
采用年龄识别模型对各所述人脸图像进行图像识别，确定各人脸图像对应的年龄，以获取各所述人脸图像对应的用户的年龄，其中，所述年龄识别模型使用样本集通过机器学习训练得到。

3.如权利要求1所述的基于图像识别的跟随式机器人扩声方法，其特征在于，所述调整所述机器人相对所述目标年龄对应的目标用户的位置的步骤，包括：
根据所述目标年龄，确定与所述目标年龄对应的用户为目标用户；
确定所述目标用户相对于所述机器人的位置；
根据所述目标用户相对于所述机器人的位置，确定所述目标用户与所述机器人之间的第一实时距离；
基于所述第一实时距离以及第一预设距离，调整所述机器人相对所述目标用户的位置。

4.如权利要求1所述的基于图像识别的跟随式机器人扩声方法，其特征在于，所述调整所述机器人相对所述目标年龄对应的目标用户的位置的步骤，包括：
根据所述目标年龄，确定与所述目标年龄对应的用户为目标用户；
确定所述目标用户相对于所述机器人的位置；
根据所述目标用户相对于所述机器人的位置，确定所述目标用户与所述机器人之间的第一实时距离；
根据设于所述解说员预设位置的定位标签，确定所述机器人与所述定位标签的第二实时距离；
基于所述第一实时距离、第一预设距离、第二实时距离以及第二预设距离，在确保所述机器人相对所述解说员的距离不大于所述第二预设距离的情况下，调整所述机器人相对所述目标用户的位置。

5.如权利要求1所述的基于图像识别的跟随式机器人扩声方法，其特征在于，所述若所述目标年龄满足预设年龄，则调整所述机器人相对所述目标年龄对应的目标用户的位置的步骤后，所述方法还包括：
获取各用户的人脸图像，并获取所述人脸图像中各所述用户相对于所述机器人的位置；
根据各所述用户相对于所述机器人的位置，调整所述机器人的各个扩声装置的状态。

6.如权利要求5所述的基于图像识别的跟随式机器人扩声方法，其特征在于，所述扩声装置的状态包括各个所述扩声装置的朝向；
或者，所述扩声装置的状态包括各个所述扩声装置的音量；
或者，所述扩声装置的状态包括各个所述扩声装置的朝向和音量。

7.如权利要求1所述的基于图像识别的跟随式机器人扩声方法，其特征在于，所述将获取的各人脸图像对应的年龄中的最大年龄确定为目标年龄，并判断所述目标年龄是否满足预设年龄的步骤后，所述方法还包括：
若所述目标年龄不满足预设年龄，则：
根据设于所述解说员预设位置的定位标签，确定所述机器人与所述定位标签的第二实时距离；
根据所述第二实时距...

【专利技术属性】
技术研发人员：陈孝良，常乐，阮明江，
申请(专利权)人：北京声智科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人