【技术实现步骤摘要】
拾音方法和拾音装置
[0001]本申请涉及信息
,尤其涉及一种拾音方法和拾音装置。
技术介绍
[0002]拾音设备用于拾取声音信息,以实现声音信息的传播。例如,银行工作人员可以使用拾音设备拾取客户的语言信息,以实现与客户的沟通;智能音箱通过拾音设备拾取用户的语言指令,以完成相应地任务;会议软件通过拾音设备拾取参会人员的语言信息,以实现跨地域的沟通等。
[0003]现有技术中,拾音设备可以通过设定固定波束的拾音角度范围,对特定角度区域内的声音进行拾取。该方法可以在封闭的区域中对声音进行拾取,但在开放区域中对声音进行拾取时的效果不好。
技术实现思路
[0004]本申请提供了一种拾音方法和拾音装置,可以通过摄像头拍摄的图像,检测该摄像机视场角范围内的人物,根据人物位置灵活调整拾音范围,提高拾音效果。
[0005]第一方面,提供了一种拾音方法,应用于包括摄像头和麦克风的拾音设备,该方法包括:根据摄像头拍摄的包括至少一个人物的图像,确定目标人物;将该目标人物所在的范围确定为目标拾音范围;在该目标拾 ...
【技术保护点】
【技术特征摘要】
1.一种拾音方法,其特征在于,应用于包括摄像头和麦克风的设备,所述方法包括:根据所述摄像头拍摄的包括至少一个人物的图像,确定目标人物;将所述目标人物所在的范围确定为目标拾音范围;在所述目标拾音范围内通过所述麦克风进行拾音。2.根据权利要求1所述的方法,其特征在于,所述根据所述摄像头拍摄的包括至少一个人物的图像,确定目标人物,包括:根据所述至少一个人物相对于所述摄像头的角度信息以及所述至少一个人物到所述摄像头的距离,确定所述目标人物,所述角度信息是根据所述至少一个人物在所述摄像头拍摄的图像的像素点信息和所述摄像头的视场角的对应关系确定的。3.根据权利要求1所述的方法,其特征在于,所述根据摄像头拍摄的包括至少一个人物的图像,确定目标人物,包括:根据所述至少一个人物在所述摄像头拍摄的图像中的位置信息和所述至少一个人物相对于所述摄像头的角度信息,确定所述目标人物,所述位置信息是所述至少一个人物在所述摄像头拍摄的图像的像素点信息。4.根据权利要求2所述的方法,其特征在于,所述摄像头拍摄的图像包括第一图像和第二图像,所述第一图像和所述第二图像均包括所述至少一个人物;所述方法还包括:将所述至少一个人物在所述第一图像和所述第二图像中的坐标之差,确定为所述至少一个人物的视差;基于所述至少一个人物的视差,确定所述至少一个人物到所述摄像头的距离。5.根据权利要求2所述的方法,其特征在于,所述至少一个人物到所述摄像头的距离是通过深度传感器获取的。6.根据权利要求3所述的方法,其特征在于,所述至少一个人物包括两个或两个以上人物;所述根据至少一个人物在摄像头拍摄的图像中的位置信息和所述至少一个人物相对于所述摄像头的角度信息,确定所述目标人物,包括:利用聚类算法和所述角度信息,将所述至少一个人物分为至少两类人物;根据所述至少两类人物的角度信息,确定所述至少两类人物与预设中心位置之间的角度;从所述至少两类人物中选择与所述预设中心位置之间的角度小于或等于第一阈值,且人物数量大于或等于第二阈值的目标聚类;将所述目标聚类中的人物确定为所述目标人物。7.根据权利要求2所述的方法,其特征在于,所述至少一个人物包括两个或两个以上人物;所述根据所述至少一个人物相对于所述摄像头的角度信息以及所述至少一个人物到所述摄像头的距离,确定所述目标人物,包括:根据所述至少一个人物到所述摄像头的距离以及所述角度信息,确定所述至少一个人物的水平面的二维坐标;利用聚类算法和所述二维坐标,将所述至少一个人物分为至少两类人物;
根据所述至少两类人物的二维坐标,确定所述至少两类人物与预设中心位置之间的距离;从所述至少两类人物中选择与所述预设中心位置之间的距离小于或等于第三阈值,且人物数量大于或等于第四阈值的目标聚类;将所述目标聚类中的人物确定为所述目标人物。8.根据权利要求1至7中任一项所述的方法,其特征在于,在所述确定目标人物之前,所述方法还包括:通过所述摄像头,在第一时刻获取所述至少一个人物的第三图像,在第二时刻获取所述至少一个人物的第四图像;基于所述至少一个人物在所述第三图像和所述第四图像中的位置信息,确定所述至少一个人物的移动范围小于或等于第五阈值。9.根据权利要求8所述的方法,其特征在于,在将所述目标人物所在的范围确定为目标拾音范围之前,所述方法还包括:根据所述目标人物所在的范围确定候选拾音范围,比较所述候选拾音范围与所述设备上已设定的拾音范围;确定所述候选拾音范围与所述设备上已设定的拾音范围之间相...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。