声音处理方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:37811207 阅读:28 留言:0更新日期:2023-06-09 09:41
本申请提供的一种声音处理方法、装置、设备、存储介质及程序产品,包括:获取用户周围的环境地图;响应于获取到语音音频数据,确定用户的目标对象;基于环境地图确定目标对象的音源位置,追踪音源位置的目标语音,对目标语音进行相应处理。本申请通过在获取到语音音频时,结合环境地图确定出与当前用户进行交互的目标对象,再确定目标对象的音源位置,以此对音源位置的语音进行追踪,并对追踪到的目标语音进行相应的处理。以此准确为交互对象的语音设置相应特效,使用户能够简单分辨出对方的语音,使其能够在信噪比较低的嘈杂环境中,精确识别想要交互的目标对象的音频内容,提升用户体验,提升设备与环境的融合度。提升设备与环境的融合度。提升设备与环境的融合度。

【技术实现步骤摘要】
声音处理方法、装置、设备、存储介质及程序产品


[0001]本申请涉及计算机
,尤其涉及一种声音处理方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]目前,扩展现实(XR)技术已经逐步走进人们的生活及各种相关
,相应的增强现实(AR)、虚拟现实(VR)装置通过封闭人的视觉,构建虚拟立体视觉环境,让人们达到参与到环境中,达到身临其境的体验感觉。
[0003]但是,在相关的一些扩展现实(XR)技术中,用户在使用设备与他人进行交流时,相关设备一般会直接将周围环境的声音直接转播给用户,而若周围环境较为嘈杂则会导致声音被遗漏或难以被听清,严重影响用户体验。

技术实现思路

[0004]有鉴于此,本申请提出一种声音处理方法、装置、设备、存储介质及程序产品,以此准确为目标对象的语音进行相应处理,使用户能够简单分辨出对方的语音,提升用户体验,提升设备与环境的融合度。
[0005]基于上述目的,本申请提供了一种声音处理方法,包括:
[0006]获取用户周围的环境地图;
[0007]响应于获取到语本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声音处理方法,其特征在于,包括:获取用户周围的环境地图;响应于获取到语音音频数据,确定用户的目标对象;基于所述环境地图确定所述目标对象的音源位置,追踪所述音源位置的目标语音,对所述目标语音进行相应处理。2.根据权利要求1所述的方法,其特征在于,所述确定用户的目标对象,包括:根据通过图像捕捉所确定的所述用户的视觉关注点和/或根据所述用户与其他控制器模块的交互,确定所述目标对象。3.根据权利要求2所述的方法,其特征在于,所述通过图像捕捉所确定的所述用户的视觉关注点,包括:利用多模态组件对所述用户的面部朝向图像和/或眼动图像进行捕捉,根据所述面部朝向图像和/或所述眼动图像计算所述视觉关注点。4.根据权利要求3所述的方法,其特征在于,所述多模态组件,至少包括:面向追踪单元和/或眼动追踪单元。5.根据权利要求2所述的方法,其特征在于,所述获取用户周围的环境地图,包括:通过预设的激光雷达对所述用户周围进行激光扫描,根据扫描结果生成点云图像,根据所述点云图像生成所述用户的环境地图。6.根据权利要求5所述的方法,其特征在于,所述确定所述目标对象,包括:将所述视觉关注点投影至所述点云图像,以确定所述视觉关注点在所述点云图像中对应的虚拟点位,根据所述环境地图与所述虚拟点位之间的关系确定所述目标对象。7.根据权利要求1所述的方法,其特征在于,所述语音音频数据通过收声阵列获取,所述收声阵列包括至少一个收声单元;所述基于所述环境地图确定所述目标对象的音源位置,包括:通过所述收声阵列中不同所述收声单元接收所述语音音频数据的参数差异,计算所述语音音频数据的对应音源的音源位置;根据所述对应音源的音源位置及所述目标对象在所述环境地图中的位置,在所述环境地图中确定所述目标对象的音源位置。8.根据权利要求7所述的方法,其特征在于,所述追踪所述音源位置的目标语音,包括:根据所述目标对象的发声频率确定所述目标语音;或根据所述目标对象的音源位置确定的...

【专利技术属性】
技术研发人员:程林方迟
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1