下载唇动增强的单声道和多声道声源分离的技术资料

文档序号:29201999

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

提供了用于实现源分离技术的方法和系统,并且更具体地,对通过从捕获的图像数据输入唇动信息而增强的混合源单声道和多声道音频信号执行源分离,包括从关注时段内捕获的多个面部图像的中选择目标说话者面部图像;基于目标说话者面部图像的面部特征计算运动矢量...
该专利属于阿里巴巴集团控股有限公司所有,仅供学习研究参考,未经过阿里巴巴集团控股有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。