下载一种基于多次模态融合的视听语音识别方法、装置、设备和存储介质的技术资料

文档序号:28875316

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种基于多次模态融合的视听语音识别方法、装置、设备和存储介质,本方法在视听语音识别子网络中所使用的Skip RNN相比普通的RNN改善了推理速度慢,梯度消失以及难以捕获长期依存关系等问题,采用的TCN可以解决视频帧提取特征不完善...
该专利属于西安交通大学所有,仅供学习研究参考,未经过西安交通大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。