下载视觉语音问答模型的训练方法、装置、交互方法及系统的技术资料

文档序号:40082171

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本申请实施例公开了一种视觉语音问答模型的训练方法、装置、交互方法及系统。其中,该训练方法包括:获取图像样本和所述图像样本的描述文本;将所述图像样本输入预先构建的语音视觉问答模型,得到预测文本;基于所述预测文本和所述描述文本,确定第一损失函数...
该专利属于支付宝(杭州)信息技术有限公司所有,仅供学习研究参考,未经过支付宝(杭州)信息技术有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。