机器学习装置、机器学习方法以及推论装置制造方法及图纸

技术编号：38607332 阅读：25 留言：0更新日期：2023-08-26 23:38

提供一种机器学习装置、机器学习方法以及推论装置，能够高效地学习VQA任务的统计模型。机器学习装置包括处理电路。处理电路基于非VQA格式的样本，生成与VQA任务相关的VQA格式的学习样本。所述VQA格式的所述学习样本具有对象、与该对象相关的提问句以及针对该提问句的回答句的组合作为要素，所述非VQA格式的所述样本具有对象和与该对象相关联的标签的组合作为要素。处理电路基于所生成的所述VQA格式的所述学习样本训练所述VQA任务的统计模型。型。型。

全部详细技术资料下载

【技术实现步骤摘要】
机器学习装置、机器学习方法以及推论装置
[0001]相关申请的交叉引用
[0002]本申请基于并要求于2022年2月10日提交的日本专利申请No.2022
‑
019858的优先权，其全部内容通过引用并入本文。

[0003]这里描述的实施例总体上涉及机器学习装置、机器学习方法以及推论装置。

技术介绍

[0004]在机器学习的领域中，已知有输入图像和与该图像相关的文本形式的提问，输出针对该提问的文本形式的回答的任务。该任务被称为VQA(Visual Question Answering，视觉问答)。VQA任务的统计模型基于作为图像、提问以及回答的组合(元组：taple)而被提供的学习数据集进行训练。在图像和与该图像相关的提问的组合中考虑庞大的变化，因此在被称为VQAv2的VQA的学习数据集中，通过对几万个图像准备几十万个提问来确保变化。例如，当想要生成能够与固有的动植物、交通工具对应的统计模型时，需要准备与这些固有的对象物相关的图像和与这些图像相关的所有变化的提问和回答。如此，为了以多样的变化来准备由图像、提问以及回答的组合构成的学习数据集，需要庞大的成本。为了抑制成本，即使利用变化少的学习数据集训练统计模型，也无法生成精度良好的统计模型。期望能够以低成本生成高精度的统计模型的高效的学习。

技术实现思路

[0005]本专利技术要解决的课题是提供能够高效地学习VQA任务的统计模型的机器学习装置、机器学习方法以及推论装置。
附图说明
[0006]图1是表示本实...

【技术保护点】

【技术特征摘要】
1.一种机器学习装置，具备：转换部，基于非VQA即视觉问答格式的样本，生成与VQA任务相关的VQA格式的学习样本，所述VQA格式的所述学习样本具有对象、与该对象相关的提问句以及针对该提问句的回答句的组合作为要素，所述非VQA格式的所述样本具有对象和与该对象相关联的标签的组合作为要素；以及学习部，基于由所述转换部生成的所述VQA格式的所述学习样本训练所述VQA任务的统计模型。2.根据权利要求1所述的机器学习装置，其中，所述转换部基于所述标签生成所述提问句和所述回答句。3.根据权利要求2所述的机器学习装置，其中，所述样本是从用于与所述VQA任务不同的非VQA任务的学习样本得到的学习样本，作为所述标签，具有针对与所述非VQA任务相应的所述对象的正解标签，所述转换部基于所述正解标签生成所述提问句和所述回答句。4.根据权利要求3所述的机器学习装置，其中，所述非VQA任务是图像分类任务、物体检测任务、图像基础训练任务或者图像检索任务。5.根据权利要求1所述的机器学习装置，其中，所述学习部基于由所述转换部生成的所述学习样本和由所述获取部获取到的所述学习样本训练所述统计模型。6.根据权利要求1所述的机器学习装置，其中，所述样本作为所述标签具有针对所述对象的说明句，所述转换部基于所述说明句生成所述提问句和所述回答句。7.根据权利要求1所述的机器学习装置，其中，所述统计模型具有：将所述对象转换为第1特征量...

【专利技术属性】
技术研发人员：三岛直，Q，
申请(专利权)人：株式会社东芝，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人