学习装置、推定装置、学习方法、推定方法、程序产品及存储介质制造方法及图纸

技术编号:46625196 阅读:0 留言:0更新日期:2025-10-14 21:21
本发明专利技术提供学习装置、推定装置、学习方法、推定方法、程序产品及存储介质。进行机器学习的学习装置具备:获取部,其获取包括输入数据与正解数据的训练数据,且输入数据包括包含参照物体的输入图像、及参照参照物体而相对地指定目标位置的输入文本;生成部,其将输入数据输入至模型,由此生成用于确定目标位置的输出数据;以及更新部,其更新模型的参数,以使通过将输出数据与正解数据输入至损失函数而得到的损失降低。模型包括:第一子模型,其基于输入图像与输入文本而生成表示参照物体的多个特征量,且所述多个特征量具有相互不同的分辨率;以及第二子模型,其基于多个特征量与输入文本而生成输出数据。对第二子模型输入每一个多个特征量。

【技术实现步骤摘要】

本专利技术涉及学习装置、推定装置、学习方法、推定方法、程序产品及存储介质


技术介绍

1、提出了使用由机器学习生成的模型而进行车辆的行驶控制的各种各样的技术。专利文献1记载了使用由车辆获取到的传感器数据而学习神经网络的情况。另外,也提出了使用将图像与语言输入的多模态模型而推定由语言指示的图像内的位置的技术。作为多模态模型,提出了fiber(fusion-in-the-backbone-based transformer,基于骨干网络融合的转换器)(非专利文献1)、clip(contrastive language-image pre-training,对比语言-图像预训练)(非专利文献2)、pwan(pixel-word attention module,像素-词语注意模块)(非专利文献3)等。

2、现有技术文献

3、专利文献

4、专利文献1:日本特表2022-513866号公报

5、非专利文献

6、非专利文献1:zi-yi dou,et al.,“coarse-to-fine vision-la本文档来自技高网...

【技术保护点】

1.一种学习装置,其进行机器学习,其中,

2.根据权利要求1所述的学习装置,其中,

3.根据权利要求1所述的学习装置,其中,

4.根据权利要求3所述的学习装置,其中,

5.根据权利要求1所述的学习装置,其中,

6.根据权利要求1所述的学习装置,其中,

7.根据权利要求1所述的学习装置,其中,

8.根据权利要求1所述的学习装置,其中,

9.一种程序产品,其中,

10.一种存储介质,其中,

11.一种推定装置,其推定目标位置,其中,

12.一种程序产品,其中,<...

【技术特征摘要】

1.一种学习装置,其进行机器学习,其中,

2.根据权利要求1所述的学习装置,其中,

3.根据权利要求1所述的学习装置,其中,

4.根据权利要求3所述的学习装置,其中,

5.根据权利要求1所述的学习装置,其中,

6.根据权利要求1所述的学习装置,其中,

7.根据权利要求1所述的学习装置,其中,

...

【专利技术属性】
技术研发人员:细见直希杉浦孔明
申请(专利权)人:本田技研工业株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1