图像处理及视觉基座模型的训练方法和装置制造方法及图纸

技术编号：44203772 阅读：23 留言：0更新日期：2025-02-06 18:38

本公开提供了图像处理及视觉基座模型的训练方法和装置，涉及计算机视觉以及深度学习等人工智能领域。其中的图像处理方法可包括：获取目标图像，并对目标图像进行图像块切分，任意两个图像块之间均不存在重叠；分别获取各图像块对应的二维旋转位置编码，并根据各图像块及对应的二维旋转位置编码，利用视觉基座模型生成目标图像对应的图像处理结果。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能，特别涉及计算机视觉以及深度学习等领域的图像处理及视觉基座模型的训练方法和装置。

技术介绍

1、在实际应用中，图像的长度、宽度和长宽比例等为图像的重要信息，当被强行改变后，可能会导致图像的内容被扭曲，实际内容发生改变等。

技术实现思路

1、本公开提供了图像处理及视觉基座模型的训练方法和装置。

2、一种图像处理方法，包括：

3、获取目标图像，并对所述目标图像进行图像块切分，任意两个图像块之间均不存在重叠；

4、分别获取各图像块对应的二维旋转位置编码，并根据各图像块及对应的所述二维旋转位置编码，利用视觉基座模型生成所述目标图像对应的图像处理结果。

5、一种视觉基座模型的训练方法，包括：

6、获取训练样本，任一训练样本中分别包括：对训练图像进行切分后得到的各图像块以及各图像块分别对应的二维旋转位置编码；

7、利用所述训练样本对视觉基座模型进行训练，所述视觉基座模型用于根据对目标图像进行切分后得到的各图像块以...

【技术保护点】

1.一种图像处理方法，包括：

2.根据权利要求1所述的方法，其中，

3.根据权利要求1或2所述的方法，其中，所述分别获取各图像块对应的二维旋转位置编码包括：

4.根据权利要求3所述的方法，其中，所述确定所述目标图像对应的目标贝塔值包括：

5.根据权利要求4所述的方法，还包括：

6.根据权利要求5所述的方法，其中，所述根据所述训练贝塔值确定出所述目标贝塔值包括：

7.一种视觉基座模型的训练方法，包括：

8.根据权利要求7所述的方法，其中，

9.一种图像处理装置，包括：第一处理模块以及第二处理模块...

【技术特征摘要】

1.一种图像处理方法，包括：

2.根据权利要求1所述的方法，其中，

3.根据权利要求1或2所述的方法，其中，所述分别获取各图像块对应的二维旋转位置编码包括：

4.根据权利要求3所述的方法，其中，所述确定所述目标图像对应的目标贝塔值包括：

5.根据权利要求4所述的方法，还包括：

6.根据权利要求5所述的方法，其中，所述根据所述训练贝塔值确定出所述目标贝塔值包括：

7.一种视觉基座模型的训练方法，包括：

8.根据权利要求7所述的方法，其中，

9.一种图像处理装置，包括：第一处理模块以及第二处理模块；

10.根据权利要求9所述的装置，其中，

【专利技术属性】
技术研发人员：刘炜新，余欣彤，冯仕堃，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人