一种大模型图文对数据集构建方法及装置制造方法及图纸

技术编号:43939200 阅读:26 留言:0更新日期:2025-01-07 21:30
本申请公开了一种大模型图文对数据集构建方法及装置,其中,基于多个第二内镜检测图像确定多个检测图像组;计算检测图像组的第一相似度;基于两个第二内镜检测图像上的病灶分割区域确定检测图像组的第二相似度;基于检测图像组的第一相似度和检测图像组的第二相似度确定检测图像组的第三相似度,得到多个检测图像组的第三相似度;将第三相似度大于预设相似度的检测图像组中的至少一个第二内镜检测图像从多个第二内镜检测图像中删除,得到多个第三内镜检测图像;将一个第三内镜检测图像和对应的图像描述文本确定为大模型图文对数据,得到包含多个大模型图文对数据的大模型图文对数据集。本申请可以提高大模型图文对数据集的构建效率和数据质量。

【技术实现步骤摘要】

本申请涉及图像处理,具体涉及一种大模型图文对数据集构建方法及装置


技术介绍

1、目前传统的基于深度学习方法的检测技术存在可解释性差等诸多不足,亟需发展一种基于多模态大语言模型的辅助检测方法与系统,自动识别消化道检查图片是否异常,给出规范化的检查报告。而高质量的图文对数据集往往决定着多模态大语言模型的效果,传统的数据集构建方法考虑的因素较少,需要依靠人工标注,导致大模型图文对数据集的构建效率较低,数据质量参差不齐。


技术实现思路

1、本申请实施例提供一种大模型图文对数据集构建方法及装置,可以提高大模型图文对数据集的构建效率和数据质量。

2、第一方面,本申请提供的大模型图文对数据集构建方法,包括:

3、获取第一内镜检测图像和对应的图像描述文本;

4、基于多个第一内镜检测图像和对应的图像描述文本确定多个第二内镜检测图像和对应的图像描述文本;

5、基于多个所述第二内镜检测图像确定多个检测图像组,其中,所述检测图像组包括两个所述第二内镜检测图像;p>

6、计算所本文档来自技高网...

【技术保护点】

1.一种大模型图文对数据集构建方法,其特征在于,包括:

2.根据权利要求1所述的大模型图文对数据集构建方法,其特征在于,所述计算所述检测图像组中的两个所述第二内镜检测图像的第一相似度,得到所述检测图像组的第一相似度,包括:

3.根据权利要求2所述的大模型图文对数据集构建方法,其特征在于,所述基于两个所述第二内镜检测图像上的病灶分割区域确定两个所述第二内镜检测图像的第二相似度,得到所述检测图像组的第二相似度,包括:

4.根据权利要求3所述的大模型图文对数据集构建方法,其特征在于,所述基于多个第一内镜检测图像和对应的图像描述文本确定多个第二内镜检测图像和对...

【技术特征摘要】

1.一种大模型图文对数据集构建方法,其特征在于,包括:

2.根据权利要求1所述的大模型图文对数据集构建方法,其特征在于,所述计算所述检测图像组中的两个所述第二内镜检测图像的第一相似度,得到所述检测图像组的第一相似度,包括:

3.根据权利要求2所述的大模型图文对数据集构建方法,其特征在于,所述基于两个所述第二内镜检测图像上的病灶分割区域确定两个所述第二内镜检测图像的第二相似度,得到所述检测图像组的第二相似度,包括:

4.根据权利要求3所述的大模型图文对数据集构建方法,其特征在于,所述基于多个第一内镜检测图像和对应的图像描述文本确定多个第二内镜检测图像和对应的图像描述文本,包括:

5.根据权利要求4所述的大模型图文对数据集构建方法,其特征在于,所述基于多个第四内镜检测图像和对应的图像描述文本确定多个第二内镜检测图像和对应的图像描述文本,包括:

6.根据权利要求5所述...

【专利技术属性】
技术研发人员:熊廷顺胡孝
申请(专利权)人:武汉楚精灵医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1