穹界智能科技杭州有限公司专利技术

穹界智能科技杭州有限公司共有4项专利

  • 本发明公开了一种增强多图理解的多模态大模型结构,包括图片输入模块、图像特征提取模块、增强多图特征模块、特征映射模块、文本输入模块、分词模块、文本向量化模块、特征融合模块和大语言模型。增强多图特征模块通过挖掘关联图片相互间的关系,获取输入...
  • 本发明公开了一种用于视觉语言生成式异常分析的强化学习方法,包括:利用开源视觉语言模型构造训练数据与任务,涵盖基于图像的问题及规则生成、任务解释生成及拒绝采样;将强化学习算法引入模型训练,增强其在异常分析任务中的推理、解释及标注框生成能力...
  • 本发明公开了一种视觉语言模型目标检测能力增强方法,包括:首先,构建包含属性、交互、方位、否定和硬负样本等复杂语义标签的推理型目标检测数据集;其次,在GRPO强化学习框架下,通过特定提示词引导VLM先生成推理过程再输出检测结果。本发明采用...
  • 本发明公开了一种基于多模态大语言模型的目标检测系统及方法,利用 DETR 生成提议框作为对象候选,借助 MLLM 强大的语义推理能力,实现对长尾类别、组合对象等复杂目标的精准检测;构建主视觉编码器与辅助视觉编码器协同的双编码器架构,主视...
1