基于视觉大语言模型的动物行为多模态智能标注系统及方法技术方案

技术编号:46323715 阅读:8 留言:0更新日期:2025-09-09 19:05
本发明专利技术公开了一种基于视觉大语言模型的动物行为多模态智能标注系统及方法,包括:输入待处理的影像数据;基于视觉识别算法进行处理,为每个动物构建身份标签与对应的形态数据;对动物的形态数据进行量化分析,获得描述动物行为的目标行为量化指标数据输入到行为推理器中,并结合行为指标初始推理权重和行为定义与推理指令集,获得第一行为时序列表;将案例库中动物行为的图像及行为标签输入到多模态行为识别器中,获得第二行为时序列表;将上述行为时序列表结合进行打分,获得存疑片段并修正;当修正后的行为时序列表满足预设阈值,完成标注。本发明专利技术提升了动物行为标注的自动化水平,并通过融合多模态数据提高了行为识别的准确性和鲁棒性。

【技术实现步骤摘要】

本专利技术属于智慧养殖与畜牧科学,尤其涉及一种基于视觉大语言模型的动物行为多模态智能标注系统及方法


技术介绍

1、动物行为的精准识别与标注是畜牧业智能化、数字化发展的关键环节,尤其在动物福利监测、健康管理及精准饲养等领域具有重要应用价值。传统的行为标注主要依赖人工观察与手工注释,不仅效率低、主观性强,且难以满足大规模数据处理需求。近年来,随着计算机视觉与深度学习技术的广泛应用,自动化行为分析(automated behavioranalysis,aba)系统逐步应用于动物行为识别场景,取得初步成效。然而,这些系统往往局限于单一模态(如静态图像或单通道视频),无法充分融合多模态信息(如视觉、语音、时间序列等),难以准确理解行为发生的上下文语境。同时,由于缺乏标准化标注体系与开放共享的数据集,现有模型普遍面临训练数据不足、迁移能力差、语义表达能力有限等问题。

2、近期,多模态大语言模型(multimodal large language models,mllms),尤其是具备图像与视频理解能力的视觉大语言模型(visual-language mo本文档来自技高网...

【技术保护点】

1.一种基于视觉大语言模型的动物行为多模态智能标注系统,其特征在于,包括依次连接的文件读写模块、本地程序执行模块、在线服务调用模块和人机交互执行模块;

2.根据权利要求1所述的系统,其特征在于:

3.根据权利要求1所述的系统,其特征在于:

4.根据权利要求1所述的系统,其特征在于:

5.根据权利要求1所述的基于视觉大语言模型的动物行为多模态智能标注系统,其特征在于:

6.一种基于视觉大语言模型的动物行为多模态智能标注方法,其特征在于,基于权利要求1-5任意一项所述的系统,包括以下步骤:

7.根据权利要求6所述的方法,...

【技术特征摘要】

1.一种基于视觉大语言模型的动物行为多模态智能标注系统,其特征在于,包括依次连接的文件读写模块、本地程序执行模块、在线服务调用模块和人机交互执行模块;

2.根据权利要求1所述的系统,其特征在于:

3.根据权利要求1所述的系统,其特征在于:

4.根据权利要求1所述的系统,其特征在于:

5.根据权利要求1所述的基于视觉大语言模型的动物行为多模...

【专利技术属性】
技术研发人员:周梦婷唐湘方李建功熊本海丁元立
申请(专利权)人:中国农业科学院北京畜牧兽医研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1