一种基于模型训练的数据自动标注的方法及系统技术方案

技术编号:45804925 阅读:23 留言:0更新日期:2025-07-11 20:20
本发明专利技术属于特定计算模型的技术领域,具体设计一种基于模型训练的数据自动标注的方法及系统;所述方法包括:采集目标内容信息;依据信息时效性和相关度进行筛选,获得第一筛选数据;对第一筛选数据进行校对,生成历史信息并反馈;提取差异特征作为待标注数据,并进行自动标注;依据历史出错率对标注结果进行校验与更新;计算偏离度并生成监控评估区间,将输出结果分类为已冻结或未冻结数据;所述系统包括采集、筛选、校对、标注及偏离度分析模块。该方案提升了标注效率与准确性,适用于多模态数据处理场景。

【技术实现步骤摘要】

本专利技术属于特定计算模型的,具体设计一种基于模型训练的数据自动标注的方法及系统


技术介绍

1、随着人工智能、机器学习及自然语言处理等技术的快速发展,训练高精度的智能模型对大规模、高质量的标注数据提出了更高的需求。尤其是在图像识别、语义理解、语音识别等数据驱动型任务中,标注数据的质量直接决定了模型的性能。然而,传统数据标注方式主要依赖人工完成,不仅成本高昂、效率低下,还容易因主观判断导致标注不一致,从而影响模型训练效果。

2、因此,亟需提出一种能够结合模型训练过程,自动生成标注信息,并能通过反馈机制不断优化标注质量与模型表现的数据自动标注方法及系统,从而降低人工依赖,提升标注效率与一致性,为智能模型提供高质量、可扩展的数据基础。


技术实现思路

1、针对上述问题,本专利技术的目的在于提出:一种基于模型训练的数据自动标注的方法,包括:

2、s1、目标内容信息采集:利用采集模型采集目标内容信息;其中,所述目标内容信息包括文字、图像和视频中的至少之一;

3、所述采集模型为rag大本文档来自技高网...

【技术保护点】

1.一种基于模型训练的数据自动标注的方法,其特征在于,包括:

2.根据权利要求1所述的一种基于模型训练的数据自动标注的方法,其特征在于:所述S1具体包括:

3.根据权利要求1所述的一种基于模型训练的数据自动标注的方法,其特征在于:所述S2具体包括:

4.根据权利要求1所述的一种基于模型训练的数据自动标注的方法,其特征在于:所述S3包括:

5.根据权利要求4所述的一种基于模型训练的数据自动标注的方法,其特征在于:所述历史信息包括:

6.根据权利要求1所述的一种基于模型训练的数据自动标注的方法,其特征在于:所述S5中的出错率更新过程...

【技术特征摘要】

1.一种基于模型训练的数据自动标注的方法,其特征在于,包括:

2.根据权利要求1所述的一种基于模型训练的数据自动标注的方法,其特征在于:所述s1具体包括:

3.根据权利要求1所述的一种基于模型训练的数据自动标注的方法,其特征在于:所述s2具体包括:

4.根据权利要求1所述的一种基于模型训练的数据自动标注的方法,其特征在于:所述s3包括:

5.根据权利要求4所述的一种基于模型训练的数据自动标注的方法,其特征在于:所述历史信息包括:

6.根据权利要求1所述的一种基于模型训练的数据自动标注的方法,其特征在于:所述s5...

【专利技术属性】
技术研发人员:孟川高胤天刘福旺滕方南高越赵振威
申请(专利权)人:杭州臻郅科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1