数据标注方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:43723487 阅读:22 留言:0更新日期:2024-12-20 12:51
本申请提供了一种数据标注方法、装置、设备、存储介质及程序产品;方法包括:对原始数据集的数据进行标注,得到标注后的数据;对标注后的数据的特征进行提取,得到标注后的数据对应的第一语言特征;根据第一语言特征,从标注后的数据中提取目标数据;根据目标数据的第一语言特征,确定每个目标数据的语言类型;基于语言类型对每个目标数据再次进行标注处理,得到再次标注后的每个目标数据。通过本申请,能够提高数据标注的准确率。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种数据标注方法、装置、设备、存储介质及程序产品


技术介绍

1、数据标注是人工智能和机器学习领域中的一个重要环节,它涉及对数据进行解释、标记或注释,以便机器学习算法能够理解和使用这些数据。随着人工智能和机器学习技术的快速发展,数据标注在各个领域的应用越来越广泛。无论是自动驾驶、医疗诊断、智能客服还是社交媒体,都需要经过大量标注的数据来训练和优化算法模型,数据标注的准确性对于机器学习模型的性能至关重要。此外,随着算法模型的复杂度和应用场景的多样化,数据标注的需求也在不断增加,导致了数据标注成本和人工成本的不断上升。因此,如何提高数据标注的效率和质量,成为当前数据标注行业需要解决的问题。

2、相关技术中,标注数据缺乏多样性,标注数据与项目的需求数据之间的匹配度不高,数据标注的准确率低下。


技术实现思路

1、本申请实施例提供一种数据标注方法、装置、设备、存储介质及程序产品,能够提高数据标注的准确率。

2、本申请实施例的技术方案是这样实现的:p>

3、本申请本文档来自技高网...

【技术保护点】

1.一种数据标注方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述对原始数据集的数据进行标注,得到标注后的数据之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于第一目标数据比例从所述候选文本数据中进行数据提取,得到第一数据集,包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述标注后的数据的特征进行提取,通过第一语言处理模型实现;

5.根据权利要求1所述的方法,其特征在于,所述根据所述第一语言特征,从所述标注后的数据中提取目标数据,包括:

6.根据权利要求5所述的方...

【技术特征摘要】

1.一种数据标注方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述对原始数据集的数据进行标注,得到标注后的数据之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于第一目标数据比例从所述候选文本数据中进行数据提取,得到第一数据集,包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述标注后的数据的特征进行提取,通过第一语言处理模型实现;

5.根据权利要求1所述的方法,其特征在于,所述根据所述第一语言特征,从所述标注后的数据中提取目标数据,包括:

6.根据权利要求5所述的方法,其特征在于,所述分类处理通过第二语言处理模型实现,在所述根据所述第一语言特征,从所述标注后的数据中提取目标数据之前,所述方法还包括:

7.根据权利要求1至6任一项所述的方法,其特征在于,所述基于所述语言类型对每个所述目标数据再次进行标注处理,得到再次标注后的每个...

【专利技术属性】
技术研发人员:白安琪
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1