【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种数据标注方法、装置、设备、存储介质及程序产品。
技术介绍
1、数据标注是人工智能和机器学习领域中的一个重要环节,它涉及对数据进行解释、标记或注释,以便机器学习算法能够理解和使用这些数据。随着人工智能和机器学习技术的快速发展,数据标注在各个领域的应用越来越广泛。无论是自动驾驶、医疗诊断、智能客服还是社交媒体,都需要经过大量标注的数据来训练和优化算法模型,数据标注的准确性对于机器学习模型的性能至关重要。此外,随着算法模型的复杂度和应用场景的多样化,数据标注的需求也在不断增加,导致了数据标注成本和人工成本的不断上升。因此,如何提高数据标注的效率和质量,成为当前数据标注行业需要解决的问题。
2、相关技术中,标注数据缺乏多样性,标注数据与项目的需求数据之间的匹配度不高,数据标注的准确率低下。
技术实现思路
1、本申请实施例提供一种数据标注方法、装置、设备、存储介质及程序产品,能够提高数据标注的准确率。
2、本申请实施例的技术方案是这样实现的:
...【技术保护点】
1.一种数据标注方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述对原始数据集的数据进行标注,得到标注后的数据之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述基于第一目标数据比例从所述候选文本数据中进行数据提取,得到第一数据集,包括:
4.根据权利要求1所述的方法,其特征在于,所述对所述标注后的数据的特征进行提取,通过第一语言处理模型实现;
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一语言特征,从所述标注后的数据中提取目标数据,包括:
6.根
...【技术特征摘要】
1.一种数据标注方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述对原始数据集的数据进行标注,得到标注后的数据之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述基于第一目标数据比例从所述候选文本数据中进行数据提取,得到第一数据集,包括:
4.根据权利要求1所述的方法,其特征在于,所述对所述标注后的数据的特征进行提取,通过第一语言处理模型实现;
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一语言特征,从所述标注后的数据中提取目标数据,包括:
6.根据权利要求5所述的方法,其特征在于,所述分类处理通过第二语言处理模型实现,在所述根据所述第一语言特征,从所述标注后的数据中提取目标数据之前,所述方法还包括:
7.根据权利要求1至6任一项所述的方法,其特征在于,所述基于所述语言类型对每个所述目标数据再次进行标注处理,得到再次标注后的每个...
【专利技术属性】
技术研发人员:白安琪,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。