一种数据标注方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32435620 阅读:30 留言:0更新日期:2022-02-24 19:09
本申请实施例提供一种数据标注方法、装置、电子设备及存储介质,其中,该方法包括:获取文本数据;对文本数据进行标注,得到标注数据;根据正则式规则对标注数据进行处理,得到误标注结果;对误标注结果进行修复,得到修复标注结果。实施本申请实施例,可以有效提高数据标注效率,减少人力物力。减少人力物力。减少人力物力。

【技术实现步骤摘要】
一种数据标注方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能数据处理
,具体而言,涉及一种数据标注方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]目前,有监督的深度学习是人工智能领域普遍采用的机器学习方法,而采用深度学习的模型则需要大量准确、高质量的训练数据进行训练。其中,训练数据的数量、训练数据的质量对深度学习模型的训练起到了关键性作用。
[0003]训练数据是指用于训练模型的带有标注的数据,目前,数据的标注主要包括人工标注和使用工具进行标注,然而,人工进行数据标注是一个单调、枯燥的密集型重复劳动,要想获得大量的训练数据,需要耗费大量的人力进行数据标注,付出较高的人工成本,而使用工具标注的方法误标率很高,标注准确率低。

技术实现思路

[0004]本申请实施例的目的在于提供一种数据标注方法、装置、电子设备及计算机可读存储介质,不需要耗费大量人力物力即可完成标注,且标注的准确率和效率得到有效提升。
[0005]第一方面,本申请实施例提供了一种数据标注方法,所述方法包括:
...

【技术保护点】

【技术特征摘要】
1.一种数据标注方法,其特征在于,所述方法包括:获取文本数据;对所述文本数据进行标注,得到标注数据;根据正则式规则对所述标注数据进行处理,得到误标注结果;对所述误标注结果进行修复,得到修复标注结果。2.根据权利要求1所述的数据标注方法,其特征在于,所述根据正则式规则对所述标注数据进行处理,得到误标注结果的步骤,包括:对所述标注数据进行清洗处理,得到有效标注数据;根据正则式规则对所述有效数据进行解析,得到所述误标注结果。3.根据权利要求2所述的数据标注方法,其特征在于,所述根据正则式规则对所述有效数据进行解析,得到所述误标注结果的步骤,包括:获取所述正则式规则中的规则列表;根据所述规则列表对所述有效标注数据进行遍历,标注所述有效标注数据中的误标数据和漏标数据,得到所述误标注结果。4.根据权利要求1所述的数据标注方法,其特征在于,所述获取文本数据的步骤,包括:获取语音数据;将所述语音数据转换为文本数据。5.一种数据标注装置,其特征在于,所述装置包括:获取模块,用于获取文本数据;标注模块,用于对所述文本数据进行标注,得到标注数据;处...

【专利技术属性】
技术研发人员:郑志敏王建辉吕超杜新凯
申请(专利权)人:阳光保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1