【技术实现步骤摘要】
一种数据标注方法、装置、电子设备及存储介质
[0001]本申请涉及人工智能数据处理
,具体而言,涉及一种数据标注方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]目前,有监督的深度学习是人工智能领域普遍采用的机器学习方法,而采用深度学习的模型则需要大量准确、高质量的训练数据进行训练。其中,训练数据的数量、训练数据的质量对深度学习模型的训练起到了关键性作用。
[0003]训练数据是指用于训练模型的带有标注的数据,目前,数据的标注主要包括人工标注和使用工具进行标注,然而,人工进行数据标注是一个单调、枯燥的密集型重复劳动,要想获得大量的训练数据,需要耗费大量的人力进行数据标注,付出较高的人工成本,而使用工具标注的方法误标率很高,标注准确率低。
技术实现思路
[0004]本申请实施例的目的在于提供一种数据标注方法、装置、电子设备及计算机可读存储介质,不需要耗费大量人力物力即可完成标注,且标注的准确率和效率得到有效提升。
[0005]第一方面,本申请实施例提供了一种数据标注方法,所
【技术保护点】
【技术特征摘要】
1.一种数据标注方法,其特征在于,所述方法包括:获取文本数据;对所述文本数据进行标注,得到标注数据;根据正则式规则对所述标注数据进行处理,得到误标注结果;对所述误标注结果进行修复,得到修复标注结果。2.根据权利要求1所述的数据标注方法,其特征在于,所述根据正则式规则对所述标注数据进行处理,得到误标注结果的步骤,包括:对所述标注数据进行清洗处理,得到有效标注数据;根据正则式规则对所述有效数据进行解析,得到所述误标注结果。3.根据权利要求2所述的数据标注方法,其特征在于,所述根据正则式规则对所述有效数据进行解析,得到所述误标注结果的步骤,包括:获取所述正则式规则中的规则列表;根据所述规则列表对所述有效标注数据进行遍历,标注所述有效标注数据中的误标数据和漏标数据,得到所述误标注结果。4.根据权利要求1所述的数据标注方法,其特征在于,所述获取文本数据的步骤,包括:获取语音数据;将所述语音数据转换为文本数据。5.一种数据标注装置,其特征在于,所述装置包括:获取模块,用于获取文本数据;标注模块,用于对所述文本数据进行标注,得到标注数据;处...
【专利技术属性】
技术研发人员:郑志敏,王建辉,吕超,杜新凯,
申请(专利权)人:阳光保险集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。