一种基于规则、模型及人工组合的数据打标签方法技术

技术编号：40318693 阅读：18 留言：0更新日期：2024-02-07 21:01

本发明专利技术公开了一种基于规则、模型及人工组合的数据打标签方法，涉及数据加工技术领域。本发明专利技术方法包括：获取打标签数据、基于规则预打标签、模型打标签、人工修正打标签、迭代打标标签；提高了处理速度和标记准确性；人工修正加模型迭代调整训练，逐步提高模型的打标准确率；减少人工标注工作：基于规则和模型的打标极大减少了人工标注的工作量；提高准确性：利用规则、自然语言处理模型及人工标注，减少了标记错误，提高了数据准确性；可持续性：通过模型迭代训练，系统能够不断学习并改进自身的打标能力，使其在时间推移中变得越来越准确。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于数据加工，特别是涉及一种基于规则、模型及人工组合的数据打标签方法。

技术介绍

1、在当前信息化社会，警务、执法机构和相关安全部门需要有效地处理大量的警情文本以维护公共安全，这些警情文本包括报警电话号码、警务日志、调查报告等，它们通常都包含关键信息，如事件类型、时间、地点以及内容表述等。

2、传统的警情文本标记通常依赖于警务人员进行手动打标签，这需要大量的人工工作，耗时且容易产生误差。同时随着自然语言处理和机器学习技术的不断发展，自动化文本标记逐渐得到应用，但它们受到模型训练数据的质量和模型复杂性的限制。传统的警情文本标记依赖于人工输入关键信息和标签，这需要大量的人力和时间，并容易受到主观判断和误差的影响，尤其是处理大量文本文档时，该问题尤为显著；现有模型准确性受限，现有自然语言处理模型在处理特定领域的文本时，往往面临准确性和泛化能力的限制，这些模型需要大量的标记数据来进行训练，而且在领域知识有限的情况下，可能会出现标记错误，现有标记方法通常缺乏标准化的标签体系，这使得文本标记的一致性和可比性成为挑战，不同人员和...

【技术保护点】

1.一种基于规则、模型及人工组合的数据打标签方法，用于加速和改善数据打标签的过程，其特征在于，包括如下步骤：

【技术特征摘要】

1.一种基于规则、模型及人工组合的数据打标签方法，用于...

【专利技术属性】
技术研发人员：王明光，李飞，那正平，蒋维，徐佳申，钟浩，高友光，刘红志，
申请(专利权)人：道枢上海数字技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人