基于政务行业大模型的命名实体识别方法及相关设备技术

技术编号:44913661 阅读:34 留言:0更新日期:2025-04-08 18:56
本发明专利技术提供了一种基于政务行业大模型的命名实体识别方法及相关设备,该方法包括:在初始数据集中筛选目标政务领域的各个政务文本;对各个政务文本进行数据预处理;基于训练任务和经过预处理的政务文本,构建样本数据集;基于样本数据集对每个初始模型进行训练,得到各个候选模型;对每个候选模型进行性能评估,得到每个候选模型的性能评估结果;根据性能评估结果,选择性能最优的候选模型作为政务行业大模型;应用政务行业大模型对待识别的政务文本进行命名实体识别。应用本发明专利技术的方法,可通过基于目标政务领域的样本数据构建的模型进行命名实体识别,模型基于其学习能力亦可在未掌握的数据上完成命名实体识别,可提高命名实体识别的准确性。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,特别是涉及一种基于政务行业大模型的命名实体识别方法及相关设备


技术介绍

1、随着信息技术的发展,在政务领域中,逐渐应用各类政务信息进行数据挖掘,以便于更好地进行政务管理和决策。在政务信息的数据挖掘过程中,命名实体识别是关键任务之一,命名实体识别的目标即为从相应的文本中识别出具有特定意义的实体,例如人名、地名等等。

2、目前,在政务信息的命名实体识别任务中,通常是基于规则或词典对政务信息进行命名实体识别,即通过人工编写规则或配置词典,利用规则或是词典,识别文本中的相应实体。

3、而在实际的应用场景中,政务行业的术语众多,政务信息中的文本常常会出现新的术语和描述方式。在现有的识别方式中,命名实体的识别依赖于规则的定义或词典中配置的信息,而规则和词典通常是固定的,需人为更新,难以实时覆盖新增的语言现象和新出现的实体,使得命名实体识别的适应性和准确性较差,不利于政务信息的数据挖掘。


技术实现思路

1、有鉴于此,本专利技术实施例提供了一种基于政务行业大模型的命名实体本文档来自技高网...

【技术保护点】

1.一种基于政务行业大模型的命名实体识别方法,其特征在于,包括:

2.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述基于预设的目标政务领域,对所述初始数据集进行数据筛选,获得所述目标政务领域对应的各个目标政务文本,包括:

3.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述对各个所述目标政务文本进行数据预处理,获得各个已处理政务文本,包括:

4.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述基于各个所述训练任务和各个所述已处理政务文本,构建样本数据集,包括:

...

【技术特征摘要】

1.一种基于政务行业大模型的命名实体识别方法,其特征在于,包括:

2.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述基于预设的目标政务领域,对所述初始数据集进行数据筛选,获得所述目标政务领域对应的各个目标政务文本,包括:

3.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述对各个所述目标政务文本进行数据预处理,获得各个已处理政务文本,包括:

4.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述基于各个所述训练任务和各个所述已处理政务文本,构建样本数据集,包括:

5.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述基于所述样本数据集,分别对每个所述初始模型进行训练,包括:

6.根...

【专利技术属性】
技术研发人员:马尚李廷
申请(专利权)人:浪潮云信息技术股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1