【技术实现步骤摘要】
本专利技术涉及自然语言处理,特别是涉及一种基于政务行业大模型的命名实体识别方法及相关设备。
技术介绍
1、随着信息技术的发展,在政务领域中,逐渐应用各类政务信息进行数据挖掘,以便于更好地进行政务管理和决策。在政务信息的数据挖掘过程中,命名实体识别是关键任务之一,命名实体识别的目标即为从相应的文本中识别出具有特定意义的实体,例如人名、地名等等。
2、目前,在政务信息的命名实体识别任务中,通常是基于规则或词典对政务信息进行命名实体识别,即通过人工编写规则或配置词典,利用规则或是词典,识别文本中的相应实体。
3、而在实际的应用场景中,政务行业的术语众多,政务信息中的文本常常会出现新的术语和描述方式。在现有的识别方式中,命名实体的识别依赖于规则的定义或词典中配置的信息,而规则和词典通常是固定的,需人为更新,难以实时覆盖新增的语言现象和新出现的实体,使得命名实体识别的适应性和准确性较差,不利于政务信息的数据挖掘。
技术实现思路
1、有鉴于此,本专利技术实施例提供了一种基于政务
...【技术保护点】
1.一种基于政务行业大模型的命名实体识别方法,其特征在于,包括:
2.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述基于预设的目标政务领域,对所述初始数据集进行数据筛选,获得所述目标政务领域对应的各个目标政务文本,包括:
3.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述对各个所述目标政务文本进行数据预处理,获得各个已处理政务文本,包括:
4.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述基于各个所述训练任务和各个所述已处理政务文本,构建样本数据集,
...
【技术特征摘要】
1.一种基于政务行业大模型的命名实体识别方法,其特征在于,包括:
2.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述基于预设的目标政务领域,对所述初始数据集进行数据筛选,获得所述目标政务领域对应的各个目标政务文本,包括:
3.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述对各个所述目标政务文本进行数据预处理,获得各个已处理政务文本,包括:
4.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述基于各个所述训练任务和各个所述已处理政务文本,构建样本数据集,包括:
5.根据权利要求1所述的基于政务行业大模型的命名实体识别方法,其特征在于,所述基于所述样本数据集,分别对每个所述初始模型进行训练,包括:
6.根...
【专利技术属性】
技术研发人员:马尚,李廷,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。