地址信息分级处理方法、装置及设备制造方法及图纸

技术编号:28979826 阅读:20 留言:0更新日期:2021-06-23 09:26
本公开实施例提供一种地址信息分级处理方法、装置及设备,该方法包括:获取预设数量的地址信息,其中所述预设数量的地址信息组成训练集;对所述训练集中的每一条地址信息按照地址分级进行标签标注;根据所述训练集和标注后的地址信息,对初始的预训练模型进行训练,得到训练好的模型;将待分级的地址信息输入至所述训练好的模型中,以使所述训练好的模型输出分级后的地址信息。本公开实施例能够对地址信息进行智能分级处理,节约人工成本、提高分级处理效率。

【技术实现步骤摘要】
地址信息分级处理方法、装置及设备
本公开实施例涉及计算机
,尤其涉及一种地址信息分级处理方法、装置及设备。
技术介绍
为了提高企业的竞争力,拓展企业的业务,需要对企业的资源分布情况进行统一管理,尤其需要对不同的地域维度(如,省、市、区、县等等)的资源分布情况进行统计。目前没有标准的地址信息模板,采用人工录入和人工分级的方式,对地址信息进行分级,以便了解不同的地域维度的资源分布情况。但是,随着行政区划分方式的变化,地址信息的变更和维护就会有一定难度目前,现有技术中,主要是采用分词工具,根据地址信息中的关键字对地址信息进行分级。但是分词工具中处理依赖的关键字有限,需要人工进行维护和更新,导致分词工具进行地址信息分级,存在人工成本高、效率低的问题。
技术实现思路
本公开实施例提供一种地址信息分级处理方法、装置及设备,以克服现有技术中分词工具中处理依赖的关键字有限,需要人工进行维护和更新,导致分词工具进行地址信息分级,存在人工成本高、效率低的问题。第一方面,本公开实施例提供一种地址信息分级处理方法,包括:获取预设数量的地址信息,其中所述预设数量的地址信息组成训练集;对所述训练集中的每一条地址信息按照地址分级进行标签标注;根据所述训练集和标注后的地址信息,对初始的预训练模型进行训练,得到训练好的模型;将待分级的地址信息输入至所述训练好的模型中,以使所述训练好的模型输出分级后的地址信息。在一种可能的设计中,所述根据所述训练集和标注后的地址信息,对初始的预训练模型进行训练,得到训练好的模型,包括:Sa:将标注好的训练集中的任一条地址信息输入所述初始的预训练模型得到分级后的地址信息;Sb:根据所述标注后的地址信息和所述分级后的地址信息,对所述初始的预训练模型中进行反向传播,以调整所述初始的预训练模型的权重系数;Sc:重复步骤Sa和Sb,直至调整权重系数后的所述初始的预训练模型输出的分级后的地址信息与所述标注后的地址信息的误差,满足预设误差范围时,停止训练,得到所述训练好的模型。在一种可能的设计中,所述对所述训练集中的每一条地址信息按照地址分级进行标签标注,包括:获取所述训练集中每一条地址信息每一级地址文本,根据预定义的标签对所述地址文本中每个字符打上对应级别对应的标签。在一种可能的设计中,所述初始的预训练模型为增强语言表征模型ERNIE。在一种可能的设计中,所述将待分级的地址信息输入至所述训练好的模型中,以使所述训练好的模型输出分级后的地址信息之后,还包括:根据所述分级后的地址信息得到结构化的地址信息;根据所述结构化的地址信息,生成企业资源信息统计表,以方便用户统计企业资源信息。第二方面,本公开实施例提供一种地址信息分级处理装置,包括:获取模块,用于获取预设数量的地址信息,其中所述预设数量的地址信息组成训练集;标注模块,用于对所述训练集中的每一条地址信息按照地址分级进行标签标注;训练模块,用于根据所述训练集和标注后的地址信息,对初始的预训练模型进行训练,得到训练好的模型;处理模块,用于将待分级的地址信息输入至所述训练好的模型中,以使所述训练好的模型输出分级后的地址信息。在一种可能的设计中,所述装置,还包括:生成模块,用于根据所述分级后的地址信息得到结构化的地址信息;根据所述结构化的地址信息,生成企业资源信息统计表,以方便用户统计企业资源信息。第三方面,本公开实施例提供一种服务设备,包括:显示屏;至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的地址信息分级处理方法。第四方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的地址信息分级处理方法。第五方面,本公开实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如上第一方面以及第一方面各种可能的设计所述的地址信息分级处理方法。本公开实施例提供的地址信息分级处理方法、装置及设备,该方法,首先获取大量的地址信息以组成训练集,并对训练集的地址信息进行标签标注;然后基于该训练集和标签标注后的地址信息,对初始的预训练模型进行训练,得到训练好的模型;最后当需要对新的地址信息进行分级处理时,将待分级的地址信息输入至训练好的模型中,输出分级后的地址信息,能够对地址信息进行智能分级处理,节约人工成本、提高分级处理效率。附图说明为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本公开实施例提供的地址信息分级处理系统的架构示意图;图2为本公开实施例提供的地址信息分级处理方法的流程示意图一;图3为本公开实施例提供的地址信息分级处理方法的流程示意图二;图4为本公开实施例提供的地址信息分级处理装置的结构示意图;图5为本公开实施例提供的服务设备的硬件结构示意图。具体实施方式为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。目前,在企业中为了对企业资源分布进行管理,往往需要跟不同维度的地址信息中获取不同的维度的地址,以获取各级维度下的资源分布情况。通常,在现有技术中主要是采用分词工具,对地址信息进行分级。但是分词工具中处理依赖的关键字有限,需要人工进行维护和更新,导致分词工具进行地址信息分级,存在人工成本高、效率低的问题。为了解决上述技术问题,本公开实施例提供一种地址信息分级处理方法、装置及设备,获取大量的地址信息以组成训练集,并对训练集的地址信息进行标签标注;基于该训练集和标签标注后的地址信息,对初始的预训练模型进行训练,得到训练好的模型;当需要对新的地址信息进行分级处理时,将待分级的地址信息输入至训练好的模型中,输出分级后的地址信息,能够对地址信息进行智能分级处理,节约人工成本、提高分级处理效率。图1为本公开实施例提供的地址信息分级处理系统的架构示意图。如图1所示,本实施例提供的系统包括终端101和服务设备102。其中,终端101可以为手机、平板、个人电脑等。其中,终端101可以是任何形式的终端。该终端可以是可以是无线终端也可以本文档来自技高网...

【技术保护点】
1.一种地址信息分级处理方法,其特征在于,包括:/n获取预设数量的地址信息,其中所述预设数量的地址信息组成训练集;/n对所述训练集中的每一条地址信息按照地址分级进行标签标注;/n根据所述训练集和标注后的地址信息,对初始的预训练模型进行训练,得到训练好的模型;/n将待分级的地址信息输入至所述训练好的模型中,以使所述训练好的模型输出分级后的地址信息。/n

【技术特征摘要】
1.一种地址信息分级处理方法,其特征在于,包括:
获取预设数量的地址信息,其中所述预设数量的地址信息组成训练集;
对所述训练集中的每一条地址信息按照地址分级进行标签标注;
根据所述训练集和标注后的地址信息,对初始的预训练模型进行训练,得到训练好的模型;
将待分级的地址信息输入至所述训练好的模型中,以使所述训练好的模型输出分级后的地址信息。


2.根据权利要求1所述的方法,其特征在于,所述根据所述训练集和标注后的地址信息,对初始的预训练模型进行训练,得到训练好的模型,包括:
Sa:将标注好的训练集中的任一条地址信息输入所述初始的预训练模型得到分级后的地址信息;
Sb:根据所述标注后的地址信息和所述分级后的地址信息,对所述初始的预训练模型中进行反向传播,以调整所述初始的预训练模型的权重系数;
Sc:重复步骤Sa和Sb,直至调整权重系数后的所述初始的预训练模型输出的分级后的地址信息与所述标注后的地址信息的误差,满足预设误差范围时,停止训练,得到所述训练好的模型。


3.根据权利要求1所述的方法,其特征在于,所述对所述训练集中的每一条地址信息按照地址分级进行标签标注,包括:
获取所述训练集中每一条地址信息每一级地址文本,根据预定义的标签对所述地址文本中每个字符打上对应级别对应的标签。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述初始的预训练模型为增强语言表征模型ERNIE。


5.根据权利要求1至3任一项所述的方法,其特征在于,所述将待分级的地址信息输入至所述训练好的模型中,以使所述训练好的模型输出分级...

【专利技术属性】
技术研发人员:龚健周婉君刘贤松欧大春
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1