企业实际办公地址的识别方法、装置及电子设备制造方法及图纸

技术编号:31093574 阅读:15 留言:0更新日期:2021-12-01 13:00
本发明专利技术实施例涉及一种企业实际办公地址的识别方法、装置及电子设备,通过获取企业员工的报点数据和商品订单中的地址数据,并对所述报点数据和地址数据进行预处理;对预处理后的报点数据和地址数据进行聚类处理,获得企业实际办公地址的候选集;提取所述候选集的特征信息,并将所述特征信息输入到多层感知机的分类模型中,识别出企业的实际办公地址;即本发明专利技术的实施例,通过对获取的报点数据和商品订单中的地址数据这种多源数据进行聚类处理,获取员工的活动地点,并将其作为企业实际办公地址的候选集,再通过分类模型识别出企业的实际办公地址,实现了高效、准确的识别出企业的实际办公地址。办公地址。办公地址。

【技术实现步骤摘要】
企业实际办公地址的识别方法、装置及电子设备


[0001]本专利技术涉及数据处理领域,尤其涉及一种企业实际办公地址的识别方法、装置及电子设备。

技术介绍

[0002]现实中存在许多企业的实际办公地址和注册地址不一致的情况,导致国家市场监管部门无法对企业进行有效监督和检查。
[0003]现有技术中,检查企业实际办公地址和注册地址是否一致主要依靠市场监管部门人工抽查或者群众主动举报的方式,但这种方式依赖人力,效率低下。此外,还可以通过解析用户的收货地址信息去识别企业的实际办公地址,但数据源单一,识别效果不佳。

技术实现思路

[0004]本专利技术提供了一种企业实际办公地址的识别方法、装置及电子设备,以解决现有技术中识别企业的实际办公地址效果不佳的技术问题。
[0005]第一方面,本专利技术提供了一种企业实际办公地址的识别方法,包括:获取企业员工的报点数据和商品订单中的地址数据,并对所述报点数据和地址数据进行预处理;对预处理后的报点数据和地址数据进行聚类处理,获得企业实际办公地址的候选集;提取所述候选集的特征信息,并将所述特征信息输入到多层感知机的分类模型中,识别出企业的实际办公地址。
[0006]作为可选的实施例,所述对所述报点数据和地址数据进行预处理,包括:对所述报点数据进行以下至少一种预处理:数据去重、驻留点提取以及按照预设时间或空间范围进行数据过滤;或者,对所述地址数据进行数据去重的预处理。
[0007]作为可选的实施例,所述对预处理后的报点数据和地址数据进行聚类处理,获得企业实际办公地址的候选集,包括:通过具有噪声的基于密度的聚类DBSCAN算法对预处理后的报点数据和地址数据进行聚类处理,获得至少一个簇,所述至少一个簇的质心构成所述企业实际办公地址的候选集。
[0008]作为可选的实施例,所述提取所述候选集的特征信息,包括:提取每个簇的特征信息;其中,所述特征信息包括以下至少一种:簇内的企业员工特征信息、簇内的商品订单信息以及簇所处的外部空间环境信息。
[0009]作为可选的实施例,所述簇内的企业员工特征信息包括企业员工数量和报点数量;所述簇内的商品订单信息包括商品订单数量以及商品订单类型分布信息;所述簇所处的外部空间环境信息包括企业类型、兴趣点POI以及路网特征信息。
[0010]作为可选的实施例,所述将所述特征信息输入到多层感知机的分类模型中,识别出企业的实际办公地址,包括:将每个簇的特征信息分别输入到二分类函数中,识别对应的簇的质心是否为所述企业的实际办公地址。
[0011]作为可选的实施例,所述将所述特征信息输入到多层感知机的分类模型中,识别
出企业的实际办公地址,包括:将所有簇的特征信息构成特征矩阵,将所述特征矩阵输入到基于多层神经网络激活函数的全连接层,并通过归一化指数函数识别出企业的实际办公地址。
[0012]第二方面,本专利技术提供一种企业实际办公地址的识别装置,包括:数据预处理模块,用于获取企业员工的报点数据和商品订单中的地址数据,并对所述报点数据和地址数据进行预处理;候选集生成模块,用于对预处理后的报点数据和地址数据进行聚类处理,获得企业实际办公地址的候选集;地址识别模块,用于提取所述候选集的特征信息,并将所述特征信息输入到多层感知机的分类模型中,识别出企业的实际办公地址。
[0013]第三方面,本专利技术提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现第一方面任一项所述的企业实际办公地址的识别方法的步骤。
[0014]第四方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述的企业实际办公地址的识别方法的步骤。
[0015]本专利技术实施例提供的企业实际办公地址的识别方法、装置及电子设备,通过获取企业员工的报点数据和商品订单中的地址数据,并对所述报点数据和地址数据进行预处理;对预处理后的报点数据和地址数据进行聚类处理,获得企业实际办公地址的候选集;提取所述候选集的特征信息,并将所述特征信息输入到多层感知机的分类模型中,识别出企业的实际办公地址;即本专利技术的实施例,通过对获取的报点数据和商品订单中的地址数据这种多源数据进行聚类处理,获取员工的活动地点,并将其作为企业实际办公地址的候选集,再通过分类模型识别出企业的实际办公地址,实现了高效、准确的识别出企业的实际办公地址。
附图说明
[0016]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0018]图1为本专利技术实施例提供的一种企业实际办公地址的识别方法的流程示意图;
[0019]图2为本专利技术实施例提供的另一种企业实际办公地址的识别方法的流程示意图;
[0020]图3为本专利技术实施例提供的再一种企业实际办公地址的识别方法的流程示意图;
[0021]图4为本专利技术实施例提高的再一种企业实际办公地址的识别方法的流程示意图;
[0022]图5为本专利技术实施例提供的一种企业实际办公地址的识别装置;
[0023]图6为本专利技术实施例提供的一种电子设备的结构示意图。
具体实施方式
[0024]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例
中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]企业的蓬勃发展,离不开国家市场监管部门的监管,各项监管的基础是了解企业实际办公地址,市场监管部门只有获取企业实际办公地址,才能到现场对企业安全、质量等方面进行监督和检查。当企业的实际办公地址与注册地址不一致时,企业需要及时申请变更登记。
[0026]然而现实中,存在很多企业没能及时变更登记办公地址的现象,而检查企业实际办公地址和注册地址是否一致主要依赖于市场监管部门的人工抽查或群众主动举报的方式,这种方式依赖人力,效率低下。此外,还通过自然语言处理的方式解析收货地址,判断收货地址与企业名称的相似性,以此寻找企业真实的办公地址,但这种方式对收货地址数据有强假设性,即强依赖于员工填写的收货地址中包含企业名称,而现实中填写详细地址且包含企业名称的收货地址比例较小,用此方法只能探索部分企业的真实办公地址,存在偏差性;这种方式依赖单一数据源,仅通过挖掘收货地址信息来判断企业的真实地址,对多源数据的挖掘不够完善,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种企业实际办公地址的识别方法,其特征在于,包括:获取企业员工的报点数据和商品订单中的地址数据,并对所述报点数据和地址数据进行预处理;对预处理后的报点数据和地址数据进行聚类处理,获得企业实际办公地址的候选集;提取所述候选集的特征信息,并将所述特征信息输入到多层感知机的分类模型中,识别出企业的实际办公地址。2.根据权利要求1所述的方法,其特征在于,所述对所述报点数据和地址数据进行预处理,包括:对所述报点数据进行以下至少一种预处理:数据去重、驻留点提取以及按照预设时间或空间范围的数据过滤;或者,对所述地址数据进行数据去重的预处理。3.根据权利要求1或2所述的方法,其特征在于,所述对预处理后的报点数据和地址数据进行聚类处理,获得企业实际办公地址的候选集,包括:通过具有噪声的基于密度的聚类DBSCAN算法对预处理后的报点数据和地址数据进行聚类处理,获得至少一个簇,所述至少一个簇的质心构成所述企业实际办公地址的候选集。4.根据权利要求3所述的方法,其特征在于,所述提取所述候选集的特征信息,包括:提取每个簇的特征信息;其中,所述特征信息包括以下至少一种:簇内的企业员工特征信息、簇内的商品订单信息以及簇所处的外部空间环境信息。5.根据权利要求4所述的方法,其特征在于,所述簇内的企业员工特征信息包括企业员工数量和报点数量;所述簇内的商品订单信息包括商品订单数量以及商品订单类型分布信息;所述簇所处的外部空间环境信息包括企业类型、兴趣点POI以及路网特征信息。6.根据权利要求4所述的方法,其特征在...

【专利技术属性】
技术研发人员:任慧敏王涵鲍捷李瑞远谭楚婧
申请(专利权)人:京东城市北京数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1