【技术实现步骤摘要】
一种企业办公地址的识别方法及装置
本专利技术涉及企业地址识别领域,尤其涉及一种企业办公地址的识别方法及装置。
技术介绍
企业地址一般是指企业在相关部门注册的企业注册地址,该地址为登记在公司营业执照上的地址,同时也表明为企业真实的办公地址。通常情况下,企业为了达到宣传效果,会在互联网上发布公司的所在地信息,以便客户寻访和人员求职等。实际上,企业在办理企业地址变更、公司注册挂靠、集群注册的时候,企业地址可能由于流程原因未能及时登记变换,企业注册地址与实际的办公地址存在偏差,导致互联网上一个企业的地址往往能被搜索到两个或以上。并且,由于目前主要识别企业的实际办公地址的主要方法,是通过人工对企业官网地址、招聘地址或百度地图等地址的优先级进行客观评价后进行选择。此外,更复杂的情况下,也通过企业名称与对应候选地址联合并进行搜索引擎搜索,根据搜索结果的数量及时间,辅助判断对应候选地址是否进一步可能是办公地址,这导致了业务人员或者有企业调查需求的人员对企业进行寻访时候,无法准确定位寻访公司的地址,造成极大的不便。因此,为替代 ...
【技术保护点】
1.一种企业办公地址的识别方法,其特征在于,包括:/n根据待识别企业地址的关联数据,构建第一特征;其中,所述第一特征包括与所述待识别企业地址相关的文字信息以及数值信息;/n通过多个不同结构的预设分类算法模型,分别对所述第一特征进行特征提取,以输出多个第一分类概率结果;其中,各所述预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成;/n根据所述多个第一分类概率结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。/n
【技术特征摘要】 【专利技术属性】
1.一种企业办公地址的识别方法,其特征在于,包括:
根据待识别企业地址的关联数据,构建第一特征;其中,所述第一特征包括与所述待识别企业地址相关的文字信息以及数值信息;
通过多个不同结构的预设分类算法模型,分别对所述第一特征进行特征提取,以输出多个第一分类概率结果;其中,各所述预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成;
根据所述多个第一分类概率结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。
2.根据权利要求1所述的企业办公地址的识别方法,其特征在于,在所述根据待识别企业地址的关联数据,构建第一特征之后,还包括:
对所述第一特征的所述文字信息进行数值编码,以转换为数值特征。
3.根据权利要求1所述的企业办公地址的识别方法,其特征在于,所述各所述预设分类算法模型是根据已通过真实性检验的多个企业地址的关联数据训练而成,具体为:
根据已通过真实性检验的多个企业地址的关联数据,构建第一训练特征;其中,所述第一训练特征包括与所述待识别企业地址相关的文字信息以及数值信息;
对所述第一训练特征的所述文字信息进行数值编码,以转换为数值特征,并将经过转换处理后的所述第一训练特征构成训练集;
获取多个分类算法初始模型,并通过所述训练集,分别对所述多个分类算法初始模型进行训练,获得所述多个不同结构的预设分类算法模型。
4.根据权利要求1所述的企业办公地址的识别方法,其特征在于,所述根据所述多个第一分类概率结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址,具体为:
根据预设的权重,对所述多个第一分类概率进行加权平均计算,以输出第二分类概率结果;
根据所述第二分类概率结果与预设的阈值的比较结果,确定所述待识别企业地址是否为所述待识别企业在当前时刻下的办公地址。
5.根据权利要求1所述的企业办公地址的识别方法,其特征在于,所述多个不同结构的预设分类算法模型包括:在LightGBM模型、随机森林模型和SVM模型中的任意两种或多种组合。
技术研发人员:陈开冉,黎展,雷翔,
申请(专利权)人:广州探迹科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。